人工智能用于诉讼和调查中的文件审查:无需阅读每一片干草,就能找到针头
法律案件意味着文件。成千上万份。有时数以百万计。
电子邮件。附件。PDF 文件。聊天记录。短信演示文稿电子表格带文本的照片合同会议记录
所有这些都需要审查。所有这些都需要分类。是否相关。是否有特权。是否响应。热门文件或噪音。
这就是电子发现。至关重要。令人头疼。而且价格昂贵。
人工智能改变了数学。它读取所有内容。它对一堆东西进行分类。它发现模式。它标记重要的内容。它总结线程。
您的审查员会专注于真正需要人工判断的文件。案件进展更快。成本保持在可控范围内。
文件审查问题
现代诉讼会产生大量文件。一个中等规模的案件:50,000 份文件。大型案件:数百万份。
每一份文件都需要被关注。它与案件相关吗?是否包含保密信息?是否符合披露要求?是否包含 "烟枪 "证据?
传统方法:
- 聘请合同律师团队
- 创建审查协议
- 培训审查员,使其了解应注意的事项
- 逐一审查文件
- 对每份文件进行编码(相关/不相关、保密/不保密等)
- 对样品进行质检,确保质量
- 重复数千小时
费用:$50-150 美元/小时/审查员。时间:数周或数月。质量取决于审稿人的疲劳程度和注意力。
错过重要信息?案件可能败诉。包含特权内容?你刚刚放弃了特权。
赌注很大。工作量巨大。期限紧迫。
人工智能对文件审查的作用
人工智能不会疲倦。它不会感到无聊。它能读懂每一份文件的每一个字,并应用一致的逻辑。
实际情况是这样的:
1.自动相关性分类
人工智能会阅读案件摘要和审查协议。然后再阅读每一份文件。
对于每份文档,它都会进行预测:
- 是否与案件有关
- 置信度(高、中、低)
- 涵盖的主要议题
- 为什么它可能具有相关性
并不完美。但 80-90% 在直接相关性调用方面非常准确。这就意味着,在人工审核员查看之前,就能有把握地对 80% 的文档进行排序。
审稿人将重点放在真正需要判断的 20% 上。或者对人工智能在高可信度文件上的工作进行质检。
2.专题分组
文件不是孤立存在的。它们是对话的一部分。项目的一部分。决策的一部分。
人工智能将相关文件归类在一起:
- 一个主题中的所有电子邮件
- 关于同一主题的所有文件
- 同一人之间的所有通信
- 同一时期关于同一事件的所有文件
审阅者根据上下文审阅文件。他们了解全局。他们能捕捉到按随机顺序逐一审阅文件时会遗漏的关联。
3.敏感内容检测
有些文件需要特别注意:
- 可能享有特权的通信(与律师之间的通信、法律建议)
- 个人数据(姓名、社会保障号、健康信息、财务数据)
- 机密商业信息
- 热点文件(不法行为或关键事实的证据)
- 合规红旗
人工智能会自动标记这些文件。有特权的文档会进入单独的审核轨道。个人数据会被注明以便编辑。热门文档会上报给高级审核员。
没有什么会因为初级审查员没有认识到其重要性而被漏掉。
4.智能排序
并非所有文件都同等重要。人工智能可帮助您按照正确的顺序进行审查:
- 高相关性信心第一
- 先从主要保管人处获取文件
- 首先是关键时期的文件
- 首先标记为潜在热点的文件
- 先处理有敏感内容的文件
你能尽早发现重要信息。更快、更好地了解案件。做出更好的战略决策。
5.电子邮件线程摘要
电子邮件线程会变得很长。20、50、100 条信息。大量的 "谢谢"、"见下文 "和转发。
人工智能会阅读整个线程并创建摘要:
- 谁参与其中
- 讨论内容
- 作出的重要决定或承诺
- 未决问题或行动项目
- 大事年表
审稿人只需 30 秒就能了解上下文,而不是 10 分钟。他们能做出更好的相关性判断。
6.概念搜索与技术辅助审查(TAR)
传统搜索:查找包含 "违约 "的文件。
问题:相关文件可能会说 "违反协议 "或 "未能履行义务"。
人工智能概念搜索:查找有关违反合同的文件,无论措辞是否准确。
它能理解含义,而不仅仅是关键词。它能找到传统搜索方法无法找到的文件。
TAR 更进一步:您可以查看一组种子文件。人工智能会了解您认为哪些是相关的。然后,它会预测剩余文档的相关性。持续的反馈会让它更加准确。
这对您意味着什么
决策者
发现成本下降 40-70%。
减少合同审查员的计费工时。更快的审查意味着更少的项目管理开销。更有针对性,意味着减少过量生产。
案件解决速度更快。
更早、更好地了解案件。更快找到关键证据。更快做出明智的和解决定。更快地对取证做出反应。
预算的可预测性。
人工智能的成本是固定的。您知道第一次审核的成本是多少。不会因审核员工时膨胀而出现意外。
更好的战略决策。
当您及早发现热点文件并更好地了解案件时,您就能在和解、动议实践和审判策略方面做出更明智的决定。
律师
注重高价值审查。
让人工智能来处理明显无关的文件。您只需专注于需要法律判断的文件。
更快地找到针
优先排序和聚类可帮助您尽早识别关键文件。您可以更快地建立案件。
更好的特权保护。
自动标记潜在特权文件。减少特权放弃风险。
合理的程序。
每个决定都有记录。每项预测都有记录。如果受到质疑,您可以为自己的审核流程辩护。
合规与调查
加快内部调查。
出现问题时,人工智能可帮助您快速查看相关通信。您可以更快地了解发生了什么。
更好的文档。
清晰记录审查内容、发现问题和做出的决定。从第一天起就为审计做好准备。
早期发行的斑点。
人工智能会在整个文档集中标记出潜在的合规性问题。您可以看到相关行为的模式。
真实案例:雇佣纠纷
一名员工以不当解雇和骚扰为由提起诉讼。证据包括 3 年的电子邮件、聊天记录和人力资源文件。共计 80,000 份文件。
没有人工智能
- 审查团队:5 名合同律师
- 审查时间:6 周
- 找到第一份热点文件:第 4 周
- 审查费用总额:$120,000
- 审查不必要的文件:大约 50,000 份明显无关的文件
有了人工智能
- 人工智能对文件进行预先分类(处理时间为 2 小时)
- 40,000 份文件被归类为明显不相关(高置信度)
- 25,000 份被标记为可能相关或不明确的文件
- 15,000 份文件被标记为潜在敏感文件(特权文件、热门文件)
- 热门文件优先排在审核队列的最前面
- 审查小组:2 名律师 + 2 名合同审查员
- 审查时间:2.5 周
- 找到第一份热点文件:第三天
- 总费用:$45,000 美元
- 更好地了解案件,更早地讨论解决方案
质量相同。60% 节约成本。更快的分辨率
人工智能不能做什么
让我们坦然面对局限性。
人工智能无法理解复杂的法律特权要求。
它标记出可能享有特权的文件。仍由律师来确定特权。
人工智能无法取代人类审稿人。
减少他们需要审查的数量。这有助于他们做出更好的决定。他们仍会进行审核并做出最终决定。
人工智能并不能完美地处理新情况。
标准纠纷(雇佣、合同、知识产权)?非常好。没有培训数据的前所未有的法律理论?帮助不大。
人工智能需要反馈来改进。
你对它的预测进行的审查和修正越多,它就越准确。它不是设定好了就可以忘记。
人工智能不会做出战略决策。
它告诉你文件的内容。你来决定这对案件意味着什么。
人工智能是一个强大的工具。但它不能取代经验丰富的诉讼律师。
如何开始
1.确定一个试点案例。
选择文件量大的案件(10,000 份以上文件),但不是最复杂的诉讼案件。标准争议类型效果最佳。
2.明确界定审查标准。
是什么让文件具有相关性?您在寻找什么?您的标准越明确,人工智能的表现就越好。
3.从播种开始。
手动审核 500-1000 份文件。对它们进行编码。人工智能会从您的决定中学习。
4.剩下的让人工智能来分类。
人工智能会根据所学知识预测剩余文档的相关性。
5.在人工智能协助下进行审查。
关注高优先级文件。对人工智能分类进行抽样检查。提供反馈。
6.完善和扩展。
人工智能会根据反馈进行改进。将学到的经验应用到下一个案例中。
常见问题
法院是否接受人工智能辅助审查?
是的。法院已多次批准 TAR 和 AI 辅助审查。现在这已成为复杂诉讼的标准做法。
特权审查如何?
人工智能可以标记潜在的保密文件,但律师必须做出最终的保密决定。大多数团队使用人工智能进行第一次标记。
它能处理不同的文件类型吗?
可以。电子邮件、PDF、Word 文档、Excel、带文本的图像(OCR)、聊天记录等。只要能提取文本,人工智能就能对其进行分析。
那么外语呢?
人工智能可处理多种语言。准确度因语言而异。英语、西班牙语、法语和德语效果最佳。
如何确保质量?
质量控制抽样。持续反馈。根据对照组进行验证。与传统审查中使用的质量保证方法相同。
数据安全性如何?
我们与您现有的电子发现平台配合使用,或在您的安全环境中部署。您的文件始终在您的掌控之中。
底线
文件审核不一定要耗费成本和时间。
人工智能处理第一道程序。它对这堆信息进行分类。它发现模式。它会标记出重要的内容。您的审阅人员则专注于需要人工判断的文档。
其结果是更快地解决案件,降低发现成本,做出更好的战略决策,以及让审查员从事真正需要专业知识的工作。
没有魔法。只有实用的自动化,让诉讼更有效率。
准备好降低发现成本了吗?
每个案例都不同。文件类型不同。不同的问题。不同的审查协议。
我们不销售一刀切的解决方案。我们研究您的具体案例和发现挑战。我们确定人工智能的最大价值所在。我们构建适合您流程的工作流程。
让我们来谈谈您在文档审核方面遇到的挑战,以及人工智能在哪些方面可以发挥真正的作用。