訴訟と調査における文書レビューのためのAI:ヘイのすべての断片を読まずに針を見つける
訴訟とは文書を意味する。数千枚。時には数百万。
電子メール添付ファイル。PDF。チャットログ。テキストメッセージ。プレゼンテーション。スプレッドシート。テキスト付き写真。契約書。会議メモ。
すべてに見直しが必要だ。すべて分類が必要だ。関連性があるかないか。特権があるかないか。応答性があるかないか。ホットな文書かノイズか。
これがeディスカバリーだ。不可欠である。気の遠くなるような作業だ。そして高い。
AIが計算を変える。すべてを読む。山を分類する。パターンを見つける。重要なものにフラグを立てる。スレッドを要約する。
レビュアーは、実際に人間の判断が必要な文書に集中します。案件は迅速に進みます。コストも管理しやすくなります。
文書審査問題
現代の訴訟では膨大な量の文書が作成される。中規模訴訟:50,000文書。大規模な訴訟では数百万。
すべての文書に目が必要だ。事件に関連したものか?特権情報は含まれているか?証拠開示請求に対応しているか?決定的証拠が含まれているか?
伝統的なアプローチ:
- 契約弁護士チームを雇う
- レビュー・プロトコルの作成
- 何を見るべきかについてレビュアーを訓練する
- ドキュメントをひとつひとつ見直す
- 各文書をコード化する(関連性がある/ない、特権がある/ないなど)。
- 品質を保証するためのサンプルのQC
- 何千時間も繰り返す
費用:レビュアー1人につき1時間あたり$50-150。時間:数週間から数ヶ月クオリティレビュアーの疲労度と注意力による
重要なことを見逃す?ケースは失われる可能性があります。秘匿特権を含む?特権を放棄したことになります。
賭け金は高い。量も多い。締め切りは厳しい。
AIが文書レビューにもたらすもの
AIは疲れない。飽きることもない。すべての文書のすべての単語を読み、一貫したロジックを適用する。
実際に起こっていることはこうだ:
1.自動関連性分類
AIはケースサマリーとレビュープロトコルを読む。その後、すべての文書を読む。
各文書について予測する:
- 本件との関連性の有無
- 信頼度(高、中、低)
- 主なトピック
- 関連性のある理由
完璧ではない。しかし、80-90%は単純な関連性判定では正確だ。つまり、80%の文書が、人間のレビュアーが見る前に、自信を持ってソートできるということだ。
レビュアーは、実際に判断が必要な20%に集中する。あるいは、信頼性の高い文書に対するAIの作業をQCする。
2.テーマ別クラスタリング
文書は単独で存在するものではない。それらは会話の一部である。プロジェクトの一部。意思決定の一部。
AIは関連文書をグループ化する:
- スレッド内のすべてのメール
- 同じトピックに関するすべての文書
- 同一人物間のすべてのコミュニケーション
- 同じ出来事に関する同じ時期のすべての文書
レビュアーは文書を文脈に沿って見る。彼らは全体像を理解する。ドキュメントを1つ1つ無作為にレビューしていたのでは見逃してしまうようなつながりを、レビュアーはキャッチする。
3.センシティブコンテンツの検出
特別な注意が必要な書類もある:
- 特権の可能性がある通信(弁護士との間、法的助言)
- 個人データ(氏名、SSN、健康情報、財務データ)
- 業務上の機密情報
- ホットドキュメント(不正行為の証拠または重要な事実)
- コンプライアンスの赤旗
AIは自動的にフラグを立てる。機密文書は別のレビュートラックへ。個人情報は再編集の対象となる。ホットな文書は上級レビュアーにエスカレーションされる。
下級のレビュアーがその重要性を認識しなかったために、すり抜けたものはない。
4.インテリジェントな優先順位付け
すべての書類が同じように重要なわけではありません。AIが正しい順序で見直す手助けをします:
- 関連性の高い信頼を第一に
- 重要な保管者からの書類を最初に
- 重要な時代の文書から先に
- 最初にホットな可能性があると判断された文書
- 機密性の高い内容の文書を優先
重要なことを早く見つけることができる。案件をより早く、よりよく理解できる。より良い戦略的決断ができる。
5.メールスレッドの要約
メールのスレッドは長くなる。20通、50通、100通。たくさんの「ありがとう」や「下記参照」、そして転送。
AIはスレッド全体を読み、要約を作成する:
- 関係者
- 議論されていること
- 主な決定事項またはコミットメント
- 未解決の質問またはアクション・アイテム
- 年表
レビュアーは10分ではなく30秒で文脈を理解する。レビュアーは10分ではなく30秒で文脈を理解する。
6.コンセプト検索と技術支援レビュー(TAR)
従来の検索"契約違反 "を含む文書を検索
問題:関連文書に "契約違反 "や "義務の不履行 "と書かれているかもしれない。
AIコンセプト検索:正確な表現に関係なく、契約違反に関する文書を検索します。
キーワードだけでなく、意味を理解します。従来の検索では見逃していた文書を発見します。
TARはさらに進んでいる:あなたはドキュメントのシード・セットをレビューする。AIは、あなたが何を関連性があると考えるかを学習する。そして、残りの文書の関連性を予測する。継続的なフィードバックが、より正確なものにする。
これが意味するもの
意思決定者のために
忖度コストは40-70%を落とす。
契約レビュアーによる請求時間の削減。レビューの迅速化は、プロジェクト管理のオーバーヘッドの削減を意味する。より良いターゲティングは、過剰生産の減少を意味する。
事件の解決も早い。
事件をより早く、よりよく理解する。重要な証拠をより早く見つける。十分な情報に基づいた和解の決定を迅速に行う。証拠開示への迅速な対応
予算の予測可能性。
AIのコストは固定されている。一次審査にかかる費用はわかっている。レビュアーの作業時間が膨れ上がっても、驚くことはない。
より良い戦略的意思決定。
ホットな文書を早期に発見し、事件をより深く理解することで、和解、申し立て手続き、裁判戦略について、より賢明な判断を下すことができる。
弁護士向け
価値の高いレビューに集中する。
明らかに無関係な文書はAIに任せる。あなたは法的判断が必要な文書に集中する。
より早く針を見つける。
優先順位付けとクラスタリングにより、重要文書を早期に特定できます。ケースを迅速に構築できます。
より良い特権保護。
自動化されたフラグ付けにより、特権の可能性がある文書を検出。特権放棄のリスクを低減。
防御可能なプロセス。
すべての決断は記録される。すべての予測は文書化される。異議申し立てがあった場合、レビュープロセスを擁護することができます。
コンプライアンスと調査
内部調査の迅速化。
問題が発生した場合、AIは関連するコミュニケーションを素早く確認するのに役立ちます。何が起こったのかをより早く理解することができます。
より良いドキュメンテーション。
何を見直し、何を発見し、何を決定したかを明確に記録。初日から監査対応可能。
初期号のシミ。
AIが文書セット全体に潜在的なコンプライアンス問題をフラグ付けします。気になる行動のパターンがわかります。
実例雇用紛争
従業員が不当解雇とハラスメントで提訴。ディスカバリーには3年分の電子メール、チャットログ、人事文書が含まれる。合計80,000文書。
AIなしで:
- 審査チーム契約弁護士5名
- 審査期間:6週間
- 最初のホットドキュメント発見第4週
- 総審査費用:$12万ドル
- 不必要に見直された文書:明らかに無関係な文書がおよそ5万件
AIと:
- AIが文書を事前分類(処理時間2時間)
- 40,000件の文書が明らかに関連性がない(信頼度が高い)と分類された。
- 25,000件の文書が、関連する可能性が高い、または不明確であるとしてフラグを立てられた。
- 15,000件の文書に機密の可能性があるとのフラグを立てる(秘匿特権、ホットドキュメント)
- ホットドキュメントは、レビューキューの先頭に優先順位付けされる
- 審査チーム:弁護士2名+契約書審査員2名
- 審査期間:2.5週間
- 最初のホットドキュメント発見3日目
- 総費用: $45,000
- より良いケース理解、より早い和解協議
同じ品質。60%のコスト削減。より速い解像度。
AIにできないこと
限界について正直に言おう。
AIは複雑な法的特権の呼び出しを理解しない。
これは、特権の可能性がある文書にフラグを立てるものです。特権の判断は弁護士が行う。
AIは人間のレビュアーの代わりにはならない。
レビューの量を減らすことができる。より良い決断を下すのに役立つ。最終的な決断を下すのは彼らです。
AIは斬新なケースを完璧に処理するわけではない。
一般的な紛争(雇用、契約、知財)?素晴らしい。前例のない法律理論で、トレーニングデータもない?あまり役に立たない。
AIが向上するためにはフィードバックが必要だ。
予測を見直し、修正すればするほど、その精度は高まる。セット・アンド・フォーゲットではないのだ。
AIは戦略的な決断を下さない。
文書に何が書かれているかを教えてくれる。それが何を意味するかは、あなたが決めることです。
AIは強力なツールである。経験豊富な訴訟代理人に取って代わるものではない。
始め方
1.パイロットケースを特定する。
文書量(10,000文書以上)に意味のあるケースを選択するが、最も複雑な訴訟ではない。標準的な紛争タイプが最適です。
2.審査基準を明確に定義する。
何が文書を関連づけるのか?何を探しているのか?基準が明確であればあるほど、AIのパフォーマンスは向上する。
3.シードセットから始める。
500~1,000の文書を手作業で見直す。コーディングする。AIはあなたの判断から学習する。
4.残りはAIに分類させる。
AIは学習した内容に基づいて、残りの文書の関連性を予測する。
5.AIの支援によるレビュー。
優先順位の高い文書に焦点を当てる。AI分類のサンプルをQCする。フィードバックを提供する。
6.洗練し、拡大する。
AIはフィードバックで改善。学んだことを次のケースに生かす。
よくある質問
AIによる審査は裁判所に受け入れられるか?
はい。裁判所はTARとAI支援レビューを繰り返し承認してきた。複雑な訴訟では、今や標準的な手法となっている。
特権審査についてはどうですか?
AIは特権の可能性がある文書にフラグを立てることができますが、最終的な特権の判断は弁護士が行わなければなりません。ほとんどのチームは、ファーストパスのフラグ立てにAIを使用しています。
異なるファイル形式を扱えますか?
はい。電子メール、PDF、Word文書、Excel、テキスト付き画像(OCR)、チャットログなど。テキストが抽出できれば、AIが分析します。
外国語についてはどうですか?
AIは多言語に対応。精度は言語によって異なる。英語、スペイン語、フランス語、ドイツ語が最適です。
どのようにして品質を確保するのですか?
QCサンプリング。継続的フィードバック。コントロールセットに対する検証。従来のレビューと同じ品質保証手法。
データ・セキュリティについてはどうだろうか?
お客様の既存のeDiscoveryプラットフォームと連携、またはお客様のセキュアな環境で展開します。お客様のドキュメントはお客様の管理下にあります。
結論
文書レビューにコストと時間を費やす必要はない。
AIが最初のパスを処理する。AIは山を分類する。パターンを見つける。重要なものにはフラグを立てる。レビュアーは人間の判断が必要な文書に集中する。
その結果、迅速な事件解決、ディスカバリーコストの削減、より良い戦略的決定、そして実際に専門知識を必要とする仕事をするレビュアーが生まれる。
魔法ではありません。訴訟をより効率的にする実用的な自動化だけだ。
ディスカバリー・コストの削減
すべてのケースは異なる。文書の種類も異なる。論点も異なる。レビュー・プロトコルも異なる。
私たちは、画一的なソリューションを販売することはありません。お客様の具体的なケースと発見の課題に目を向けます。AIが最も価値を発揮する場所を特定します。お客様のプロセスに合ったワークフローを構築します。
貴社の文書レビューの課題と、AIが真の効果を発揮できる分野についてお話ししましょう。