論文の概要: Thunder-DeID: Accurate and Efficient De-identification Framework for Korean Court Judgments
- arxiv url: http://arxiv.org/abs/2506.15266v1
- Date: Wed, 18 Jun 2025 08:41:28 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-06-19 19:35:51.600415
- Title: Thunder-DeID: Accurate and Efficient De-identification Framework for Korean Court Judgments
- Title(参考訳): Thunder-DeID:韓国裁判所判決の正確かつ効率的な非識別フレームワーク
- Authors: Sungen Hahm, Heejin Kim, Gyuseong Lee, Hyunji Park, Jaejin Lee,
- Abstract要約: 韓国司法裁判所は、公にされる前に裁判所判決の非正当性を委任する。
現在の非識別プロセスは、厳格な法的要件を遵守しながら、大規模に裁判所判断を扱うには不十分である。
我々はサンダー・デID(Thunder-DeID, Thunder-DeID)と呼ばれる、関連する法律や慣習に適合する非識別化フレームワークを提案する。
- 参考スコア(独自算出の注目度): 3.9672712915269575
- License: http://creativecommons.org/licenses/by-nc-sa/4.0/
- Abstract: To ensure a balance between open access to justice and personal data protection, the South Korean judiciary mandates the de-identification of court judgments before they can be publicly disclosed. However, the current de-identification process is inadequate for handling court judgments at scale while adhering to strict legal requirements. Additionally, the legal definitions and categorizations of personal identifiers are vague and not well-suited for technical solutions. To tackle these challenges, we propose a de-identification framework called Thunder-DeID, which aligns with relevant laws and practices. Specifically, we (i) construct and release the first Korean legal dataset containing annotated judgments along with corresponding lists of entity mentions, (ii) introduce a systematic categorization of Personally Identifiable Information (PII), and (iii) develop an end-to-end deep neural network (DNN)-based de-identification pipeline. Our experimental results demonstrate that our model achieves state-of-the-art performance in the de-identification of court judgments.
- Abstract(参考訳): 正義へのオープンアクセスと個人データ保護のバランスを確保するため、韓国司法裁判所は、公にされる前に裁判所判決の無効化を義務付けている。
しかし、現行の非識別プロセスは、厳格な法的要件を遵守しつつ、大規模に裁判所判断を扱うには不十分である。
さらに、個人識別子の法的定義と分類は曖昧であり、技術的な解決には適していない。
これらの課題に対処するため、我々はThunder-DeIDと呼ばれる、関連する法律やプラクティスと整合した非識別フレームワークを提案する。
具体的には
一 注釈付き判決を付した最初の朝鮮法定データセット及びそれに対応する実体言及のリストを作成して公開すること。
(二)個人識別情報(PII)の体系的分類を導入し、
3) エンドツーエンドのディープニューラルネットワーク(DNN)ベースのデIDパイプラインを開発する。
以上の結果から,裁判所判決の非確定化において,我々のモデルが最先端の性能を達成できることが実証された。
関連論文リスト
- LegalReasoner: Step-wised Verification-Correction for Legal Judgment Reasoning [25.808321575139537]
法的判断予測(LJP)は、事件の主張や事実に基づいて最終判決を下すことによって裁判官として機能することを目的としている。
本稿では,段階的検証と推論プロセスの修正によりLJPの信頼性を向上させるLegalReasonerを提案する。
香港の58,130件の判例を含むLegalHKデータセットを公開し、紛争点の詳細なアノテーション、ステップバイステップの推論チェーン、プロセス検証ラベルを含む。
論文 参考訳(メタデータ) (2025-06-09T05:48:35Z) - A Law Reasoning Benchmark for LLM with Tree-Organized Structures including Factum Probandum, Evidence and Experiences [76.73731245899454]
本稿では,階層的なファクトラム,証拠,暗黙的な経験に富む透明な法理推論スキーマを提案する。
このスキーマにインスパイアされた課題は、テキストのケース記述を取り込み、最終決定を正当化する階層構造を出力する。
このベンチマークは、Intelligent Courtにおける透明で説明可能なAI支援法推論の道を開く」。
論文 参考訳(メタデータ) (2025-03-02T10:26:54Z) - AnnoCaseLaw: A Richly-Annotated Dataset For Benchmarking Explainable Legal Judgment Prediction [56.797874973414636]
AnnoCaseLawは、アメリカ合衆国控訴裁判所の無視事件を慎重に注釈付けした471のデータセットである。
我々のデータセットは、より人間らしく説明可能な法的な判断予測モデルの基礎となる。
その結果、LJPは依然として厳しい課題であり、法的な前例の適用は特に困難であることが示されている。
論文 参考訳(メタデータ) (2025-02-28T19:14:48Z) - Enabling Discriminative Reasoning in LLMs for Legal Judgment Prediction [23.046342240176575]
人間の推論に触発されたAsk-Discriminate-Predict(ADAPT)推論フレームワークを紹介する。
ADAPTは、ケース事実を分解し、潜在的な電荷を識別し、最終的な判断を予測する。
広く利用されている2つのデータセットに対して行われた実験は、法的な判断予測において、我々のフレームワークの優れた性能を示す。
論文 参考訳(メタデータ) (2024-07-02T05:43:15Z) - DELTA: Pre-train a Discriminative Encoder for Legal Case Retrieval via Structural Word Alignment [55.91429725404988]
判例検索のための識別モデルであるDELTAを紹介する。
我々は浅層デコーダを利用して情報ボトルネックを作り、表現能力の向上を目指しています。
本手法は, 判例検索において, 既存の最先端手法よりも優れている。
論文 参考訳(メタデータ) (2024-03-27T10:40:14Z) - MUSER: A Multi-View Similar Case Retrieval Dataset [65.36779942237357]
類似事例検索(SCR)は、司法公正の促進に重要な役割を果たす代表的法的AIアプリケーションである。
既存のSCRデータセットは、ケース間の類似性を判断する際にのみ、事実記述セクションにフォーカスする。
本稿では,多視点類似度測定に基づく類似事例検索データセットMと,文レベル法定要素アノテーションを用いた包括的法定要素を提案する。
論文 参考訳(メタデータ) (2023-10-24T08:17:11Z) - SAILER: Structure-aware Pre-trained Language Model for Legal Case
Retrieval [75.05173891207214]
判例検索は知的法体系において中心的な役割を果たす。
既存の言語モデルの多くは、異なる構造間の長距離依存関係を理解するのが難しい。
本稿では, LEgal ケース検索のための構造対応プレトランザクショナル言語モデルを提案する。
論文 参考訳(メタデータ) (2023-04-22T10:47:01Z) - Exploiting Contrastive Learning and Numerical Evidence for Confusing
Legal Judgment Prediction [46.71918729837462]
訴訟の事実記述文を考慮し、法的判断予測は、事件の告訴、法律記事、刑期を予測することを目的としている。
従来の研究では、標準的なクロスエントロピー分類損失と異なる分類誤差を区別できなかった。
本稿では,モコに基づく教師付きコントラスト学習を提案する。
さらに,事前学習した数値モデルにより符号化された抽出された犯罪量による事実記述の表現をさらに強化する。
論文 参考訳(メタデータ) (2022-11-15T15:53:56Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。