論文の概要: Analysis of Legal Documents via Non-negative Matrix Factorization
Methods
- arxiv url: http://arxiv.org/abs/2104.14028v1
- Date: Wed, 28 Apr 2021 21:32:22 GMT
- ステータス: 処理完了
- システム内更新日: 2021-04-30 12:47:21.078073
- Title: Analysis of Legal Documents via Non-negative Matrix Factorization
Methods
- Title(参考訳): 非負行列分解法による法的文書の分析
- Authors: Ryan Budahazy, Lu Cheng, Yihuan Huang, Andrew Johnson, Pengyu Li,
Joshua Vendrow, Zhoutong Wu, Denali Molitor, Elizaveta Rebrova, Deanna
Needell
- Abstract要約: CIP(California Innocence Project)は、新しい支援要請と対応するケースファイルを含む何千ものメールを評価している。
我々は非負行列分解法(NMF)を適用し、CIPによってコンパイルされた重要かつ未研究のデータセットに様々なオフシュートを実装した。
その結果、現在のケースファイルの意味構造を明らかにし、cip職員に新たな受信したケースファイルに関する一般的な理解を与えることができる。
- 参考スコア(独自算出の注目度): 8.57967093124487
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: The California Innocence Project (CIP), a clinical law school program aiming
to free wrongfully convicted prisoners, evaluates thousands of mails containing
new requests for assistance and corresponding case files. Processing and
interpreting this large amount of information presents a significant challenge
for CIP officials, which can be successfully aided by topic modeling
techniques.In this paper, we apply Non-negative Matrix Factorization (NMF)
method and implement various offshoots of it to the important and previously
unstudied data set compiled by CIP. We identify underlying topics of existing
case files and classify request files by crime type and case status (decision
type). The results uncover the semantic structure of current case files and can
provide CIP officials with a general understanding of newly received case files
before further examinations. We also provide an exposition of popular variants
of NMF with their experimental results and discuss the benefits and drawbacks
of each variant through the real-world application.
- Abstract(参考訳): california innocence project(cip)は、有罪判決を受けた囚人を解放することを目的とした臨床法学校プログラムで、新しい支援要請と対応する事件ファイルを含む数千のメールを評価している。
この大量の情報処理と解釈はCIP職員にとって重要な課題であり、トピックモデリング技術によって支援できる。本論文では、非負行列分解法(NMF)を適用し、CIPがコンパイルした重要かつ未研究のデータセットに対して、その様々なオフシュートを実装する。
既存の事例ファイルの下位のトピックを特定し、犯罪タイプとケースステータス(決定型)で要求ファイルを分類する。
その結果、現在のケースファイルの意味構造を明らかにし、cip職員に新たな受信したケースファイルに関する一般的な理解を与えることができる。
また、NMFの一般的な変種を実験結果とともに展示し、実世界の応用を通して各変種の利点と欠点について議論する。
関連論文リスト
- Enhancing Legal Case Retrieval via Scaling High-quality Synthetic Query-Candidate Pairs [67.54302101989542]
判例検索は、ある事実記述の参照として類似した事例を提供することを目的としている。
既存の作業は主に、長いクエリを使ったケース・ツー・ケースの検索に重点を置いている。
データスケールは、既存のデータハングリーニューラルネットワークのトレーニング要件を満たすには不十分である。
論文 参考訳(メタデータ) (2024-10-09T06:26:39Z) - DELTA: Pre-train a Discriminative Encoder for Legal Case Retrieval via Structural Word Alignment [55.91429725404988]
判例検索のための識別モデルであるDELTAを紹介する。
我々は浅層デコーダを利用して情報ボトルネックを作り、表現能力の向上を目指しています。
本手法は, 判例検索において, 既存の最先端手法よりも優れている。
論文 参考訳(メタデータ) (2024-03-27T10:40:14Z) - MUSER: A Multi-View Similar Case Retrieval Dataset [65.36779942237357]
類似事例検索(SCR)は、司法公正の促進に重要な役割を果たす代表的法的AIアプリケーションである。
既存のSCRデータセットは、ケース間の類似性を判断する際にのみ、事実記述セクションにフォーカスする。
本稿では,多視点類似度測定に基づく類似事例検索データセットMと,文レベル法定要素アノテーションを用いた包括的法定要素を提案する。
論文 参考訳(メタデータ) (2023-10-24T08:17:11Z) - A Hierarchical Neural Framework for Classification and its Explanation in Large Unstructured Legal Documents [0.5812284760539713]
我々はこの問題を「注釈付き法律文書」と定義する。
我々はMEScと呼ぶディープラーニングに基づく分類フレームワークを提案する。
また、ORSEと呼ばれる説明抽出アルゴリズムを提案する。
論文 参考訳(メタデータ) (2023-09-19T12:18:28Z) - Framework for developing quantitative agent based models based on
qualitative expert knowledge: an organised crime use-case [0.0]
法執行目的で犯罪ネットワークをモデル化するためには、データの限られた供給を検証されたエージェントベースモデルに変換する必要がある。
現在の犯罪モデルに欠けているのは、モデラーとドメインエキスパートのための体系的で透明なフレームワークです。
この目的のために、FREIDA ( Framework for Expert-Informed Data-driven Agent-based model)を提案する。
論文 参考訳(メタデータ) (2023-07-21T11:26:54Z) - CaseEncoder: A Knowledge-enhanced Pre-trained Model for Legal Case
Encoding [15.685369142294693]
CaseEncoderは、データサンプリングと事前トレーニングフェーズの両方において、きめ細かい法的な知識を活用する法律文書エンコーダである。
CaseEncoderは、ゼロショットの判例検索において、既存の一般的な事前訓練モデルと法律固有の事前訓練モデルの両方を著しく上回っている。
論文 参考訳(メタデータ) (2023-05-09T12:40:19Z) - Forensicability Assessment of Questioned Images in Recapturing Detection [78.45849869266834]
質問されたサンプルの鑑定可能性の定量化のための鑑定可能性評価ネットワークを提案する。
低フォレンシビリティサンプルは、実際の再適応検出プロセスの前に拒絶され、再適応システムの効率が向上する。
我々は、トレーニングされたFANetと、アンチ・スプーフィングと再適応された文書検出タスクの実践的な再適応検出スキームを統合する。
論文 参考訳(メタデータ) (2022-09-05T12:26:01Z) - Questions Are All You Need to Train a Dense Passage Retriever [123.13872383489172]
ARTは、ラベル付きトレーニングデータを必要としない高密度検索モデルをトレーニングするための、新しいコーパスレベルのオートエンコーディングアプローチである。
そこで,(1) 入力質問を用いて証拠文書の集合を検索し,(2) 文書を用いて元の質問を再構築する確率を計算する。
論文 参考訳(メタデータ) (2022-06-21T18:16:31Z) - GERE: Generative Evidence Retrieval for Fact Verification [57.78768817972026]
本稿では,ジェネレーション方式で証拠を検索する最初のシステムであるGEREを提案する。
FEVERデータセットの実験結果は、GEREが最先端のベースラインよりも大幅に改善されていることを示している。
論文 参考訳(メタデータ) (2022-04-12T03:49:35Z) - Guided Semi-Supervised Non-negative Matrix Factorization on Legal
Documents [12.213208807541895]
本稿では,分類とトピックモデリングの両方を行う手法,すなわち,半教師付き非負行列因子分解法(GSSNMF)を提案する。
本稿では,カリフォルニア・インノシエンス・プロジェクト(California Innocence Project)が提供する法的文書への適用を通じて,本手法の性能を検証した。
論文 参考訳(メタデータ) (2022-01-31T16:21:51Z) - Automated Artefact Relevancy Determination from Artefact Metadata and
Associated Timeline Events [7.219077740523683]
ケースハンダーで、多年にわたるデジタル法医学的証拠バックログは、世界中の法執行機関で一般的になっている。
これは、デジタル法医学的な調査を必要とするケースが、ケースごとに処理されるデータの量の増加と相まって増え続けているためである。
以前に処理されたデジタル法医学ケースとそれらのコンポーネントのアーティファクト関連性分類を活用することは、自動化された人工知能ベースのエビデンス処理システムのトレーニングの機会を促進することができる。
論文 参考訳(メタデータ) (2020-12-02T14:14:26Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。