論文の概要: To Aggregate or Not to Aggregate. That is the Question: A Case Study on Annotation Subjectivity in Span Prediction
- arxiv url: http://arxiv.org/abs/2408.02257v1
- Date: Mon, 5 Aug 2024 06:16:31 GMT
- ステータス: 処理完了
- システム内更新日: 2024-08-06 14:26:02.854258
- Title: To Aggregate or Not to Aggregate. That is the Question: A Case Study on Annotation Subjectivity in Span Prediction
- Title(参考訳): 集合するかどうか。それは質問である:スパン予測における注釈主観性に関する事例研究
- Authors: Kemal Kurniawan, Meladel Mistica, Timothy Baldwin, Jey Han Lau,
- Abstract要約: 我々は、法律家によって注釈付けされた英語で平凡な人々によって書かれた問題記述のコーパスを使用する。
法的な領域分類は複雑なタスクであるため、本タスクには本質的な主観性が存在する。
- 参考スコア(独自算出の注目度): 44.5492443909544
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: This paper explores the task of automatic prediction of text spans in a legal problem description that support a legal area label. We use a corpus of problem descriptions written by laypeople in English that is annotated by practising lawyers. Inherent subjectivity exists in our task because legal area categorisation is a complex task, and lawyers often have different views on a problem, especially in the face of legally-imprecise descriptions of issues. Experiments show that training on majority-voted spans outperforms training on disaggregated ones.
- Abstract(参考訳): 本稿では,法的領域ラベルをサポートする法的な問題記述において,テキストの自動予測の課題について検討する。
我々は、法律家によって注釈付けされた英語で平凡な人々によって書かれた問題記述のコーパスを使用する。
法的な分野の分類は複雑な作業であり、弁護士は問題、特に法的に不正確な問題の記述に直面して、問題に対する異なる見解を持つことが多い。
実験の結果,多数発声スパンのトレーニングは,非凝集スパンのトレーニングよりも優れていた。
関連論文リスト
- Topic Modelling Case Law Using a Large Language Model and a New Taxonomy for UK Law: AI Insights into Summary Judgment [0.0]
本稿では,英国における要約判断事例をモデル化するための新しい分類法の開発と適用について述べる。
要約判断事例のキュレートされたデータセットを用いて,Large Language Model Claude 3 Opusを用いて,機能的トピックとトレンドを探索する。
クロード3オプスはこのトピックを87.10%の精度で正しく分類した。
論文 参考訳(メタデータ) (2024-05-21T16:30:25Z) - DELTA: Pre-train a Discriminative Encoder for Legal Case Retrieval via Structural Word Alignment [55.91429725404988]
判例検索のための識別モデルであるDELTAを紹介する。
我々は浅層デコーダを利用して情報ボトルネックを作り、表現能力の向上を目指しています。
本手法は, 判例検索において, 既存の最先端手法よりも優れている。
論文 参考訳(メタデータ) (2024-03-27T10:40:14Z) - MUSER: A Multi-View Similar Case Retrieval Dataset [65.36779942237357]
類似事例検索(SCR)は、司法公正の促進に重要な役割を果たす代表的法的AIアプリケーションである。
既存のSCRデータセットは、ケース間の類似性を判断する際にのみ、事実記述セクションにフォーカスする。
本稿では,多視点類似度測定に基づく類似事例検索データセットMと,文レベル法定要素アノテーションを用いた包括的法定要素を提案する。
論文 参考訳(メタデータ) (2023-10-24T08:17:11Z) - Interpretable Long-Form Legal Question Answering with
Retrieval-Augmented Large Language Models [10.834755282333589]
長文の法的問合せデータセットは、専門家によるフランス語の法的質問1,868件からなる。
実験結果から,自動評価指標について有望な性能を示した。
LLeQAは、専門家によって注釈付けされた唯一の包括的なロングフォームLQAデータセットの1つであり、重要な現実世界の問題を解決するために研究を加速するだけでなく、特殊な領域におけるNLPモデルを評価するための厳密なベンチマークとしても機能する可能性がある。
論文 参考訳(メタデータ) (2023-09-29T08:23:19Z) - CiteCaseLAW: Citation Worthiness Detection in Caselaw for Legal
Assistive Writing [44.75251805925605]
本稿では,Caselaw Access Project (CAP) の法域における引用・安心度検出のための178万文のラベル付きデータセットを紹介する。
本論文では,様々な深層学習モデルの性能について検討した。
ドメイン固有の事前学習モデルは、他のモデルよりも優れている傾向があり、88%のF1スコアが引用-可視性検出タスクである。
論文 参考訳(メタデータ) (2023-05-03T04:20:56Z) - SAILER: Structure-aware Pre-trained Language Model for Legal Case
Retrieval [75.05173891207214]
判例検索は知的法体系において中心的な役割を果たす。
既存の言語モデルの多くは、異なる構造間の長距離依存関係を理解するのが難しい。
本稿では, LEgal ケース検索のための構造対応プレトランザクショナル言語モデルを提案する。
論文 参考訳(メタデータ) (2023-04-22T10:47:01Z) - Exploiting Contrastive Learning and Numerical Evidence for Confusing
Legal Judgment Prediction [46.71918729837462]
訴訟の事実記述文を考慮し、法的判断予測は、事件の告訴、法律記事、刑期を予測することを目的としている。
従来の研究では、標準的なクロスエントロピー分類損失と異なる分類誤差を区別できなかった。
本稿では,モコに基づく教師付きコントラスト学習を提案する。
さらに,事前学習した数値モデルにより符号化された抽出された犯罪量による事実記述の表現をさらに強化する。
論文 参考訳(メタデータ) (2022-11-15T15:53:56Z) - Legal Element-oriented Modeling with Multi-view Contrastive Learning for
Legal Case Retrieval [3.909749182759558]
本稿では,多視点コントラスト学習目標を用いた訴訟検索のための対話型ネットワークを提案する。
ケースビューコントラスト学習は、関連する訴訟表現の間の隠れた空間距離を最小化する。
ケースの法的な要素を検出するために、法的な要素の知識を意識した指標を用いています。
論文 参考訳(メタデータ) (2022-10-11T06:47:23Z) - Important Sentence Identification in Legal Cases Using Multi-Class
Classification [0.1499944454332829]
本研究は, 訴訟における重要な文を特定するために, 多クラス分類における文埋め込みの利用について検討する。
タスク固有損失関数は、カテゴリー的クロスエントロピー損失の直接的な使用によって制限される精度を改善するために定義される。
論文 参考訳(メタデータ) (2021-11-10T14:58:29Z) - Aspect Classification for Legal Depositions [0.0]
責任だけでなく、出来事、事故、身体状態、治療についても知ることが重要である。
法的規定は、先延ばしの証言の一部として議論される様々な側面から成り立っている。
本手法はF1スコアの0.83を達成している。
論文 参考訳(メタデータ) (2020-09-09T18:00:15Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。