論文の概要: CiteCaseLAW: Citation Worthiness Detection in Caselaw for Legal
Assistive Writing
- arxiv url: http://arxiv.org/abs/2305.03508v1
- Date: Wed, 3 May 2023 04:20:56 GMT
- ステータス: 処理完了
- システム内更新日: 2023-05-08 14:03:49.952371
- Title: CiteCaseLAW: Citation Worthiness Detection in Caselaw for Legal
Assistive Writing
- Title(参考訳): 抄録ケースロー:判例における引用価値検出法
- Authors: Mann Khatri, Pritish Wadhwa, Gitansh Satija, Reshma Sheik, Yaman
Kumar, Rajiv Ratn Shah, Ponnurangam Kumaraguru
- Abstract要約: 本稿では,Caselaw Access Project (CAP) の法域における引用・安心度検出のための178万文のラベル付きデータセットを紹介する。
本論文では,様々な深層学習モデルの性能について検討した。
ドメイン固有の事前学習モデルは、他のモデルよりも優れている傾向があり、88%のF1スコアが引用-可視性検出タスクである。
- 参考スコア(独自算出の注目度): 44.75251805925605
- License: http://creativecommons.org/licenses/by-nc-nd/4.0/
- Abstract: In legal document writing, one of the key elements is properly citing the
case laws and other sources to substantiate claims and arguments. Understanding
the legal domain and identifying appropriate citation context or cite-worthy
sentences are challenging tasks that demand expensive manual annotation. The
presence of jargon, language semantics, and high domain specificity makes legal
language complex, making any associated legal task hard for automation. The
current work focuses on the problem of citation-worthiness identification. It
is designed as the initial step in today's citation recommendation systems to
lighten the burden of extracting an adequate set of citation contexts. To
accomplish this, we introduce a labeled dataset of 178M sentences for
citation-worthiness detection in the legal domain from the Caselaw Access
Project (CAP). The performance of various deep learning models was examined on
this novel dataset. The domain-specific pre-trained model tends to outperform
other models, with an 88% F1-score for the citation-worthiness detection task.
- Abstract(参考訳): 法的文書作成において重要な要素の1つは、訴訟法やその他の情報源を適切に引用し、クレームや議論を裏付けることである。
法的ドメインを理解し、適切な引用コンテキストや引用に値する文を特定することは、高価な手作業のアノテーションを必要とする課題である。
ジャーゴン、言語意味論、高ドメイン固有性により、法的言語は複雑になり、関連する法的タスクは自動化を困難にする。
本研究は, 引用性同定の問題に焦点をあてている。
現在の引用レコメンデーションシステムの最初のステップとして設計されており、適切な引用コンテキストを抽出する際の負担を軽減する。
これを実現するために,判例アクセスプロジェクト (cap) から法領域における引用性検出のための178m文のラベル付きデータセットを導入する。
本論文では,様々な深層学習モデルの性能について検討した。
ドメイン固有の事前学習モデルは、他のモデルよりも優れている傾向があり、88%のF1スコアが引用-可視性検出タスクである。
関連論文リスト
- SAILER: Structure-aware Pre-trained Language Model for Legal Case
Retrieval [75.05173891207214]
判例検索は知的法体系において中心的な役割を果たす。
既存の言語モデルの多くは、異なる構造間の長距離依存関係を理解するのが難しい。
本稿では, LEgal ケース検索のための構造対応プレトランザクショナル言語モデルを提案する。
論文 参考訳(メタデータ) (2023-04-22T10:47:01Z) - GERE: Generative Evidence Retrieval for Fact Verification [57.78768817972026]
本稿では,ジェネレーション方式で証拠を検索する最初のシステムであるGEREを提案する。
FEVERデータセットの実験結果は、GEREが最先端のベースラインよりも大幅に改善されていることを示している。
論文 参考訳(メタデータ) (2022-04-12T03:49:35Z) - An Evaluation Dataset for Legal Word Embedding: A Case Study On Chinese
Codex [3.1854529627213273]
単語埋め込みは、多くの自然言語処理タスクで広く使われている現代の分散語表現である。
本稿では,5種類の法的関係を利用して,2,388の中国語コーパスから1,134の法的アナロジカル推論質問セット(LARQS)を確立することを提案する。
論文 参考訳(メタデータ) (2022-03-29T01:26:26Z) - Deep Graph Learning for Anomalous Citation Detection [55.81334139806342]
本稿では,新たな深層グラフ学習モデルであるGLAD(Graph Learning for Anomaly Detection)を提案する。
GLADフレームワーク内ではCPU(Citation PUrpose)と呼ばれるアルゴリズムが提案され,引用テキストに基づく引用の目的が明らかになった。
論文 参考訳(メタデータ) (2022-02-23T09:05:28Z) - Towards generating citation sentences for multiple references with
intent control [86.53829532976303]
We build a novel generation model with the Fusion-in-Decoder approach to handlee with multiple long inputs。
実験により,提案手法は引用文を生成するためのより包括的な特徴を提供することが示された。
論文 参考訳(メタデータ) (2021-12-02T15:32:24Z) - Important Sentence Identification in Legal Cases Using Multi-Class
Classification [0.1499944454332829]
本研究は, 訴訟における重要な文を特定するために, 多クラス分類における文埋め込みの利用について検討する。
タスク固有損失関数は、カテゴリー的クロスエントロピー損失の直接的な使用によって制限される精度を改善するために定義される。
論文 参考訳(メタデータ) (2021-11-10T14:58:29Z) - When Does Translation Require Context? A Data-driven, Multilingual
Exploration [71.43817945875433]
談話の適切な処理は機械翻訳(MT)の品質に大きく貢献する
文脈認識型MTにおける最近の研究は、評価中に少量の談話現象を標的にしようとしている。
談話現象のモデル性能を識別・評価するタグの集合である,多言語談話認識ベンチマークを開発した。
論文 参考訳(メタデータ) (2021-09-15T17:29:30Z) - VerbCL: A Dataset of Verbatim Quotes for Highlight Extraction in Case
Law [12.080138272647144]
本稿では,裁判所意見の引用グラフからなる新たなデータセットを提案する。
我々は、原意見のテキストが直接再利用される、冗長な引用に焦点をあてる。
本稿では,引用グラフに基づく一文書要約タスクとしてハイライト抽出の課題を紹介する。
論文 参考訳(メタデータ) (2021-08-23T12:41:41Z) - CiteWorth: Cite-Worthiness Detection for Improved Scientific Document
Understanding [23.930041685595775]
本研究は,文が外部ソースを引用するか否かをラベル付けした英語における引用親和性検出の詳細な研究である。
CiteWorthは高品質で、挑戦的で、ドメイン適応のような問題の研究に適している。
論文 参考訳(メタデータ) (2021-05-23T11:08:45Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。