論文の概要: CiteCaseLAW: Citation Worthiness Detection in Caselaw for Legal
Assistive Writing
- arxiv url: http://arxiv.org/abs/2305.03508v1
- Date: Wed, 3 May 2023 04:20:56 GMT
- ステータス: 処理完了
- システム内更新日: 2023-05-08 14:03:49.952371
- Title: CiteCaseLAW: Citation Worthiness Detection in Caselaw for Legal
Assistive Writing
- Title(参考訳): 抄録ケースロー:判例における引用価値検出法
- Authors: Mann Khatri, Pritish Wadhwa, Gitansh Satija, Reshma Sheik, Yaman
Kumar, Rajiv Ratn Shah, Ponnurangam Kumaraguru
- Abstract要約: 本稿では,Caselaw Access Project (CAP) の法域における引用・安心度検出のための178万文のラベル付きデータセットを紹介する。
本論文では,様々な深層学習モデルの性能について検討した。
ドメイン固有の事前学習モデルは、他のモデルよりも優れている傾向があり、88%のF1スコアが引用-可視性検出タスクである。
- 参考スコア(独自算出の注目度): 44.75251805925605
- License: http://creativecommons.org/licenses/by-nc-nd/4.0/
- Abstract: In legal document writing, one of the key elements is properly citing the
case laws and other sources to substantiate claims and arguments. Understanding
the legal domain and identifying appropriate citation context or cite-worthy
sentences are challenging tasks that demand expensive manual annotation. The
presence of jargon, language semantics, and high domain specificity makes legal
language complex, making any associated legal task hard for automation. The
current work focuses on the problem of citation-worthiness identification. It
is designed as the initial step in today's citation recommendation systems to
lighten the burden of extracting an adequate set of citation contexts. To
accomplish this, we introduce a labeled dataset of 178M sentences for
citation-worthiness detection in the legal domain from the Caselaw Access
Project (CAP). The performance of various deep learning models was examined on
this novel dataset. The domain-specific pre-trained model tends to outperform
other models, with an 88% F1-score for the citation-worthiness detection task.
- Abstract(参考訳): 法的文書作成において重要な要素の1つは、訴訟法やその他の情報源を適切に引用し、クレームや議論を裏付けることである。
法的ドメインを理解し、適切な引用コンテキストや引用に値する文を特定することは、高価な手作業のアノテーションを必要とする課題である。
ジャーゴン、言語意味論、高ドメイン固有性により、法的言語は複雑になり、関連する法的タスクは自動化を困難にする。
本研究は, 引用性同定の問題に焦点をあてている。
現在の引用レコメンデーションシステムの最初のステップとして設計されており、適切な引用コンテキストを抽出する際の負担を軽減する。
これを実現するために,判例アクセスプロジェクト (cap) から法領域における引用性検出のための178m文のラベル付きデータセットを導入する。
本論文では,様々な深層学習モデルの性能について検討した。
ドメイン固有の事前学習モデルは、他のモデルよりも優れている傾向があり、88%のF1スコアが引用-可視性検出タスクである。
関連論文リスト
- ALiiCE: Evaluating Positional Fine-grained Citation Generation [54.19617927314975]
本稿では,微細な引用生成のための最初の自動評価フレームワークであるALiiCEを提案する。
我々のフレームワークはまず、文のクレームを依存性分析によって原子クレームに解析し、次に原子クレームレベルでの引用品質を計算する。
複数大言語モデルの2つの長文QAデータセット上での位置的きめ細かな引用生成性能を評価する。
論文 参考訳(メタデータ) (2024-06-19T09:16:14Z) - Judgement Citation Retrieval using Contextual Similarity [0.0]
本稿では,自然言語処理(NLP)と機械学習技術を組み合わせて,訴訟記述の組織化と活用を促進する手法を提案する。
提案手法は,教師なしクラスタリングと教師付き引用検索の2つの主要な目的に対処する。
我々の手法は90.9%という驚くべき精度を達成した。
論文 参考訳(メタデータ) (2024-05-28T04:22:28Z) - DELTA: Pre-train a Discriminative Encoder for Legal Case Retrieval via Structural Word Alignment [55.91429725404988]
判例検索のための識別モデルであるDELTAを紹介する。
我々は浅層デコーダを利用して情報ボトルネックを作り、表現能力の向上を目指しています。
本手法は, 判例検索において, 既存の最先端手法よりも優れている。
論文 参考訳(メタデータ) (2024-03-27T10:40:14Z) - SAILER: Structure-aware Pre-trained Language Model for Legal Case
Retrieval [75.05173891207214]
判例検索は知的法体系において中心的な役割を果たす。
既存の言語モデルの多くは、異なる構造間の長距離依存関係を理解するのが難しい。
本稿では, LEgal ケース検索のための構造対応プレトランザクショナル言語モデルを提案する。
論文 参考訳(メタデータ) (2023-04-22T10:47:01Z) - Deep Graph Learning for Anomalous Citation Detection [55.81334139806342]
本稿では,新たな深層グラフ学習モデルであるGLAD(Graph Learning for Anomaly Detection)を提案する。
GLADフレームワーク内ではCPU(Citation PUrpose)と呼ばれるアルゴリズムが提案され,引用テキストに基づく引用の目的が明らかになった。
論文 参考訳(メタデータ) (2022-02-23T09:05:28Z) - Towards generating citation sentences for multiple references with
intent control [86.53829532976303]
We build a novel generation model with the Fusion-in-Decoder approach to handlee with multiple long inputs。
実験により,提案手法は引用文を生成するためのより包括的な特徴を提供することが示された。
論文 参考訳(メタデータ) (2021-12-02T15:32:24Z) - Important Sentence Identification in Legal Cases Using Multi-Class
Classification [0.1499944454332829]
本研究は, 訴訟における重要な文を特定するために, 多クラス分類における文埋め込みの利用について検討する。
タスク固有損失関数は、カテゴリー的クロスエントロピー損失の直接的な使用によって制限される精度を改善するために定義される。
論文 参考訳(メタデータ) (2021-11-10T14:58:29Z) - VerbCL: A Dataset of Verbatim Quotes for Highlight Extraction in Case
Law [12.080138272647144]
本稿では,裁判所意見の引用グラフからなる新たなデータセットを提案する。
我々は、原意見のテキストが直接再利用される、冗長な引用に焦点をあてる。
本稿では,引用グラフに基づく一文書要約タスクとしてハイライト抽出の課題を紹介する。
論文 参考訳(メタデータ) (2021-08-23T12:41:41Z) - CiteWorth: Cite-Worthiness Detection for Improved Scientific Document
Understanding [23.930041685595775]
本研究は,文が外部ソースを引用するか否かをラベル付けした英語における引用親和性検出の詳細な研究である。
CiteWorthは高品質で、挑戦的で、ドメイン適応のような問題の研究に適している。
論文 参考訳(メタデータ) (2021-05-23T11:08:45Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。