Fugu-MT 論文翻訳(概要): CiteCaseLAW: Citation Worthiness Detection in Caselaw for Legal Assistive Writing

論文の概要: CiteCaseLAW: Citation Worthiness Detection in Caselaw for Legal Assistive Writing

arxiv url: http://arxiv.org/abs/2305.03508v1
Date: Wed, 3 May 2023 04:20:56 GMT
ステータス: 翻訳完了
システム内更新日: 2023-05-08 14:03:49.952371
Title: CiteCaseLAW: Citation Worthiness Detection in Caselaw for Legal Assistive Writing
Title（参考訳）: 抄録ケースロー:判例における引用価値検出法
Authors: Mann Khatri, Pritish Wadhwa, Gitansh Satija, Reshma Sheik, Yaman Kumar, Rajiv Ratn Shah, Ponnurangam Kumaraguru
Abstract要約: 本稿では,Caselaw Access Project (CAP) の法域における引用・安心度検出のための178万文のラベル付きデータセットを紹介する。本論文では,様々な深層学習モデルの性能について検討した。ドメイン固有の事前学習モデルは、他のモデルよりも優れている傾向があり、88%のF1スコアが引用-可視性検出タスクである。
参考スコア（独自算出の注目度）: 44.75251805925605
License: http://creativecommons.org/licenses/by-nc-nd/4.0/
Abstract: In legal document writing, one of the key elements is properly citing the case laws and other sources to substantiate claims and arguments. Understanding the legal domain and identifying appropriate citation context or cite-worthy sentences are challenging tasks that demand expensive manual annotation. The presence of jargon, language semantics, and high domain specificity makes legal language complex, making any associated legal task hard for automation. The current work focuses on the problem of citation-worthiness identification. It is designed as the initial step in today's citation recommendation systems to lighten the burden of extracting an adequate set of citation contexts. To accomplish this, we introduce a labeled dataset of 178M sentences for citation-worthiness detection in the legal domain from the Caselaw Access Project (CAP). The performance of various deep learning models was examined on this novel dataset. The domain-specific pre-trained model tends to outperform other models, with an 88% F1-score for the citation-worthiness detection task.
Abstract（参考訳）: 法的文書作成において重要な要素の1つは、訴訟法やその他の情報源を適切に引用し、クレームや議論を裏付けることである。法的ドメインを理解し、適切な引用コンテキストや引用に値する文を特定することは、高価な手作業のアノテーションを必要とする課題である。ジャーゴン、言語意味論、高ドメイン固有性により、法的言語は複雑になり、関連する法的タスクは自動化を困難にする。本研究は, 引用性同定の問題に焦点をあてている。現在の引用レコメンデーションシステムの最初のステップとして設計されており、適切な引用コンテキストを抽出する際の負担を軽減する。これを実現するために,判例アクセスプロジェクト (cap) から法領域における引用性検出のための178m文のラベル付きデータセットを導入する。本論文では,様々な深層学習モデルの性能について検討した。ドメイン固有の事前学習モデルは、他のモデルよりも優れている傾向があり、88%のF1スコアが引用-可視性検出タスクである。

関連論文リスト

CiteAudit: You Cited It, But Did You Read It? A Benchmark for Verifying Scientific References in the LLM Era [51.63024682584688]
大規模言語モデル (LLM) は新たなリスクを導入している。本稿では,科学文献における幻覚的引用のための総合的なベンチマークおよび検出フレームワークについて紹介する。我々のフレームワークは、精度と解釈可能性の両方において、先行手法を著しく上回っている。
論文参考訳（メタデータ） (2026-02-26T19:17:39Z)
SemanticCite: Citation Verification with AI-Powered Full-Text Analysis and Evidence-Based Reasoning [0.0]
本稿では,全文ソース解析による引用精度の検証を行うAIシステムであるSemanticCiteを紹介する。提案手法は,複数の検索手法と,ニュアンスド・クレーム・ソース関係を抽出する4クラス分類システムを組み合わせたものである。我々は、詳細なアライメント、機能分類、セマンティックアノテーション、およびバイオロメトリメタデータを備えた1000以上の引用からなる包括的なデータセットをコントリビュートする。
論文参考訳（メタデータ） (2025-11-20T10:05:21Z)
Cite Pretrain: Retrieval-Free Knowledge Attribution for Large Language Models [53.17363502535395]
信頼できる言語モデルは、正しい答えと検証可能な答えの両方を提供するべきです。現在のシステムは、外部レトリバーを推論時にクエリすることで、引用を挿入する。本稿では,合成QAペアを継続的に事前訓練するActive Indexingを提案する。
論文参考訳（メタデータ） (2025-06-21T04:48:05Z)
Assessing the Performance Gap Between Lexical and Semantic Models for Information Retrieval With Formulaic Legal Language [1.3499500088995462]
本研究は,欧州連合司法裁判所(CJEU)の判決から法律又は段落を回収する業務について検討する。実験の結果,BM25は7つのパフォーマンス指標のうち4つにおいて,市販の高密度モデルを上回る強力なベースラインであることが判明した。ドメイン固有のデータに対する厳密なモデルを微調整することでパフォーマンスが向上し、ほとんどのメトリクスでBM25を上回った。
論文参考訳（メタデータ） (2025-06-15T15:53:38Z)
ALiiCE: Evaluating Positional Fine-grained Citation Generation [54.19617927314975]
本稿では,微細な引用生成のための最初の自動評価フレームワークであるALiiCEを提案する。我々のフレームワークはまず、文のクレームを依存性分析によって原子クレームに解析し、次に原子クレームレベルでの引用品質を計算する。複数大言語モデルの2つの長文QAデータセット上での位置的きめ細かな引用生成性能を評価する。
論文参考訳（メタデータ） (2024-06-19T09:16:14Z)
Judgement Citation Retrieval using Contextual Similarity [0.0]
本稿では,自然言語処理(NLP)と機械学習技術を組み合わせて,訴訟記述の組織化と活用を促進する手法を提案する。提案手法は,教師なしクラスタリングと教師付き引用検索の2つの主要な目的に対処する。我々の手法は90.9%という驚くべき精度を達成した。
論文参考訳（メタデータ） (2024-05-28T04:22:28Z)
DELTA: Pre-train a Discriminative Encoder for Legal Case Retrieval via Structural Word Alignment [55.91429725404988]
判例検索のための識別モデルであるDELTAを紹介する。我々は浅層デコーダを利用して情報ボトルネックを作り、表現能力の向上を目指しています。本手法は, 判例検索において, 既存の最先端手法よりも優れている。
論文参考訳（メタデータ） (2024-03-27T10:40:14Z)
SAILER: Structure-aware Pre-trained Language Model for Legal Case Retrieval [75.05173891207214]
判例検索は知的法体系において中心的な役割を果たす。既存の言語モデルの多くは、異なる構造間の長距離依存関係を理解するのが難しい。本稿では, LEgal ケース検索のための構造対応プレトランザクショナル言語モデルを提案する。
論文参考訳（メタデータ） (2023-04-22T10:47:01Z)
Deep Graph Learning for Anomalous Citation Detection [55.81334139806342]
本稿では,新たな深層グラフ学習モデルであるGLAD(Graph Learning for Anomaly Detection)を提案する。 GLADフレームワーク内ではCPU(Citation PUrpose)と呼ばれるアルゴリズムが提案され,引用テキストに基づく引用の目的が明らかになった。
論文参考訳（メタデータ） (2022-02-23T09:05:28Z)
Towards generating citation sentences for multiple references with intent control [86.53829532976303]
We build a novel generation model with the Fusion-in-Decoder approach to handlee with multiple long inputs。実験により,提案手法は引用文を生成するためのより包括的な特徴を提供することが示された。
論文参考訳（メタデータ） (2021-12-02T15:32:24Z)
Important Sentence Identification in Legal Cases Using Multi-Class Classification [0.1499944454332829]
本研究は, 訴訟における重要な文を特定するために, 多クラス分類における文埋め込みの利用について検討する。タスク固有損失関数は、カテゴリー的クロスエントロピー損失の直接的な使用によって制限される精度を改善するために定義される。
論文参考訳（メタデータ） (2021-11-10T14:58:29Z)
VerbCL: A Dataset of Verbatim Quotes for Highlight Extraction in Case Law [12.080138272647144]
本稿では,裁判所意見の引用グラフからなる新たなデータセットを提案する。我々は、原意見のテキストが直接再利用される、冗長な引用に焦点をあてる。本稿では,引用グラフに基づく一文書要約タスクとしてハイライト抽出の課題を紹介する。
論文参考訳（メタデータ） (2021-08-23T12:41:41Z)
CiteWorth: Cite-Worthiness Detection for Improved Scientific Document Understanding [23.930041685595775]
本研究は,文が外部ソースを引用するか否かをラベル付けした英語における引用親和性検出の詳細な研究である。 CiteWorthは高品質で、挑戦的で、ドメイン適応のような問題の研究に適している。
論文参考訳（メタデータ） (2021-05-23T11:08:45Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。