論文の概要: VerbCL: A Dataset of Verbatim Quotes for Highlight Extraction in Case
Law
- arxiv url: http://arxiv.org/abs/2108.10120v1
- Date: Mon, 23 Aug 2021 12:41:41 GMT
- ステータス: 処理完了
- システム内更新日: 2021-08-24 18:31:50.358759
- Title: VerbCL: A Dataset of Verbatim Quotes for Highlight Extraction in Case
Law
- Title(参考訳): VerbCL: 事例法におけるハイライト抽出のためのVerbatim Quotesのデータセット
- Authors: Julien Rossi, Svitlana Vakulenko, Evangelos Kanoulas
- Abstract要約: 本稿では,裁判所意見の引用グラフからなる新たなデータセットを提案する。
我々は、原意見のテキストが直接再利用される、冗長な引用に焦点をあてる。
本稿では,引用グラフに基づく一文書要約タスクとしてハイライト抽出の課題を紹介する。
- 参考スコア(独自算出の注目度): 12.080138272647144
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Citing legal opinions is a key part of legal argumentation, an expert task
that requires retrieval, extraction and summarization of information from court
decisions. The identification of legally salient parts in an opinion for the
purpose of citation may be seen as a domain-specific formulation of a highlight
extraction or passage retrieval task. As similar tasks in other domains such as
web search show significant attention and improvement, progress in the legal
domain is hindered by the lack of resources for training and evaluation.
This paper presents a new dataset that consists of the citation graph of
court opinions, which cite previously published court opinions in support of
their arguments. In particular, we focus on the verbatim quotes, i.e., where
the text of the original opinion is directly reused.
With this approach, we explain the relative importance of different text
spans of a court opinion by showcasing their usage in citations, and measuring
their contribution to the relations between opinions in the citation graph.
We release VerbCL, a large-scale dataset derived from CourtListener and
introduce the task of highlight extraction as a single-document summarization
task based on the citation graph establishing the first baseline results for
this task on the VerbCL dataset.
- Abstract(参考訳): 法的意見の提出は、裁判所の決定から情報の検索、抽出、要約を必要とする専門家の業務である法的議論の重要な部分である。
引用目的の意見における法的に健全な部分の特定は、ハイライト抽出または通過検索タスクのドメイン固有の定式化と見なすことができる。
ウェブ検索などの他の分野の類似タスクは、注意と改善が著しいことから、法律分野の進歩は、トレーニングや評価のためのリソースの不足によって妨げられている。
本稿では,裁判所意見の引用グラフからなる新たなデータセットについて述べる。
特に、原論の文章が直接再利用されるような、動詞的な引用に焦点をあてる。
提案手法では,引用における使用法を示し,引用グラフにおける意見の関連性への寄与を測ることで,裁判所意見の異なるテキストの相対的重要性を説明する。
我々は,courtlistenerから派生した大規模データセットである verbcl をリリースし,このタスクの最初のベースライン結果を確立するための引用グラフに基づいて,単一文書要約タスクとしてハイライト抽出のタスクを導入する。
関連論文リスト
- Thesis: Document Summarization with applications to Keyword extraction and Image Retrieval [0.0]
意見要約のための部分モジュラ関数の集合を提案する。
意見要約は、その中に要約と感情検出のタスクが組み込まれている。
我々の関数は、文書の感情と要約の感情と良いROUGEスコアとの相関関係が良いような要約を生成する。
論文 参考訳(メタデータ) (2024-05-20T21:27:18Z) - DELTA: Pre-train a Discriminative Encoder for Legal Case Retrieval via Structural Word Alignment [55.91429725404988]
判例検索のための識別モデルであるDELTAを紹介する。
我々は浅層デコーダを利用して情報ボトルネックを作り、表現能力の向上を目指しています。
本手法は, 判例検索において, 既存の最先端手法よりも優れている。
論文 参考訳(メタデータ) (2024-03-27T10:40:14Z) - Aspect-based Meeting Transcript Summarization: A Two-Stage Approach with
Weak Supervision on Sentence Classification [91.13086984529706]
Aspect-based meeting transcript summarization は複数の要約を生成することを目的としている。
従来の要約手法は、全ての側面の情報を1つの要約で混合する。
アスペクトベースの会議書き起こし要約のための2段階の手法を提案する。
論文 参考訳(メタデータ) (2023-11-07T19:06:31Z) - Analysing the Resourcefulness of the Paragraph for Precedence Retrieval [0.1761604268733064]
我々は,優先検索の性能向上のための判断の類似性を把握する上で,段落レベルの情報の資源性について分析した。
その結果,数段の相互作用で判断の類似性を捉えることができ,基本文書レベルの方法よりも識別力が向上することが判明した。
論文 参考訳(メタデータ) (2023-07-29T08:55:38Z) - CiteCaseLAW: Citation Worthiness Detection in Caselaw for Legal
Assistive Writing [44.75251805925605]
本稿では,Caselaw Access Project (CAP) の法域における引用・安心度検出のための178万文のラベル付きデータセットを紹介する。
本論文では,様々な深層学習モデルの性能について検討した。
ドメイン固有の事前学習モデルは、他のモデルよりも優れている傾向があり、88%のF1スコアが引用-可視性検出タスクである。
論文 参考訳(メタデータ) (2023-05-03T04:20:56Z) - Inline Citation Classification using Peripheral Context and
Time-evolving Augmentation [23.88211560188731]
本稿では,引用文を用いた談話情報を提供する3Cextという新しいデータセットを提案する。
周辺文とドメイン知識を融合したトランスフォーマーベースのディープニューラルネットワークPeriCiteを提案する。
論文 参考訳(メタデータ) (2023-03-01T09:11:07Z) - CiteBench: A benchmark for Scientific Citation Text Generation [69.37571393032026]
CiteBenchは引用テキスト生成のベンチマークである。
CiteBenchのコードはhttps://github.com/UKPLab/citebench.comで公開しています。
論文 参考訳(メタデータ) (2022-12-19T16:10:56Z) - Improving Keyphrase Extraction with Data Augmentation and Information
Filtering [67.43025048639333]
キーフレーズ抽出はNLPにおける文書理解に不可欠なタスクの1つである。
本稿では,Behanceプラットフォーム上でストリームされたビデオからキーフレーズを抽出するための新しいコーパスと手法を提案する。
論文 参考訳(メタデータ) (2022-09-11T22:38:02Z) - Towards generating citation sentences for multiple references with
intent control [86.53829532976303]
We build a novel generation model with the Fusion-in-Decoder approach to handlee with multiple long inputs。
実験により,提案手法は引用文を生成するためのより包括的な特徴を提供することが示された。
論文 参考訳(メタデータ) (2021-12-02T15:32:24Z) - Generating Fact Checking Summaries for Web Claims [8.980876474818153]
本稿では,テキスト文書の形での証拠に基づくテキストクレームの正当性を確立するために,ニューラルアテンションに基づくアプローチを提案する。
政治・医療・環境問題に関するデータセットに対するアプローチの有効性を示す。
論文 参考訳(メタデータ) (2020-10-16T18:10:47Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。