論文の概要: ContractNLI: A Dataset for Document-level Natural Language Inference for
Contracts
- arxiv url: http://arxiv.org/abs/2110.01799v1
- Date: Tue, 5 Oct 2021 03:22:31 GMT
- ステータス: 処理完了
- システム内更新日: 2021-10-07 00:06:39.693364
- Title: ContractNLI: A Dataset for Document-level Natural Language Inference for
Contracts
- Title(参考訳): ContractNLI: 契約のためのドキュメントレベルの自然言語推論のためのデータセット
- Authors: Yuta Koreeda and Christopher D. Manning
- Abstract要約: 契約書に対する文書レベルの自然言語推論(NLI)を提案する。
システムには一連の仮説と契約が与えられ、それぞれの仮説が「関連づけられている」か、「矛盾している」か、「言及されていない」か(中立である)を分類するよう求められる。
これまでで最大のコーパスを607のアノテート契約でリリースしています。
- 参考スコア(独自算出の注目度): 39.75232199445175
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Reviewing contracts is a time-consuming procedure that incurs large expenses
to companies and social inequality to those who cannot afford it. In this work,
we propose "document-level natural language inference (NLI) for contracts", a
novel, real-world application of NLI that addresses such problems. In this
task, a system is given a set of hypotheses (such as "Some obligations of
Agreement may survive termination.") and a contract, and it is asked to
classify whether each hypothesis is "entailed by", "contradicting to" or "not
mentioned by" (neutral to) the contract as well as identifying "evidence" for
the decision as spans in the contract. We annotated and release the largest
corpus to date consisting of 607 annotated contracts. We then show that
existing models fail badly on our task and introduce a strong baseline, which
(1) models evidence identification as multi-label classification over spans
instead of trying to predict start and end tokens, and (2) employs more
sophisticated context segmentation for dealing with long documents. We also
show that linguistic characteristics of contracts, such as negations by
exceptions, are contributing to the difficulty of this task and that there is
much room for improvement.
- Abstract(参考訳): 契約の審査は時間を要する手続きであり、その費用を払えない者には企業や社会的不平等をもたらす。
本稿では,このような問題に対処するnliの新規な実世界応用である「契約のための文書レベル自然言語推論(nli)」を提案する。
この課題において、システムは一連の仮説(例えば「協定の諸義務は終了を乗り切ることができる」など)と契約を与えられ、各仮説が「関連づけられている」か、「矛盾している」か、あるいは「言及されていない」かを分類するよう求められ、また、その決定の「証拠」を契約のスパンとして特定する。
607の注釈付き契約からなる、これまでで最大のコーパスをアノテートし、リリースしました。
その結果,既存のモデルでは,開始と終了のトークンを予測しようとするのではなく,複数ラベルの分類として識別された証拠をモデル化し,長い文書を扱うために,より洗練されたコンテキストセグメンテーションを採用していることがわかった。
また,例外による否定などの契約の言語的特徴が,この課題の難しさに寄与しており,改善の余地がたくさんあることも示している。
関連論文リスト
- Generating Clarification Questions for Disambiguating Contracts [3.672364005691543]
我々は,契約の明確化に関する疑問を生じさせる新たな法的NLPタスクを導入する。
これらの質問は、文書レベルで契約の曖昧さを特定し、非法的利害関係者を支援することを目的としています。
CUADデータセットから得られた契約に基づいて実施された実験は、ConRAPがF2スコア0.87であいまいさを検出できることを示している。
論文 参考訳(メタデータ) (2024-03-12T19:57:39Z) - PropSegmEnt: A Large-Scale Corpus for Proposition-Level Segmentation and
Entailment Recognition [63.51569687229681]
文中の各命題の文的含意関係を個別に認識する必要性について論じる。
提案するPropSegmEntは45K以上の提案のコーパスであり, 専門家によるアノテートを行う。
我々のデータセット構造は、(1)文書内の文章を命題の集合に分割し、(2)異なるが、トポジカルに整合した文書に対して、各命題の含意関係を分類するタスクに類似している。
論文 参考訳(メタデータ) (2022-12-21T04:03:33Z) - Formal Modeling and Analysis of Legal Contracts using ContractCheck [0.0]
textitContractCheckは、法律契約、特に販売購入協定(SPA)の整合性解析を可能にする
この分析は、SPAの節の実行のための前提の符号化と、一階述語論理の決定可能な断片を用いた制約の提案に依存している。
論文 参考訳(メタデータ) (2022-12-06T22:03:11Z) - ConReader: Exploring Implicit Relations in Contracts for Contract Clause
Extraction [84.0634340572349]
法律契約における暗黙の関係をモデル化し,契約条項の自動抽出(CCE)について検討する。
本研究ではまず,契約の複雑性問題を包括的に分析し,契約に共通する3つの暗黙の関係を抽出する。
本稿では,上記の3つの関係を利用して,より優れたコントラクト理解とCCEの改善を実現するための新しいフレームワークであるConReaderを提案する。
論文 参考訳(メタデータ) (2022-10-17T02:15:18Z) - Detecting Logical Relation In Contract Clauses [94.85352502638081]
契約における節間の論理的関係の抽出を自動化する手法を開発する。
結果として得られたアプローチは、コントラクト作者が節間の潜在的な論理的衝突を検出するのに役立つだろう。
論文 参考訳(メタデータ) (2021-11-02T19:26:32Z) - CLAUSEREC: A Clause Recommendation Framework for AI-aided Contract
Authoring [7.3246387015020025]
本稿では,契約書作成者の支援と促進に向けた第一歩として,条項推薦の課題を紹介する。
まず、特定の節型がコントラクトに追加されるかどうかを予測し、次に、契約コンテキストに基づいて、与えられた型のトップ節を推奨する2段階パイプラインを提案する。
論文 参考訳(メタデータ) (2021-10-26T09:20:16Z) - Lexically-constrained Text Generation through Commonsense Knowledge
Extraction and Injection [62.071938098215085]
我々は、ある入力概念のセットに対して妥当な文を生成することを目的としているcommongenベンチマークに焦点を当てる。
生成したテキストの意味的正しさを高めるための戦略を提案する。
論文 参考訳(メタデータ) (2020-12-19T23:23:40Z) - A Benchmark for Lease Contract Review [9.249443355045969]
契約審査において重要な役割を果たす2つの異なるタイプの要素を検出する問題に取り組む。
後者は、署名当事者の1つ以上の場合、何らかの危険または潜在的に問題のある状況があることを示す用語または文である。
我々は179のリース契約書の新しいベンチマークデータセットをリリースし、それらに含まれるエンティティと赤いフラグを手動で注釈付けしました。
論文 参考訳(メタデータ) (2020-10-20T15:50:50Z) - The Extraordinary Failure of Complement Coercion Crowdsourcing [50.599433903377374]
クラウドソーシングは近年,言語アノテーションの収集を緩和し,スケールアップしている。
本研究の目的は,この現象の注釈付きデータを2つの既知のタスク – 明示的補完と自然言語推論 – に還元することで収集することである。
どちらの場合も、クラウドソーシングは合意のスコアが低かった。
論文 参考訳(メタデータ) (2020-10-12T19:04:04Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。