論文の概要: LexDrafter: Terminology Drafting for Legislative Documents using Retrieval Augmented Generation
- arxiv url: http://arxiv.org/abs/2403.16295v1
- Date: Sun, 24 Mar 2024 21:02:35 GMT
- ステータス: 処理完了
- システム内更新日: 2024-03-26 16:36:48.994916
- Title: LexDrafter: Terminology Drafting for Legislative Documents using Retrieval Augmented Generation
- Title(参考訳): LexDrafter:Retrieval Augmented Generation を用いた法的文書のターミノロジードラフト
- Authors: Ashish Chouhan, Michael Gertz,
- Abstract要約: 欧州議会,評議会及び委員会の共同実務ガイドによれば,法的文書に使用される用語は,一貫性がある。
新たな立法文書を起草している間に、既存の定義に関する洞察を提供し、文書のコンテキストに基づいた新しい用語の定義を支援する枠組みを持つことで、異なる規則をまたいだ調和した法的定義をサポートし、曖昧さを避けることができる。
本稿では、検索拡張生成(RAG)と、異なる立法文書に存在する既存の用語定義を用いて、立法文書の定義項目の起草を支援するフレームワークであるLexDrafterを紹介する。
- 参考スコア(独自算出の注目度): 4.189643331553922
- License: http://creativecommons.org/licenses/by-nc-nd/4.0/
- Abstract: With the increase in legislative documents at the EU, the number of new terms and their definitions is increasing as well. As per the Joint Practical Guide of the European Parliament, the Council and the Commission, terms used in legal documents shall be consistent, and identical concepts shall be expressed without departing from their meaning in ordinary, legal, or technical language. Thus, while drafting a new legislative document, having a framework that provides insights about existing definitions and helps define new terms based on a document's context will support such harmonized legal definitions across different regulations and thus avoid ambiguities. In this paper, we present LexDrafter, a framework that assists in drafting Definitions articles for legislative documents using retrieval augmented generation (RAG) and existing term definitions present in different legislative documents. For this, definition elements are built by extracting definitions from existing documents. Using definition elements and RAG, a Definitions article can be suggested on demand for a legislative document that is being drafted. We demonstrate and evaluate the functionality of LexDrafter using a collection of EU documents from the energy domain. The code for LexDrafter framework is available at https://github.com/achouhan93/LexDrafter.
- Abstract(参考訳): EUにおける立法文書の増加に伴い、新しい用語の数と定義も増加している。
欧州議会,評議会及び委員会の共同実務ガイドによれば,法的文書で使用される用語は一貫しており,同一の概念は,通常,法律又は技術言語においてその意味から離れることなく,表現される。
したがって、新しい立法文書を起草している間に、既存の定義についての洞察を提供し、文書の文脈に基づく新しい用語の定義を支援する枠組みを持つことで、異なる規則をまたいだ調和した法的定義をサポートし、あいまいさを避けることができる。
本稿では、検索拡張生成(RAG)と、異なる立法文書に存在する既存の用語定義を用いて、立法文書の定義項目の起草を支援するフレームワークであるLexDrafterを提案する。
そのため、定義要素は既存の文書から定義を抽出することによって構築される。
定義要素とRAGを使用することで、起草中の立法文書の要求に応じて定義項目を提案できる。
エネルギー領域からのEU文書の収集を用いてLexDrafterの機能の実証と評価を行った。
LexDrafterフレームワークのコードはhttps://github.com/achouhan93/LexDrafterで公開されている。
関連論文リスト
- Contextual Document Embeddings [77.22328616983417]
本稿では,コンテキスト化された文書埋め込みのための2つの補完手法を提案する。
第一に、文書近傍を明示的にバッチ内コンテキスト損失に組み込む別のコントラスト学習目標である。
第二に、隣接する文書情報をエンコードされた表現に明示的にエンコードする新しいコンテキストアーキテクチャ。
論文 参考訳(メタデータ) (2024-10-03T14:33:34Z) - Inferring Scientific Cross-Document Coreference and Hierarchy with Definition-Augmented Relational Reasoning [7.086262532457526]
本稿では,全文文献を検索することで,概念記述の文脈依存的な定義を生成する手法を提案する。
さらに,2つの概念がどのように関連しているか,あるいは異なるのかを記述したリレーショナル定義を生成し,論文間のリンクの推論に関わる爆発に対処する効率的な再分類アプローチを設計する。
論文 参考訳(メタデータ) (2024-09-23T15:20:27Z) - PropSegmEnt: A Large-Scale Corpus for Proposition-Level Segmentation and
Entailment Recognition [63.51569687229681]
文中の各命題の文的含意関係を個別に認識する必要性について論じる。
提案するPropSegmEntは45K以上の提案のコーパスであり, 専門家によるアノテートを行う。
我々のデータセット構造は、(1)文書内の文章を命題の集合に分割し、(2)異なるが、トポジカルに整合した文書に対して、各命題の含意関係を分類するタスクに類似している。
論文 参考訳(メタデータ) (2022-12-21T04:03:33Z) - GERE: Generative Evidence Retrieval for Fact Verification [57.78768817972026]
本稿では,ジェネレーション方式で証拠を検索する最初のシステムであるGEREを提案する。
FEVERデータセットの実験結果は、GEREが最先端のベースラインよりも大幅に改善されていることを示している。
論文 参考訳(メタデータ) (2022-04-12T03:49:35Z) - Corpus for Automatic Structuring of Legal Documents [1.8025738207124173]
本稿では,トピックとコヒーレントな部分に分けられる法的判断文書のコーパスを英語で紹介する。
注釈付きコーパスに基づく法文書における修辞的役割を自動的に予測するベースラインモデルを開発した。
要約および法的判断予測のタスクにおける性能向上のための修辞的役割の応用について述べる。
論文 参考訳(メタデータ) (2022-01-31T11:12:44Z) - Coherence-Based Distributed Document Representation Learning for
Scientific Documents [9.646001537050925]
本研究では,科学文書の表現を学習するために,結合テキストペア埋め込み(CTPE)モデルを提案する。
我々は、異なる文書から2つの部分を持つ非結合テキストペアを構築するために、負のサンプリングを使用する。
テキストペアが結合されているか、アンカップリングされているかを判断するためにモデルを訓練し、結合されたテキストペアの埋め込みを文書の埋め込みとして使用する。
論文 参考訳(メタデータ) (2022-01-08T15:29:21Z) - Semantic Segmentation of Legal Documents via Rhetorical Roles [3.285073688021526]
本稿では,法的文書を意味的に一貫性のある単位に分割する修辞的役割 (RR) システムを提案する。
我々は,法的文書をセグメント化するための補助的タスクとして,文書の修辞的役割ラベルシフトを用いたマルチタスク学習に基づくディープラーニングモデルを開発した。
論文 参考訳(メタデータ) (2021-12-03T10:49:19Z) - A Novel Corpus of Discourse Structure in Humans and Computers [55.74664144248097]
約27,000節からなる445の人文・コンピュータ生成文書からなる新しいコーパスを提示する。
コーパスは、フォーマルな言論と非公式な言論の両方をカバーし、微調整のGPT-2を用いて生成された文書を含んでいる。
論文 参考訳(メタデータ) (2021-11-10T20:56:08Z) - Legal Search in Case Law and Statute Law [12.697393184074457]
本稿では,典型的法的文書収集の文脈において,文書の相互関連性を識別する手法について述べる。
本稿では、教師あり教師なし学習を含む一般化言語モデルの使用状況について概観する。
論文 参考訳(メタデータ) (2021-08-23T12:51:24Z) - LexSubCon: Integrating Knowledge from Lexical Resources into Contextual
Embeddings for Lexical Substitution [76.615287796753]
本稿では,コンテキスト埋め込みモデルに基づくエンドツーエンドの語彙置換フレームワークであるLexSubConを紹介する。
これは文脈情報と構造化語彙資源からの知識を組み合わせることで達成される。
我々の実験によると、LexSubConはLS07とCoInCoベンチマークデータセットで従来の最先端の手法よりも優れていた。
論文 参考訳(メタデータ) (2021-07-11T21:25:56Z) - SPECTER: Document-level Representation Learning using Citation-informed
Transformers [51.048515757909215]
SPECTERは、Transformer言語モデルの事前学習に基づいて、科学文書の文書レベルの埋め込みを生成する。
SciDocsは、引用予測から文書分類、レコメンデーションまでの7つの文書レベルのタスクからなる新しい評価ベンチマークである。
論文 参考訳(メタデータ) (2020-04-15T16:05:51Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。