論文の概要: Legal Requirements Translation from Law
- arxiv url: http://arxiv.org/abs/2507.02846v1
- Date: Thu, 03 Jul 2025 17:53:48 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-07-04 15:37:16.790278
- Title: Legal Requirements Translation from Law
- Title(参考訳): 法律の翻訳に関する法律上の要件
- Authors: Anmol Singhal, Travis Breaux,
- Abstract要約: 法文の正統表現を自動生成する手法として,テキストの包含とテキスト内学習に基づく手法を提案する。
我々は、米国13州データ漏洩通知法に対するアプローチを評価し、我々の生成した表現がテストケースの89.4%を通過し、それぞれ82.2と88.7の精度とリコールを達成することを実証した。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Software systems must comply with legal regulations, which is a resource-intensive task, particularly for small organizations and startups lacking dedicated legal expertise. Extracting metadata from regulations to elicit legal requirements for software is a critical step to ensure compliance. However, it is a cumbersome task due to the length and complex nature of legal text. Although prior work has pursued automated methods for extracting structural and semantic metadata from legal text, key limitations remain: they do not consider the interplay and interrelationships among attributes associated with these metadata types, and they rely on manual labeling or heuristic-driven machine learning, which does not generalize well to new documents. In this paper, we introduce an approach based on textual entailment and in-context learning for automatically generating a canonical representation of legal text, encodable and executable as Python code. Our representation is instantiated from a manually designed Python class structure that serves as a domain-specific metamodel, capturing both structural and semantic legal metadata and their interrelationships. This design choice reduces the need for large, manually labeled datasets and enhances applicability to unseen legislation. We evaluate our approach on 13 U.S. state data breach notification laws, demonstrating that our generated representations pass approximately 89.4% of test cases and achieve a precision and recall of 82.2 and 88.7, respectively.
- Abstract(参考訳): ソフトウェアシステムは、特に専門的な法的専門知識を持たない小さな組織やスタートアップにとって、リソース集約的なタスクである法的規制に従わなければならない。
規則からメタデータを抽出して、ソフトウェアの法的要件を引き出すことは、コンプライアンスを確保するための重要なステップである。
しかし、法文の長さと複雑な性質から、面倒な作業である。
従来の研究は、法的テキストから構造的メタデータと意味的メタデータを抽出する自動化手法を追求してきたが、重要な制限は、これらのメタデータタイプに関連する属性間の相互作用や相互関係を考慮せず、手動のラベル付けやヒューリスティック駆動型機械学習に依存しており、新しい文書にはあまり当てはまらないことである。
本稿では,Python コードとしてエンコード可能かつ実行可能な法文の正規表現を自動生成するための,テキストの包含とテキスト内学習に基づくアプローチを提案する。
私たちの表現は、ドメイン固有のメタモデルとして機能し、構造的および意味的な法的メタデータとそれらの相互関係をキャプチャする、手動で設計されたPythonクラス構造からインスタンス化されます。
この設計選択は、大規模で手動でラベル付けされたデータセットの必要性を減らし、目に見えない法律の適用性を高める。
我々は、米国13州データ漏洩通知法に対するアプローチを評価し、我々の生成した表現がテストケースの89.4%を通過し、それぞれ82.2と88.7の精度とリコールを達成することを実証した。
関連論文リスト
- Transformer-Based Extraction of Statutory Definitions from the U.S. Code [0.0]
定義項, 定義, 範囲を米国法典(U.S.C.)から自動的に抽出する高度NLPシステムを提案する。
我々の最良のモデルは96.8%の精度と98.9%のリコール(98.2%F1スコア)を達成する
この研究は、下流の法的推論タスクの基礎を確立しながら、アクセシビリティの向上と法情報の理解に寄与する。
論文 参考訳(メタデータ) (2025-04-23T02:09:53Z) - Improving the Accuracy and Efficiency of Legal Document Tagging with Large Language Models and Instruction Prompts [0.6554326244334866]
Legal-LLMはLarge Language Models (LLM) の命令追従機能を利用する新しいアプローチである。
提案手法は,マイクロF1とマクロF1スコアを用いて,POSTURE50KとEURLEX57Kの2つのベンチマークデータセット上で評価する。
論文 参考訳(メタデータ) (2025-04-12T18:57:04Z) - Design and implementation of tools to build an ontology of Security Requirements for Internet of Medical Things [2.446672595462589]
インターネット・オブ・メディカル・モノ(IoMT)の世界では、メーカーやサードパーティは、法律と仕様の両方で示されるセキュリティ要件を認識しなければならない。
関連する法則と仕様(欧州の文脈)を表わすオントロジーは非常に有用である。
検討された仕様文書の量とサイズが非常に多いため,自然文からオントロジーへの移行を簡単にするための方法論とツールが導入された。
論文 参考訳(メタデータ) (2025-01-06T15:04:45Z) - DELTA: Pre-train a Discriminative Encoder for Legal Case Retrieval via Structural Word Alignment [55.91429725404988]
判例検索のための識別モデルであるDELTAを紹介する。
我々は浅層デコーダを利用して情報ボトルネックを作り、表現能力の向上を目指しています。
本手法は, 判例検索において, 既存の最先端手法よりも優れている。
論文 参考訳(メタデータ) (2024-03-27T10:40:14Z) - From Text to Structure: Using Large Language Models to Support the
Development of Legal Expert Systems [0.6249768559720122]
法律に焦点をあてたルールベースのエキスパートシステムは、法制が法律にどのように適用されるかを理解して、有益なコンテキストと情報を提供するのを支援することができる。
本稿では,GPT-4のような大規模言語モデル(LLM)が,法律から構造化表現を自動的に抽出できる程度について検討する。
法律決定支援システムのJoursBotの方法論によれば、LSMを使って法律から経路を作成し、その経路を評価し、それらを手作業で作成した経路と比較する。
論文 参考訳(メタデータ) (2023-11-01T18:31:02Z) - SAILER: Structure-aware Pre-trained Language Model for Legal Case
Retrieval [75.05173891207214]
判例検索は知的法体系において中心的な役割を果たす。
既存の言語モデルの多くは、異なる構造間の長距離依存関係を理解するのが難しい。
本稿では, LEgal ケース検索のための構造対応プレトランザクショナル言語モデルを提案する。
論文 参考訳(メタデータ) (2023-04-22T10:47:01Z) - Using Document Similarity Methods to create Parallel Datasets for Code
Translation [60.36392618065203]
あるプログラミング言語から別のプログラミング言語へのソースコードの翻訳は、重要で時間を要する作業です。
本稿では、文書類似性手法を用いて、ノイズの多い並列データセットを作成することを提案する。
これらのモデルは、妥当なレベルのノイズに対して、地上の真実に基づいて訓練されたモデルと相容れない性能を示す。
論文 参考訳(メタデータ) (2021-10-11T17:07:58Z) - Automatic Extraction of Rules Governing Morphological Agreement [103.78033184221373]
原文から第一パス文法仕様を抽出する自動フレームワークを開発する。
我々は、世界の多くの言語の文法の中核にあるモルフォシンタクティックな現象である合意を記述する規則の抽出に焦点をあてる。
我々のフレームワークはUniversal Dependenciesプロジェクトに含まれるすべての言語に適用され、有望な結果が得られます。
論文 参考訳(メタデータ) (2020-10-02T18:31:45Z) - SPECTER: Document-level Representation Learning using Citation-informed
Transformers [51.048515757909215]
SPECTERは、Transformer言語モデルの事前学習に基づいて、科学文書の文書レベルの埋め込みを生成する。
SciDocsは、引用予測から文書分類、レコメンデーションまでの7つの文書レベルのタスクからなる新しい評価ベンチマークである。
論文 参考訳(メタデータ) (2020-04-15T16:05:51Z) - Procedural Reading Comprehension with Attribute-Aware Context Flow [85.34405161075276]
手続き的なテキストは、しばしばエンティティの上で起こるプロセスを記述する。
本稿では,テキストを一般的な形式に翻訳することで,手続き的読解のためのアルゴリズムを提案する。
論文 参考訳(メタデータ) (2020-03-31T00:06:29Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。