Fugu-MT 論文翻訳(概要): De Jure: Iterative LLM Self-Refinement for Structured Extraction of Regulatory Rules

論文の概要: De Jure: Iterative LLM Self-Refinement for Structured Extraction of Regulatory Rules

arxiv url: http://arxiv.org/abs/2604.02276v1
Date: Thu, 02 Apr 2026 17:06:50 GMT
ステータス: 翻訳完了
システム内更新日: 2026-04-03 14:21:10.958098
Title: De Jure: Iterative LLM Self-Refinement for Structured Extraction of Regulatory Rules
Title（参考訳）: De Jure: 規制ルールの構造化抽出のための反復LDM自己精製
Authors: Keerat Guliani, Deepkamal Gill, David Landsman, Nima Eshraghi, Krishna Kumar, Lovedeep Gondara,
Abstract要約: De Jureは、完全に自動化されたドメインに依存しないパイプラインで、生文書から構造化された規制ルールを抽出する。 De Jureは、金融、ヘルスケア、AIガバナンスにまたがる3つの規制コーパスの4つのモデルで評価します。
参考スコア（独自算出の注目度）: 1.6865681749065902
License: http://creativecommons.org/licenses/by-nc-sa/4.0/
Abstract: Regulatory documents encode legally binding obligations that LLM-based systems must respect. Yet converting dense, hierarchically structured legal text into machine-readable rules remains a costly, expert-intensive process. We present De Jure, a fully automated, domain-agnostic pipeline for extracting structured regulatory rules from raw documents, requiring no human annotation, domain-specific prompting, or annotated gold data. De Jure operates through four sequential stages: normalization of source documents into structured Markdown; LLM-driven semantic decomposition into structured rule units; multi-criteria LLM-as-a-judge evaluation across 19 dimensions spanning metadata, definitions, and rule semantics; and iterative repair of low-scoring extractions within a bounded regeneration budget, where upstream components are repaired before rule units are evaluated. We evaluate De Jure across four models on three regulatory corpora spanning finance, healthcare, and AI governance. On the finance domain, De Jure yields consistent and monotonic improvement in extraction quality, reaching peak performance within three judge-guided iterations. De Jure generalizes effectively to healthcare and AI governance, maintaining high performance across both open- and closed-source models. In a downstream compliance question-answering evaluation via RAG, responses grounded in De Jure extracted rules are preferred over prior work in 73.8% of cases at single-rule retrieval depth, rising to 84.0% under broader retrieval, confirming that extraction fidelity translates directly into downstream utility. These results demonstrate that explicit, interpretable evaluation criteria can substitute for human annotation in complex regulatory domains, offering a scalable and auditable path toward regulation-grounded LLM alignment.
Abstract（参考訳）: 規制文書は、LLMベースのシステムが尊重しなければならない法的拘束義務を符号化している。しかし、密集した階層的に構造化された法律文を機械可読なルールに変換することは、依然として費用がかかる専門家による集中的なプロセスである。 De Jureは、完全に自動化されたドメインに依存しないパイプラインで、生文書から構造化された規制ルールを抽出し、人間のアノテーションやドメイン固有のプロンプト、注釈付きゴールドデータを必要としない。 De Jureは、構造化マークダウンへのソース文書の正規化、構造化ルール単位へのLLM駆動のセマンティック分解、メタデータ、定義、ルールセマンティクスにまたがる19次元にわたる多基準LCM-as-a-judge評価、境界再生予算内での低スコア抽出の反復的修復、そしてルール単位を評価する前に上流コンポーネントを修復する。 De Jureは、金融、ヘルスケア、AIガバナンスにまたがる3つの規制コーパスの4つのモデルで評価します。ファイナンス領域では、De Jureは、抽出品質の一貫性と単調な改善をもたらし、3つの審査誘導イテレーションでピークパフォーマンスに達する。 De Jureは、ヘルスケアとAIガバナンスを効果的に一般化し、オープンソースモデルとクローズドソースモデルの両方にわたってハイパフォーマンスを維持する。 RAGによる下流コンプライアンス質問応答評価では、De Jure抽出規則に基づく応答は、シングルルール検索深度で73.8%のケースにおいて、より広範囲な検索で84.0%まで上昇し、抽出忠実度が下流ユーティリティに直接変換されることを確認する。これらの結果から、複雑な規制領域において、明示的で解釈可能な評価基準が人間のアノテーションの代わりになり、規制対象のLLMアライメントに向けたスケーラブルで監査可能なパスが提供されることが示された。

関連論文リスト

Optimizing RAG Rerankers with LLM Feedback via Reinforcement Learning [47.963236269307735]
リランカはRetrieval-Augmented Generationの検索結果の精錬において重要な役割を果たす。現在のリグレードモデルは通常、ダウンストリーム生成プロセスから切り離された静的な人間アノテートされた関連ラベルに独立して最適化される。本稿では,LLMの生成品質と直接整合する強化学習フレームワークであるReRanking Preference Optimization(RRPO)を紹介する。
論文参考訳（メタデータ） (2026-04-02T14:19:47Z)
RegGuard: AI-Powered Retrieval-Enhanced Assistant for Pharmaceutical Regulatory Compliance [3.354018798133739]
RegGuardは、異質な規制テキストの解釈を自動化するために設計された産業規模のAIアシスタントである。このシステムはセキュアなパイプラインを通じて異質なドキュメントソースを取り込みます。 RegGuardは、応答品質を、関連性、基礎性、コンテキストの焦点という点で特に改善する。
論文参考訳（メタデータ） (2026-01-25T13:11:39Z)
LegalMALR:Multi-Agent Query Understanding and LLM-Based Reranking for Chinese Statute Retrieval [10.997604609194033]
法定検索は法的援助と司法決定支援に不可欠である。現実の法的なクエリは暗黙的で、複数発行され、口語または未特定の形で表現されることが多い。本稿では,マルチエージェントクエリ理解システムとゼロショット大文字生成モジュールを統合した検索フレームワークであるLegalMALRを提案する。
論文参考訳（メタデータ） (2026-01-25T04:44:56Z)
Inference-Time Scaling of Verification: Self-Evolving Deep Research Agents via Test-Time Rubric-Guided Verification [71.98473277917962]
近年のDeep Research Agents (DRA) の進歩は、自動知識発見と問題解決に変化をもたらしている。本稿では,政策モデルのアウトプットを反復的に検証することで,エージェントの能力を自己進化させる手法を提案する。検証の非対称性を生かしたルーブリックスに基づく結果報酬検証器であるDeepVerifierを提案する。
論文参考訳（メタデータ） (2026-01-22T09:47:31Z)
Towards Comprehensive Stage-wise Benchmarking of Large Language Models in Fact-Checking [64.97768177044355]
大規模言語モデル(LLM)は、現実のファクトチェックシステムにますます多くデプロイされている。 FactArenaは、完全に自動化されたアリーナスタイルの評価フレームワークである。本研究では,静的クレーム検証精度とエンドツーエンドのファクトチェック能力の相違点を明らかにした。
論文参考訳（メタデータ） (2026-01-06T02:51:56Z)
Judging by the Rules: Compliance-Aligned Framework for Modern Slavery Statement Monitoring [24.13989765643719]
現代の奴隷制度は世界中で何百万人もの人々に影響を与えており、現代の奴隷制度法のような規制の枠組みでは、企業が詳細な開示を公表する必要がある。これらのステートメントは曖昧で矛盾することが多く、手作業によるレビューの時間とスケールが難しくなる。専門家の監視を維持しつつルールレベルのコンプライアンス検証にAIを活用する新しいフレームワークを提案する。
論文参考訳（メタデータ） (2025-11-11T03:41:44Z)
Learning to Route: A Rule-Driven Agent Framework for Hybrid-Source Retrieval-Augmented Generation [55.47971671635531]
大言語モデル(LLM)は、一般質問回答(QA)において顕著な性能を示した。 Retrieval-Augmented Generation (RAG)は、LLMを外部知識で強化することで、この制限に対処する。既存のシステムは、主に構造化されていないドキュメントに依存しているが、主にリレーショナルデータベースを見下ろしている。
論文参考訳（メタデータ） (2025-09-30T22:19:44Z)
All for law and law for all: Adaptive RAG Pipeline for Legal Research [0.8819595592190884]
Retrieval-Augmented Generation (RAG)は、テキスト生成タスクのアプローチ方法を変えました。この作業では、以前のベースラインを改善した、新しいエンドツーエンドのRAGパイプラインを導入している。
論文参考訳（メタデータ） (2025-08-18T17:14:03Z)
RIRAG: Regulatory Information Retrieval and Answer Generation [51.998738311700095]
本稿では,質問を自動生成し,関連する規制通路と組み合わせる,問合せペアを生成するタスクを紹介する。我々は、Abu Dhabi Global Markets (ADGM) の財務規制文書から得られた27,869の質問を含むObliQAデータセットを作成する。本稿では,RIRAG(Regulation Information Retrieval and Answer Generation)システムをベースラインとして設計し,新しい評価基準であるRePASを用いて評価する。
論文参考訳（メタデータ） (2024-09-09T14:44:19Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。