論文の概要: ComplianceNLP: Knowledge-Graph-Augmented RAG for Multi-Framework Regulatory Gap Detection
- arxiv url: http://arxiv.org/abs/2604.23585v1
- Date: Sun, 26 Apr 2026 07:44:50 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-04-28 17:12:07.44806
- Title: ComplianceNLP: Knowledge-Graph-Augmented RAG for Multi-Framework Regulatory Gap Detection
- Title(参考訳): ComplianceNLP: マルチフレーム制御ギャップ検出のための知識グラフ拡張RAG
- Authors: Dongxin Guo, Jikun Wu, Siu Ming Yiu,
- Abstract要約: 金融機関は毎年6万件以上の規制イベントを運営している。
業界は2008年の金融危機以来、罰金と決済で3億ドル以上を支払っている。
規制変更を自動的に監視し、構造化された義務を抽出し、コンプライアンスギャップを識別するエンドツーエンドシステムであるComplianceNLPを提案する。
- 参考スコア(独自算出の注目度): 13.891522069967507
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Financial institutions must track over 60,000 regulatory events annually, overwhelming manual compliance teams; the industry has paid over USD 300 billion in fines and settlements since the 2008 financial crisis. We present ComplianceNLP, an end-to-end system that automatically monitors regulatory changes, extracts structured obligations, and identifies compliance gaps against institutional policies. The system integrates three components: (1) a knowledge-graph-augmented RAG pipeline grounding generations in a regulatory knowledge graph of 12,847 provisions across SEC, MiFID II, and Basel III; (2) multi-task obligation extraction combining NER, deontic classification, and cross-reference resolution over a shared LEGAL-BERT encoder; and (3) compliance gap analysis that maps obligations to internal policies with severity-aware scoring. On our benchmark, ComplianceNLP achieves 87.7 F1 on gap detection, outperforming GPT-4o+RAG by +3.5 F1, with 94.2% grounding accuracy ($r=0.83$ vs. human judgments) and 83.4 F1 under realistic end-to-end error propagation. Ablations show that knowledge-graph re-ranking contributes the largest marginal gain (+4.6 F1), confirming that structural regulatory knowledge is critical for cross-reference-heavy tasks. Domain-specific knowledge distillation (70B $\to$ 8B) combined with Medusa speculative decoding yields $2.8\times$ inference speedup; regulatory text's low entropy ($H=2.31$ bits vs. $3.87$ general text) produces 91.3% draft-token acceptance rates. In four months of parallel-run deployment processing 9,847 updates at a financial institution, the system achieved 96.0% estimated recall and 90.7% precision, with a $3.1\times$ sustained analyst efficiency gain. We report deployment lessons on trust calibration, GRC integration, and distributional shift monitoring for regulated-domain NLP.
- Abstract(参考訳): 金融機関は2008年の金融危機以来、年間6万件以上の規制イベントを追跡しなければならない。
本稿では、規制変更を自動的に監視し、構造的義務を抽出し、制度的政策に対するコンプライアンスギャップを識別するエンドツーエンドシステムであるComplianceNLPを提案する。
本システムは,(1) SEC, MiFID II, Basel III にまたがる 12,847 の規制知識グラフに,知識グラフを付加した RAG パイプラインを代用し,(2) NER, Deontic 分類,および共有 LEGAL-BERT エンコーダ上での相互参照解決を組み合わせたマルチタスク義務抽出,(3) 重大度対応スコアリングによる内部ポリシーに義務をマップするコンプライアンスギャップ解析を行う。
ベンチマークでは、ギャップ検出において87.7 F1を達成し、GPT-4o+RAGを+3.5 F1で上回り、94.2%の根拠精度(r=0.83$ vs. Human judgments)と83.4 F1を現実的なエンドツーエンドエラー伝搬下で達成した。
アブレーションは、知識グラフの再ランクが最大の限界利得(+4.6 F1)に寄与し、構造的規制知識が相互参照の重いタスクに不可欠であることを確認している。
ドメイン固有の知識蒸留(70B$\to$8B)とメデューサの投機的復号化(英語版)が組み合わさって、2.8\times$推論のスピードアップ、規制テキストの低エントロピー(H=2.31$ bits vs. $3.87$ general text)は91.3%のドラフト・トークンの受け入れ率を生み出す。
金融機関での4ヶ月間の並列展開処理9,847回の更新で、システムは96.0%のリコールと90.7%の精度を達成した。
規制ドメインNLPの信頼性校正, GRC 統合, 分散シフト監視に関するデプロイメントレッスンについて報告する。
関連論文リスト
- FinGround: Detecting and Grounding Financial Hallucinations via Atomic Claim Verification [13.891522069967507]
FinGroundは、ファイナンシャルドキュメントQAのための検証済みの地上パイプラインである。
ステージ1は、テキストとテーブル上でファイナンス対応のハイブリッド検索を行う。
ステージ2は6種類の財政分類で分類された原子的主張に答えを分解する。
ステージ3は、段落とテーブルセルレベルの引用で、サポートされたクレームを書き換える。
論文 参考訳(メタデータ) (2026-04-26T07:52:59Z) - Explainable Graph Neural Networks for Interbank Contagion Surveillance: A Regulatory-Aligned Framework for the U.S. Banking Sector [0.40611352512781873]
ST-GATフレームワークは、銀行の早期警戒標識を検出するための説明可能なGNNベースのソリューションとして機能するために開発された。
58四半期のスナップショット(2010Q1-2024Q2)で8,103のFDIC保険機関をモデル化する。
このフレームワークは、すべてのGNNアーキテクチャの中で最も高い AUPRC を達成する。
論文 参考訳(メタデータ) (2026-04-14T19:07:28Z) - Shapley Value-Guided Adaptive Ensemble Learning for Explainable Financial Fraud Detection with U.S. Regulatory Compliance Validation [0.34376560669160394]
金融犯罪は毎年320億ドル以上をアメリカの機関が負担している。
不正検出のための多くのAIツールは、透明で監査可能な説明を提供することができないブラックボックスとして動作する。
本研究は, 忠実度と安定性の面から, 説明の質を徹底的に評価する。
論文 参考訳(メタデータ) (2026-04-14T19:00:20Z) - FinReflectKG -- HalluBench: GraphRAG Hallucination Benchmark for Financial Question Answering Systems [0.0]
現在の知識グラフ(KG)によるQAシステムは幻覚を検出するための体系的なメカニズムを欠いている。
SEC10-K申請に対するKG強化財務QAにおける幻覚検出手法を評価するためのベンチマークであるFinBench-QA-Hallucinationを紹介する。
本研究は、現在のKG強化システムにおける脆弱性を浮き彫りにし、信頼性の高い金融情報システムを構築するための洞察を提供する。
論文 参考訳(メタデータ) (2026-03-11T04:37:53Z) - Scalable Multi-Task Low-Rank Model Adaptation [43.22544779625565]
マルチタスク低ランク適応(LoRA)を多数のタスクに拡張すると、破滅的なパフォーマンス劣化を引き起こす。
規則化や動的ルーティングのような既存のソリューションは、基本的なトレードオフによって制約されるため、スケールで失敗するのです。
3つの新しい設計を持つスケーラブルなソリューションであるmtLoRAを提案する。
論文 参考訳(メタデータ) (2026-03-02T06:57:11Z) - PRIME: A Process-Outcome Alignment Benchmark for Verifiable Reasoning in Mathematics and Engineering [71.15346406323827]
本稿では,プロセス・アウトカム・アライメント・アライメント・検証における検証結果を評価するベンチマークであるPRIMEを紹介する。
現在の検証器は、しばしば導出欠陥を検出するのに失敗する。
本稿では,PRIMEで選択した検証手法を利用したプロセス認識型RLVRトレーニングパラダイムを提案する。
論文 参考訳(メタデータ) (2026-02-12T04:45:01Z) - Information Fidelity in Tool-Using LLM Agents: A Martingale Analysis of the Model Context Protocol [69.11739400975445]
モデルコンテキストプロトコル(MCP)エージェントにおけるエラー蓄積を解析するための最初の理論的枠組みを紹介する。
累積歪みが線形成長と高確率偏差を$O(sqrtT)$で表すことを示す。
主な発見は、意味重み付けは歪みを80%減らし、周期的再接地は、エラー制御の約9ステップごとに十分である。
論文 参考訳(メタデータ) (2026-02-10T21:08:53Z) - Safe Urban Traffic Control via Uncertainty-Aware Conformal Prediction and World-Model Reinforcement Learning [43.06827300023392]
STREAM-RLは、不確実性誘導型適応型コンフォーマルフォアキャスター、コンフォーマル残留流ネットワーク、不確実性誘導型セーフワールドモデルRLエージェントである。
複数の実世界の交通軌跡データの実験では、STREAM-RLは91.4%のカバレッジ効率を達成し、FDRを4.1%の信頼性で制御し、標準のPPOの69%に比べて安全性を95.2%向上している。
論文 参考訳(メタデータ) (2026-02-04T18:10:59Z) - Towards a Science of Scaling Agent Systems [79.64446272302287]
エージェント評価の定義を定式化し,エージェント量,コーディネーション構造,モデル,タスク特性の相互作用として,スケーリング法則を特徴付ける。
協調指標を用いて予測モデルを導出し,R2=0をクロスバリデーションし,未知のタスク領域の予測を可能にする。
ツールコーディネーショントレードオフ: 固定的な計算予算の下では, ツールヘビータスクはマルチエージェントのオーバーヘッドから不均衡に悩まされ, 2) 能力飽和: 調整が減少または負のリターンを, 単一エージェントのベースラインが45%を超えると達成できる。
論文 参考訳(メタデータ) (2025-12-09T06:52:21Z) - LLM Output Drift: Cross-Provider Validation & Mitigation for Financial Workflows [0.5798758080057375]
非決定論的出力(アウトプットドリフト)は監査性と信頼を損なう。
規制された金融業務に関する5つのモデルアーキテクチャ間のドリフトを定量化する。
この発見は、より大きなモデルがプロダクションデプロイメントに普遍的に優れているという従来の仮定に挑戦する。
論文 参考訳(メタデータ) (2025-11-10T19:54:00Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。