論文の概要: FinGuard: Detecting Financial Regulatory Non-Compliance in LLM Interactions
- arxiv url: http://arxiv.org/abs/2605.29427v1
- Date: Thu, 28 May 2026 06:20:45 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-05-30 02:45:55.85059
- Title: FinGuard: Detecting Financial Regulatory Non-Compliance in LLM Interactions
- Title(参考訳): FinGuard: LLMインタラクションにおける金融規制非コンプライアンスの検出
- Authors: Huaixia Dou, Jie Zhu, Minghao Wu, Shuo Jiang, Junhui Li, Lifan Guo, Feng Chen, Chi Zhang,
- Abstract要約: 既存のガードモデルは、特定の金融規制に根ざした一般的な損害と見落としに関する違反に基づいて構築されている。
このギャップを規制文書を直接運用する規制駆動のパイプラインで解決する。
textbfFinGuard-Benchを、金融規制コンプライアンス検出のための最初のベンチマークとしてリリースしました。
- 参考スコア(独自算出の注目度): 27.4361627975349
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: As large language models (LLMs) are increasingly deployed in financial services, a single non-compliant interaction can expose institutions to regulatory penalties and direct consumer harm. Existing guard models are built around general harm taxonomies and overlook violations grounded in specific financial regulations. We address this gap with a regulation-driven pipeline that operates directly on regulatory documents, inducing a financial compliance risk taxonomy and synthesizing grounded training data without any predefined violation categories. Instantiating the pipeline on Chinese financial regulations, we release \textbf{FinGuard-Bench}, to our knowledge the first benchmark for financial regulatory compliance detection, with expert-annotated labels at both the query and response levels. We further train \textbf{FinGuard}, a financial compliance detection model built on Qwen3-8B and trained on the regulation-grounded data via supervised fine-tuning and self-play reinforcement learning. On FinGuard-Bench, FinGuard substantially outperforms all baselines, including dedicated guard models and much larger general-purpose LLMs such as Qwen3.5-397B-A17B and GPT-5.1. Furthermore, FinGuard also preserves general safety capabilities and adapts to unseen institution-specific policies using policy documents alone. We will publicly release the code, prompts, and resources used in this work on GitHub.
- Abstract(参考訳): 大規模言語モデル(LLM)が金融サービスにますます導入されるにつれて、単一の非準拠のインタラクションは、規制上の罰則や消費者の直接的被害に機関をさらけ出すことができる。
既存のガードモデルは、特定の金融規制に根ざした一般的な有害分類と見落としの違反を中心に構築されている。
このギャップを、規制文書を直接運用する規制駆動のパイプラインで解決し、金融コンプライアンスリスク分類を誘導し、既定の違反カテゴリを伴わずに、基礎となるトレーニングデータを合成する。
中国の金融規制に関するパイプラインを検証し、我々は、金融規制コンプライアンス検出のための最初のベンチマークである「textbf{FinGuard-Bench}」を、クエリレベルとレスポンスレベルの両方で専門家がアノテートしたラベルとともにリリースしました。
さらに、Qwen3-8B上に構築された金融コンプライアンス検出モデルである‘textbf{FinGuard}’を訓練し、教師付き微調整と自己再生強化学習を通じて、規制対象のデータに基づいて訓練する。
FinGuard-Bench では、専用のガードモデルやQwen3.5-397B-A17B や GPT-5.1 といったより大きな汎用 LLM など、すべてのベースラインを大幅に上回っている。
さらに、FinGuardは一般的な安全機能を保持し、ポリシー文書だけでは見つからない機関固有のポリシーに適応する。
この作業で使用されるコード、プロンプト、リソースをGitHubで公開します。
関連論文リスト
- FinSafetyBench: Evaluating LLM Safety in Real-World Financial Scenarios [20.47244088110227]
大規模言語モデル(LLM)は金融シナリオにますます適用されてきている。
違法行為や非倫理的行為の促進など、有害なアウトプットを生み出すこともある。
We propose FinSafetyBench, a benchmark designed to test a LLM's refusal of request that violate financial compliance。
論文 参考訳(メタデータ) (2026-05-01T14:51:24Z) - RegGuard: Legitimacy and Fairness Enforcement for Optimistic Rollups [2.9661360665913574]
最適ロールアップはスケーラブルなスマートコントラクト実行を提供するが、規制された金融アプリケーションには適さない。
包括的な正当性保証を備えた楽観的なロールアップを強化する統合フレームワークであるRegGuardを紹介します。
RegGuardは、解決の失敗を90%以上削減し、検出可能な順序付け操作を防止し、ベースラインスループットの85%を維持している。
論文 参考訳(メタデータ) (2026-04-06T15:13:30Z) - NExT-Guard: Training-Free Streaming Safeguard without Token-Level Labels [66.70287556682105]
NExT-Guardは、スパースオートエンコーダ(SAE)の解釈可能な潜在機能を監視することで、ストリーミングセーフガードを実現するトレーニング不要フレームワークである。
利用可能なLLMから事前訓練されたSAEを使用しており、トークンレベルの監視なしに柔軟な低コストなデプロイを可能にする。
実験の結果, NExT-Guardは, 教師付きトレーニングに基づいて, ポストホックとストリーミングの保護の両方に優れていた。
論文 参考訳(メタデータ) (2026-02-10T08:54:10Z) - Evaluating Large Language Models for Stance Detection on Financial Targets from SEC Filing Reports and Earnings Call Transcripts [45.13099538394587]
我々は,債務,1株当たり利益(EPS),販売という3つの中核的財務指標に着目したスタンス検出のための文レベルのコーパスを導入する。
文章は10-Kの年次報告とECTから抽出され, 高度なChatGPT-o3-proモデルを用いてスタンスにラベル付けされた。
このコーパスを用いて、ゼロショット、少数ショット、およびCoT(Chain-of-Thought)の促進戦略を用いて、現代大言語モデル(LLM)の体系的評価を行う。
論文 参考訳(メタデータ) (2025-10-27T16:03:20Z) - Aligning Language Models with Investor and Market Behavior for Financial Recommendations [46.90931293070464]
本稿では,Large Language Models (LLMs), Knowledge Graphs (KGs), Kahneman-Tversky Optimization (KTO)を統合した新しいフレームワークFLARKOを提案する。
FLARKOは、ユーザーのトランザクション履歴と資産動向を構造化されたKGとしてエンコードし、LLMの解釈可能かつ制御可能なコンテキストを提供する。
FAR-Transデータセットに基づいて、FLARKOは、行動アライメントと共同利益性に基づく最先端のレコメンデーションベースラインを一貫して上回る。
論文 参考訳(メタデータ) (2025-10-14T03:24:20Z) - Compliance-to-Code: Enhancing Financial Compliance Checking via Code Generation [36.166087396386445]
金融規制コンプライアンスに特化した中国初の大規模データセットであるCompliance-to-Codeを提示する。
10のカテゴリにわたる361の規則から1,159の注釈付き節をカバーし、各節は規則関係とともに4つの論理的要素、条件、制約、文脈情報からなるモジュール構造になっている。
自動監査を容易にするために,決定論的Pythonコードマッピング,詳細なコード推論,コード説明を提供する。
論文 参考訳(メタデータ) (2025-05-26T10:38:32Z) - Deep Learning Approaches for Anti-Money Laundering on Mobile Transactions: Review, Framework, and Directions [51.43521977132062]
マネーロンダリング(英: Money laundering)は、不正資金の起源を隠蔽する金融犯罪である。
モバイル決済プラットフォームとスマートIoTデバイスの普及は、マネーロンダリング対策をかなり複雑にしている。
本稿では,AMLにおけるディープラーニングソリューションとその利用に関する課題について,包括的レビューを行う。
論文 参考訳(メタデータ) (2025-03-13T05:19:44Z) - Standard Benchmarks Fail - Auditing LLM Agents in Finance Must Prioritize Risk [31.43947127076459]
標準ベンチマークでは、大規模言語モデル(LLM)エージェントが金融面でどれだけうまく機能するかを定めているが、デプロイの安全性についてはほとんど語っていない。
我々は、精度の指標とリターンベースのスコアが、幻覚的な事実、古いデータ、敵の迅速な操作などの脆弱性を見渡すことで、信頼性の錯覚をもたらすと論じている。
論文 参考訳(メタデータ) (2025-02-21T12:56:15Z) - RIRAG: Regulatory Information Retrieval and Answer Generation [51.998738311700095]
本稿では,質問を自動生成し,関連する規制通路と組み合わせる,問合せペアを生成するタスクを紹介する。
我々は、Abu Dhabi Global Markets (ADGM) の財務規制文書から得られた27,869の質問を含むObliQAデータセットを作成する。
本稿では,RIRAG(Regulation Information Retrieval and Answer Generation)システムをベースラインとして設計し,新しい評価基準であるRePASを用いて評価する。
論文 参考訳(メタデータ) (2024-09-09T14:44:19Z) - Advancing Anomaly Detection: Non-Semantic Financial Data Encoding with LLMs [49.57641083688934]
本稿では,Large Language Models (LLM) 埋め込みを用いた財務データにおける異常検出の新しい手法を提案する。
実験により,LLMが異常検出に有用な情報をもたらし,モデルがベースラインを上回っていることが確認された。
論文 参考訳(メタデータ) (2024-06-05T20:19:09Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。