論文の概要: Explainable AML Triage with LLMs: Evidence Retrieval and Counterfactual Checks
- arxiv url: http://arxiv.org/abs/2604.19755v1
- Date: Sun, 22 Mar 2026 05:51:40 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-05-04 02:32:14.046933
- Title: Explainable AML Triage with LLMs: Evidence Retrieval and Counterfactual Checks
- Title(参考訳): LLMを用いた説明可能なAMLトリアージ:エビデンス検索と偽チェック
- Authors: Dorothy Torres, Wei Cheng, Ke Hu,
- Abstract要約: 本稿では,トリアージをエビデンス制約決定プロセスとして扱う,説明可能なAMLトリアージフレームワークを提案する。
提案手法は, (i) ポリシー/タイポロジーガイダンス, 顧客コンテキスト, 警告トリガ, トランザクションサブグラフと, (ii) 明示的な引用を必要とする構造的LCM出力契約, (iii) 矛盾や欠落した証拠から分離する構造的LCM出力契約, (iii) 最小限の, 妥当な摂動が, トリアージの推奨と理性の両方に一貫性のある変化をもたらすかどうかを検証した事実チェックを組み合わせる。
- 参考スコア(独自算出の注目度): 19.272001035427987
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Anti-money laundering (AML) transaction monitoring generates large volumes of alerts that must be rapidly triaged by investigators under strict audit and governance constraints. While large language models (LLMs) can summarize heterogeneous evidence and draft rationales, unconstrained generation is risky in regulated workflows due to hallucinations, weak provenance, and explanations that are not faithful to the underlying decision. We propose an explainable AML triage framework that treats triage as an evidence-constrained decision process. Our method combines (i) retrieval-augmented evidence bundling from policy/typology guidance, customer context, alert triggers, and transaction subgraphs, (ii) a structured LLM output contract that requires explicit citations and separates supporting from contradicting or missing evidence, and (iii) counterfactual checks that validate whether minimal, plausible perturbations lead to coherent changes in both the triage recommendation and its rationale. We evaluate on public synthetic AML benchmarks and simulators and compare against rules, tabular and graph machine-learning baselines, and LLM-only/RAG-only variants. Results show that evidence grounding substantially improves auditability and reduces numerical and policy hallucination errors, while counterfactual validation further increases decision-linked explainability and robustness, yielding the best overall triage performance (PR-AUC 0.75; Escalate F1 0.62) and strong provenance and faithfulness metrics (citation validity 0.98; evidence support 0.88; counterfactual faithfulness 0.76). These findings indicate that governed, verifiable LLM systems can provide practical decision support for AML triage without sacrificing compliance requirements for traceability and defensibility.
- Abstract(参考訳): 反マネーロンダリング(AML)トランザクション監視は、厳格な監査とガバナンスの制約の下で調査員によって迅速にトリガーされなければならない大量のアラートを生成する。
大型言語モデル(LLM)は異質な証拠や草案の根拠をまとめることができるが、制約のない生成は幻覚、弱い証明、根底にある決定に忠実でない説明による規制されたワークフローにおいて危険である。
本稿では,トリアージをエビデンス制約決定プロセスとして扱う,説明可能なAMLトリアージフレームワークを提案する。
我々の方法が組み合わさる
一 方針・方針指針、顧客状況、警告トリガー及び取引サブグラフから蓄積した検索強化された証拠
2 明示的な引用を要し、矛盾又は欠落した証拠を裏付ける構造化LCM出力契約
三 トリアージ勧告及びその合理性の両方において、最小限の、もっともらしい摂動が一貫性のある変化をもたらすかどうかを検証する対実チェック。
我々は,一般のAMLベンチマークとシミュレータを用いて評価を行い,ルール,表とグラフの機械学習ベースライン,LLMのみ/RAGのみの変種との比較を行った。
その結果、根拠となる証拠はオーディビリティを大幅に改善し、数値的および政策的な幻覚誤差を低減し、反ファクト的検証は、決定リンクされた説明可能性と堅牢性をさらに向上させ、最高の総合的トリアージ性能(PR-AUC 0.75; Escalate F1 0.62)と強力な証明と忠実度指標(引用妥当性0.98、エビデンス支持0.88、反ファクト的忠実度0.76)を得ることを示した。
これらの結果から,規制付き検証可能なLLMシステムは,トレーサビリティと保護性に対するコンプライアンス要件を犠牲にすることなく,AMLトリアージの実践的な意思決定支援を実現できることが示唆された。
関連論文リスト
- Trust but Verify: Introducing DAVinCI -- A Framework for Dual Attribution and Verification in Claim Inference for Language Models [53.279391576560755]
大規模言語モデル(LLM)は、広範囲のNLPタスクにおいて顕著な流速と汎用性を示してきたが、実際的な不正確さと制限が伴う傾向にある。
これは、信頼と妥当性が最優先される医療、法律、科学コミュニケーションといった、高リスク領域に重大なリスクをもたらす。
LLM出力の事実的信頼性と解釈可能性を高めるために設計されたDAVinCI - Dual Attribution and Verificationフレームワークを紹介する。
論文 参考訳(メタデータ) (2026-04-23T01:37:50Z) - MARCH: Multi-Agent Reinforced Self-Check for LLM Hallucination [25.50050557327127]
幻覚は、大きな言語モデル(LLM)にとって重要なボトルネックである。
MARCH(Multi-Agent Reinforced Self-Check for Hallucination)を紹介する。
MARCHは意図的な情報非対称性を活用することで厳密な事実整合を強制する。
論文 参考訳(メタデータ) (2026-03-25T17:54:10Z) - Information Fidelity in Tool-Using LLM Agents: A Martingale Analysis of the Model Context Protocol [69.11739400975445]
モデルコンテキストプロトコル(MCP)エージェントにおけるエラー蓄積を解析するための最初の理論的枠組みを紹介する。
累積歪みが線形成長と高確率偏差を$O(sqrtT)$で表すことを示す。
主な発見は、意味重み付けは歪みを80%減らし、周期的再接地は、エラー制御の約9ステップごとに十分である。
論文 参考訳(メタデータ) (2026-02-10T21:08:53Z) - Gaming the Judge: Unfaithful Chain-of-Thought Can Undermine Agent Evaluation [76.5533899503582]
大規模言語モデル(LLM)は、エージェントのパフォーマンスを評価するために、ますます裁判官として使われている。
このパラダイムは、エージェントのチェーン・オブ・シークレット(CoT)推論が内部の推論と環境状態の両方を忠実に反映していることを暗黙的に仮定している。
我々は、操作された推論だけで、様々なWebタスクにまたがる800の軌跡に対して、最先端のVLM審査員の偽陽性率を最大90%向上させることができることを実証した。
論文 参考訳(メタデータ) (2026-01-21T06:07:43Z) - Towards Comprehensive Stage-wise Benchmarking of Large Language Models in Fact-Checking [64.97768177044355]
大規模言語モデル(LLM)は、現実のファクトチェックシステムにますます多くデプロイされている。
FactArenaは、完全に自動化されたアリーナスタイルの評価フレームワークである。
本研究では,静的クレーム検証精度とエンドツーエンドのファクトチェック能力の相違点を明らかにした。
論文 参考訳(メタデータ) (2026-01-06T02:51:56Z) - HADSF: Aspect Aware Semantic Control for Explainable Recommendation [4.75127493865044]
大規模言語モデル(LLM)の最近の進歩は、推薦システムに対してより効果的な情報抽出を約束している。
本稿では,適応選択によるコンパクトなコーパスレベルのアスペクトボキャブラリを誘導し,構造化アスペクトオピニオン三重項のボキャブラリ誘導,明示的に制約された抽出を行う2段階アプローチを提案する。
1.5B-70Bパラメータにまたがる約300万のレビューに関する実験では、標準評価予測器に統合された場合、HADSFは予測エラーを一貫して減少させる。
論文 参考訳(メタデータ) (2025-10-30T20:49:33Z) - Co-Sight: Enhancing LLM-Based Agents via Conflict-Aware Meta-Verification and Trustworthy Reasoning with Structured Facts [18.221173068008603]
Co-Sightは推論を偽造可能で監査可能なプロセスに変える。
コンフリクト・アウェア・メタ検証(CAMV)とTrustworthy Reasoning with Structured Facts(TRSF)の2つのメカニズム
論文 参考訳(メタデータ) (2025-10-24T15:14:14Z) - FactCHD: Benchmarking Fact-Conflicting Hallucination Detection [64.4610684475899]
FactCHD は LLM からファクトコンフリクトの幻覚を検出するために設計されたベンチマークである。
FactCHDは、バニラ、マルチホップ、比較、セット操作など、さまざまな事実パターンにまたがる多様なデータセットを備えている。
Llama2 に基づくツール強化 ChatGPT と LoRA-tuning による反射的考察を合成する Truth-Triangulator を提案する。
論文 参考訳(メタデータ) (2023-10-18T16:27:49Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。