論文の概要: SAGE: An LLM-driven Self Reflective Agentic Framework for Fraud Detection
- arxiv url: http://arxiv.org/abs/2606.08146v1
- Date: Sat, 06 Jun 2026 12:48:45 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-06-09 14:42:05.870599
- Title: SAGE: An LLM-driven Self Reflective Agentic Framework for Fraud Detection
- Title(参考訳): SAGE: 欠陥検出のためのLCM駆動型自己反射型エージェントフレームワーク
- Authors: Yichen Chen, Siying Li, Yuhang Liang, Lijun Wang, Renyang Liu,
- Abstract要約: 不正検出のための最初のエンドツーエンドマルチエージェントフレームワークであるSAGEを提案する。
SAGEは、6層データ診断ツリー(DDT)と自然言語勾配でガイドされたマルコフ決定プロセスに基づいて決定を行う3つの専用エージェントをコーディネートする。
5つの不正データセットと5つのバックボーンLPMでは、SAGEはメソッド-データセット比較の96.00%$を勝ち取り、F1を平均40.86%$オーバーベースラインで改善する。
- 参考スコア(独自算出の注目度): 19.81280139275702
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Fraud detection in payment, e-commerce, and telecommunications systems requires accuracy at the individual level, robustness under severe class imbalance, and ease of understanding for risk managers. Existing methods fall at least one of these requirements: automated machine learning systems search a fixed numerical space without semantic awareness of the dataset; graph neural network-based methods require pre-defined relational graphs and remain opaque at the individual-decision level; and the design of general-purpose large language model (LLM) agents does not consider the recall and precision constraints specific to real-world fraud detection. In this paper, we propose SAGE, the first end-to-end LLM-driven multi-agent framework for fraud detection. SAGE coordinates three dedicated agents that make decisions based on a six-layer Data Diagnostic Tree (DDT) and a Markov decision process guided by natural-language gradients, automatically optimizing the model under a fraud-specific reward. On five fraud datasets and five LLM backbones, SAGE wins $96.00\%$ of method--dataset comparisons and improves F1 by an average of $40.86\%$ over baselines. The code is available at https://github.com/yichenC1c/SAGE.
- Abstract(参考訳): 支払い、電子商取引、通信システムの不正検出には、個々のレベルでの正確性、厳しい階級不均衡の下での堅牢性、リスクマネージャの理解の容易さが必要である。
機械学習システムはデータセットのセマンティックな認識なしに固定された数値空間を探索し、グラフニューラルネットワークベースの手法は事前定義されたリレーショナルグラフを必要とし、個々の決定レベルで不透明であり、汎用的な大規模言語モデル(LLM)エージェントの設計は、現実の不正検出に特有のリコールと精度の制約を考慮していない。
本稿では,不正検出のための最初のエンドツーエンドLLM駆動型マルチエージェントフレームワークであるSAGEを提案する。
SAGEは、6層データ診断ツリー(DDT)と自然言語勾配でガイドされたマルコフ決定プロセスに基づいて決定を行う3つの専用エージェントをコーディネートし、不正固有の報酬の下でモデルを自動的に最適化する。
5つの不正データセットと5つのLCMバックボーンにおいて、SAGEはメソッド-データセット比較の96.00\%を勝ち取り、F1を平均40.86\%のベースラインで改善する。
コードはhttps://github.com/yichenC1c/SAGEで入手できる。
関連論文リスト
- Trustworthy AI: Ensuring Reliability and Accountability from Models to Agents [2.3407932351117324]
機械学習(ML)システムの信頼性と説明責任を保証するための理論的保証付きアルゴリズムを開発する。
この論文は、情報理論、最適化、統計的学習に基づくツールを導入し、バイアスを緩和し、任意の決定を減らし、コンテンツの証明を保証する。
大規模言語モデル(LLM)の透かしによる生成AIにおける説明責任の確保
論文 参考訳(メタデータ) (2026-05-09T14:11:36Z) - Reliable LLM-Based Edge-Cloud-Expert Cascades for Telecom Knowledge Systems [54.916243942641444]
大規模言語モデル(LLM)は、通信などの分野において、自動化の鍵となる存在として浮上している。
本研究では,問合せパイプラインによる意思決定を支援する,エッジクラウドに精通したLLMベースの知識システムについて検討する。
論文 参考訳(メタデータ) (2025-12-23T03:10:09Z) - Check Field Detection Agent (CFD-Agent) using Multimodal Large Language and Vision Language Models [7.836288735110501]
自動チェックフィールド検出のための新しいトレーニングフリーフレームワークを提案する。
当社のアプローチでは,チェックコンポーネントのゼロショット検出が可能で,実世界の金融環境におけるデプロイメントの障壁を大幅に低減する。
論文 参考訳(メタデータ) (2025-09-22T20:43:59Z) - MCP-Orchestrated Multi-Agent System for Automated Disinformation Detection [84.75972919995398]
本稿では,関係抽出を用いてニュース記事の偽情報を検出するマルチエージェントシステムを提案する。
提案したエージェントAIシステムは、(i)機械学習エージェント(ロジスティック回帰)、(ii)Wikipedia知識チェックエージェント、(iv)Webスクラッドデータアナライザの4つのエージェントを組み合わせる。
その結果、マルチエージェントアンサンブルはF1スコア0.964で95.3%の精度を達成し、個々のエージェントや従来のアプローチよりも大幅に優れていた。
論文 参考訳(メタデータ) (2025-08-13T19:14:48Z) - Which Agent Causes Task Failures and When? On Automated Failure Attribution of LLM Multi-Agent Systems [50.29939179830491]
LLMマルチエージェントシステムにおける障害帰属は、まだ調査が過小評価されており、労働集約的である。
本稿では,3つの自動故障帰属手法の開発と評価を行い,その欠点と欠点を要約する。
最良の方法は、障害に応答するエージェントを特定する際に53.5%の精度を達成するが、故障の特定には14.2%しか役に立たない。
論文 参考訳(メタデータ) (2025-04-30T23:09:44Z) - Explainable AI for Fraud Detection: An Attention-Based Ensemble of CNNs, GNNs, and A Confidence-Driven Gating Mechanism [5.486205584465161]
本研究は,通常の分類プロセスに2つの余分な層を追加することにより,CCF検出のための新たな積み重ねに基づくアプローチを提案する。
注意層では、畳み込みニューラルネットワーク(CNN)とリカレントニューラルネットワーク(RNN)のソフトアウトプットを、依存重み付け平均化(DOWA)演算子を用いて組み合わせる。
信頼層では,どのアグリゲーション(DOWAまたはIOWA)でも,メタラーナーへのフィードの不確実性が低いかを選択する。
3つのデータセットに対する実験により,提案手法は高精度かつ堅牢な一般化を実現し,CCF検出に有効であることが示された。
論文 参考訳(メタデータ) (2024-10-01T09:56:23Z) - Explainable Fraud Detection with Deep Symbolic Classification [4.1205832766381985]
分類問題に対するDeep Symbolic Regressionフレームワークの拡張であるDeep Classificationを提案する。
関数は閉形式で簡潔な数学的表現であるため、モデルは1つの分類決定のレベルとモデルの決定過程の両方において本質的に説明可能である。
PaySimデータセットの評価は、最先端のモデルと競合する予測性能を示しながら、説明可能性の観点からそれらを上回っている。
論文 参考訳(メタデータ) (2023-12-01T13:50:55Z) - Fraud Dataset Benchmark and Applications [25.184342958800293]
Fraud dataset Benchmark(FDB)は、不正検出に特化した公開データセットのコンパイルである。
FDBには、不正なカード非表示トランザクションの識別、ボット攻撃の検出、悪意のあるURLの分類、コンテンツモデレーションに対するローンのデフォルトリスクの推定など、さまざまな不正関連タスクが含まれている。
FDB用のPythonベースのライブラリは、標準化されたトレーニングとテストの分割を伴うデータローディングのための一貫したAPIを提供する。
論文 参考訳(メタデータ) (2022-08-30T17:35:39Z) - Coded Stochastic ADMM for Decentralized Consensus Optimization with Edge
Computing [113.52575069030192]
セキュリティ要件の高いアプリケーションを含むビッグデータは、モバイルデバイスやドローン、車両など、複数の異種デバイスに収集され、格納されることが多い。
通信コストとセキュリティ要件の制限のため、核融合センターにデータを集約するのではなく、分散的に情報を抽出することが最重要となる。
分散エッジノードを介してデータを局所的に処理するマルチエージェントシステムにおいて,モデルパラメータを学習する問題を考える。
分散学習モデルを開発するために,乗算器アルゴリズムの最小バッチ交互方向法(ADMM)のクラスについて検討した。
論文 参考訳(メタデータ) (2020-10-02T10:41:59Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。