論文の概要: From Accuracy to Auditability: A Survey of Determinism in Financial AI Systems
- arxiv url: http://arxiv.org/abs/2605.23955v2
- Date: Wed, 27 May 2026 17:26:09 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-06-01 02:55:42.974682
- Title: From Accuracy to Auditability: A Survey of Determinism in Financial AI Systems
- Title(参考訳): 正確性から可聴性へ:金融AIシステムにおける決定性の調査
- Authors: Ruizhe Zhou, Xiaoyang Liu, Gaoyuan Du, Yi Zheng, Shouxi Ren, Deepayan Chakrabarti, Dengdu Jiang,
- Abstract要約: 規制された金融環境における機械学習は、アルゴリズムの脆弱性に重大な脆弱性を露呈する。
ディープニューラルネットワークと生成AIは、ハードウェアとアーキテクチャに根ざした機械的非決定性を導入している。
この調査は、現在金融AIを支配している3つのモダリティにわたる障害に関するシステム視点を提供する。
- 参考スコア(独自算出の注目度): 16.784964226963744
- License: http://creativecommons.org/licenses/by-nc-sa/4.0/
- Abstract: Deploying machine learning in regulated financial environments -- credit risk, fraud detection, and anti-money laundering -- exposes critical vulnerabilities in algorithmic reproducibility. While early financial ML addressed statistical challenges such as backtest overfitting, deep neural networks and Generative AI have introduced mechanical nondeterminism rooted in hardware and architecture. This survey provides a systems perspective on reproducibility failures across three modalities now dominant in financial AI: tabular models (post-hoc explanation variance), graph networks (stochastic sampling and temporal asynchrony), and LLM-based agentic workflows (batch-dependent divergence and trajectory drift). We supplement the literature analysis with first-party experiments on public financial datasets -- quantifying explanation rank instability in credit scoring, prediction flip rates in GNN-based fraud detection, and tensor-parallel-induced output divergence in LLM entity extraction. We propose a layered evaluation framework linking modality-specific metrics (RBO, D_cos, TDI, PSD) to audit readiness, and empirically validate the complementarity of logit-level and semantic-level determinism measures.
- Abstract(参考訳): 規制された金融環境(信用リスク、不正検出、マネーロンダリング)に機械学習をデプロイすることは、アルゴリズムの再現性において重大な脆弱性を露呈する。
初期の金融MLは、バックテストのオーバーフィットやディープニューラルネットワーク、ジェネレーティブAIといった統計的課題に対処する一方で、ハードウェアとアーキテクチャに根ざした機械的非決定性を導入している。
この調査は、現在金融AIで支配的な3つのモード、すなわち、表モデル(ポストホックな説明分散)、グラフネットワーク(確率的サンプリングと時間的非同期)、LLMベースのエージェントワークフロー(バッチ依存のばらつきとトラジェクトリドリフト)の再現性障害に関するシステム視点を提供する。
LLM エンティティ抽出において,クレジットスコアリングにおける説明ランクの不安定性の定量化,GNN による不正検出における予測フリップ率,テンソルパラレルによるアウトプットのばらつきなど,公開財務データセットの第一部実験による文献分析を補完する。
本稿では,ロジトレベルおよびセマンティックレベル決定尺度の相補性を実証的に検証し,モダリティ特化指標(RBO,D_cos,TDI,PSD)を結合した階層評価フレームワークを提案する。
関連論文リスト
- VerifyMAS: Hypothesis Verification for Failure Attribution in LLM Multi-Agent Systems [79.51005192758262]
大規模言語モデル駆動型マルチエージェントシステムは複雑なタスクで優れている。
しかし、信頼性の低いエージェントは、システムレベルの信頼性にとって重要なボトルネックである。
本稿では,エージェント故障の帰属に関する仮説検証フレームワークを提案する。
論文 参考訳(メタデータ) (2026-05-17T14:09:35Z) - Fraud Detection System for Banking Transactions [0.0]
本研究では、PaySim合成金融トランザクションデータセットを利用した機械学習による不正検出フレームワークを提案する。
提案するフレームワークは、FinTechトランザクションシステムにおける不正防止機能を強化する、堅牢でスケーラブルなソリューションを提供する。
論文 参考訳(メタデータ) (2026-04-09T08:17:27Z) - CAMD: Coverage-Aware Multimodal Decoding for Efficient Reasoning of Multimodal Large Language Models [48.33850939857255]
我々は、サンプリングカバレッジ、インスタンスの難易度、残留リスクをリンクする理論的枠組みを開発する。
解析の結果,マルチモーダル推論は重み付き難易度分布を示すことがわかった。
推定不確実性に応じて動的に割り当てる適応型推論機構であるCoverage-Aware Multimodal Decoding (CAMD)を提案する。
論文 参考訳(メタデータ) (2026-03-16T02:31:03Z) - ProbeLLM: Automating Principled Diagnosis of LLM Failures [89.44131968886184]
ProbeLLMはベンチマークに依存しない自動探索フレームワークで、個々の障害から構造的障害モードへの脆弱性発見を増大させる。
ProbeLLMは、検証可能なテストケースにプローブを制限し、ツールの拡張された生成と検証を活用することで、信頼性のある証拠として障害発見を根拠とする。
論文 参考訳(メタデータ) (2026-02-13T14:33:13Z) - ProteuS: A Generative Approach for Simulating Concept Drift in Financial Markets [44.76567557906836]
適応アルゴリズムの開発と検証における根本的な問題は、現実世界の財務データに基礎的な真理が欠如していることである。
本稿では,事前定義された構造破壊を伴う半合成財務時系列を生成するための新しいフレームワークProteuSを紹介する。
生成されたデータの解析によってタスクの複雑さが確認され、異なる市場状態間の大きな重複が明らかになる。
論文 参考訳(メタデータ) (2025-08-30T21:01:47Z) - Matrix Factorization for Inferring Associations and Missing Links [5.700773330654261]
リンク予測の欠如は、ネットワーク内の見えないが潜在的に存在するコネクションを特定する。
増殖検出においては、国家および非国家アクターによる核兵器獲得の試みを特定し、特徴付ける努力を支援する。
本稿では,新しい重み付き (WNMFk), Boolean (BNMFk), およびRecommender (RNMFk) 行列因数分解法と,ロジスティック因数分解を組み込んだアンサンブル変種をリンク予測のために導入する。
論文 参考訳(メタデータ) (2025-03-06T18:22:46Z) - The Misclassification Likelihood Matrix: Some Classes Are More Likely To Be Misclassified Than Others [1.654278807602897]
本研究では、分散シフト下でのニューラルネットワーク予測の信頼性を定量化するための新しいツールとして、MLM(Misclassification Likelihood Matrix)を紹介した。
この研究の意味は、画像の分類を超えて、自動運転車などの自動運転システムで進行中の応用に及んでいる。
論文 参考訳(メタデータ) (2024-07-10T16:43:14Z) - Advancing Anomaly Detection: Non-Semantic Financial Data Encoding with LLMs [49.57641083688934]
本稿では,Large Language Models (LLM) 埋め込みを用いた財務データにおける異常検出の新しい手法を提案する。
実験により,LLMが異常検出に有用な情報をもたらし,モデルがベースラインを上回っていることが確認された。
論文 参考訳(メタデータ) (2024-06-05T20:19:09Z) - Bayesian Bilinear Neural Network for Predicting the Mid-price Dynamics
in Limit-Order Book Markets [84.90242084523565]
伝統的な時系列計量法は、価格力学を駆動する多層相互作用の真の複雑さを捉えることができないことが多い。
最先端の2次最適化アルゴリズムを採用することで、時間的注意を払ってベイジアン双線形ニューラルネットワークを訓練する。
予測分布を用いて推定パラメータとモデル予測に関連する誤差や不確実性を解析することにより、ベイズモデルと従来のML代替品を徹底的に比較する。
論文 参考訳(メタデータ) (2022-03-07T18:59:54Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。