論文の概要: Invisible Manipulation Channels in AI-Assisted Financial Advisory: Implications for Market Integrity and Regulatory Design
- arxiv url: http://arxiv.org/abs/2606.16121v1
- Date: Mon, 15 Jun 2026 02:27:42 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-06-16 18:36:05.019728
- Title: Invisible Manipulation Channels in AI-Assisted Financial Advisory: Implications for Market Integrity and Regulatory Design
- Title(参考訳): AI支援金融アドバイザリーにおける目に見えない操作チャネル:市場統合性と規制設計への示唆
- Authors: Liuyang Yao, Zhouyu Li, Junguang He, Ziyang You,
- Abstract要約: 本稿では,LLM推論のサンプリング層で動作している目に見えない操作チャネルを実験的に検証する。
この推測段階の操作は統計的に検出が困難であることを示す。
リスクの高い金融AIシステムに対するQRNG認証を必須とする4つの規制改正を提案する。
- 参考スコア(独自算出の注目度): 2.061257001243159
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: AI systems are increasingly deployed for credit assessment and investment advisory in global financial markets, yet the integrity of their inference pipelines remains insufficiently addressed by existing regulatory frameworks. This paper identifies and empirically validates an invisible manipulation channel operating at the sampling layer of LLM inference--a vulnerability that allows adversaries to systematically bias AI-generated financial opinions while preserving full compliance with output-based audit mechanisms, including statistical watermarking. We show that this inference-stage manipulation is statistically hard to detect: the Kullback-Leibler divergence between manipulated and normal output distributions can be made arbitrarily small, so that any output-based detection scheme requires impractically large sample sizes to achieve reliable detection power. Empirical experiments across credit rating and investment advisory scenarios show that directional bias keywords can be amplified by 1.8-1.9x under stealth-preserving (aware) manipulation while triggering zero of six black-box detectors and preserving watermark integrity. The vulnerability generalizes across three mainstream watermarking schemes and three heterogeneous model architectures, establishing it as a systemic financial infrastructure risk. Software-based defenses including cryptographically secure pseudorandom number generators are entirely ineffective, while QRNG combined with TEE hardware isolation achieves 100% attack blocking--reducing the target rate to the natural baseline--by replacing the predictable hash key with quantum-derived entropy that renders all pre-computed manipulation targets invalid. We propose four regulatory amendments centered on mandatory QRNG certification for high-risk financial AI systems under NIST SP 800-90B, inference-layer supply chain audits, and output provenance mechanisms.
- Abstract(参考訳): AIシステムは、グローバル金融市場でクレジットアセスメントと投資アドバイザリのためにますますデプロイされているが、推論パイプラインの完全性は、既存の規制フレームワークによって不十分に対処されている。
本稿では,LLM推論のサンプリング層で動作している目に見えない操作チャネルを特定し,実証的に検証する。これは,統計的透かしを含む出力ベース監査機構への完全準拠を保ちつつ,AI生成した財務意見を体系的にバイアスする脆弱性である。
演算された出力分布と正規出力分布との間のクルバック・リーブラーのばらつきを任意に小さくすることができ、出力ベース検出方式が不規則に大きなサンプルサイズを必要とするので、信頼性の高い検出能力を実現することができる。
信用格付けと投資アドバイザリーシナリオの実証実験は、6つのブラックボックス検出器のゼロをトリガーし、透かしの整合性を保ちながら、ステルス保存(注意)操作の下で方向バイアスキーワードを1.8-1.9xで増幅できることを示している。
この脆弱性は3つの主流なウォーターマーキングスキームと3つの異種モデルアーキテクチャにまたがって一般化され、システム的な金融インフラリスクとして確立される。
暗号的にセキュアな擬似乱数生成器を含むソフトウェアベースのディフェンスは、完全に非効率であり、QRNGとTEEハードウェアの分離が組み合わされたQRNGは、100%の攻撃ブロッキングを実現している。
我々は,NIST SP 800-90Bに基づくリスクの高い金融AIシステムに対するQRNG認証を必須とする4つの規制修正,推論層サプライチェーン監査,出力保証機構を提案する。
関連論文リスト
- From Accuracy to Auditability: A Survey of Determinism in Financial AI Systems [16.784964226963744]
規制された金融環境における機械学習は、アルゴリズムの脆弱性に重大な脆弱性を露呈する。
ディープニューラルネットワークと生成AIは、ハードウェアとアーキテクチャに根ざした機械的非決定性を導入している。
この調査は、現在金融AIを支配している3つのモダリティにわたる障害に関するシステム視点を提供する。
論文 参考訳(メタデータ) (2026-05-11T17:46:38Z) - TRUST: A Framework for Decentralized AI Service v.0.1 [47.384270414446604]
大規模推論モデル (LRM) とマルチエージェントシステム (MAS) は, 信頼性の高い検証を必要とする。
TRUST(Transparent, Robust, and Unified Services for Trustworthy AI)は,3つのイノベーションを備えた分散フレームワークである。
我々は、悪質な俳優が損失を被っている間、正直な監査人の利益を確実に確保する安全利益理論を証明する。
論文 参考訳(メタデータ) (2026-04-29T19:32:58Z) - From Risk to Rescue: An Agentic Survival Analysis Framework for Liquidation Prevention [46.90931293070464]
本稿では,リスクを認識し,対実的未来をシミュレートし,積極的に清算を防止するためのプロトコルに忠実な介入を行う自律エージェントを提案する。
我々は,ハイリスクユーザプロファイル4,882のコホート上で,高忠実でプロトコルに忠実なAave v3シミュレータを用いて,我々のアプローチを検証する。
論文 参考訳(メタデータ) (2026-04-16T03:22:05Z) - Conformal Thinking: Risk Control for Reasoning on a Compute Budget [60.65072883773352]
大規模言語モデル(LLM)の推論により、トークンの予算が増加するにつれて、データセットレベルの精度が向上する。
我々は、予算設定問題をリスクコントロールとして再設定し、計算を最小化しながらエラー率を制限する。
我々のフレームワークは、モデルが自信のあるときに推論を停止する上位しきい値と、未解決のインスタンスを事前に停止させる新しい下位しきい値を導入する。
論文 参考訳(メタデータ) (2026-02-03T18:17:22Z) - TRUST: A Decentralized Framework for Auditing Large Language Model Reasoning [45.228233498964755]
大規模言語モデルは、意思決定を明らかにする推論チェーンを生成する。
既存の監査手法は集中的で、不透明で、スケールが難しい。
透明で分散化された監査フレームワークであるTRUSTを提案する。
論文 参考訳(メタデータ) (2025-10-23T04:16:44Z) - Audit the Whisper: Detecting Steganographic Collusion in Multi-Agent LLMs [0.0]
Audit the Whisperは、理論、ベンチマーク設計、検出、検証にまたがるカンファレンスグレードの研究成果物である。
i) パラフレーズ, レート制限, 役割置換などの介入が, ペアリングしたKullback-Leibler診断によって定量的なペナルティの操作を課すことを示すチャネル容量分析を行った。
我々は、匿名化された再生スクリプト、匿名化されたマニフェスト、ドキュメントをリリースし、外部監査官がすべての図を再現し、二重盲検要件を満たし、最小限の努力でフレームワークを拡張します。
論文 参考訳(メタデータ) (2025-10-05T17:51:52Z) - Unsupervised Conformal Inference: Bootstrapping and Alignment to Control LLM Uncertainty [49.19257648205146]
生成のための教師なし共形推論フレームワークを提案する。
我々のゲートは、分断されたUPPよりも厳密で安定した閾値を提供する。
その結果は、ラベルのない、API互換の、テスト時間フィルタリングのゲートになる。
論文 参考訳(メタデータ) (2025-09-26T23:40:47Z) - Backdoor Cleaning without External Guidance in MLLM Fine-tuning [76.82121084745785]
Believe Your Eyes (BYE)は、アテンションエントロピーパターンを自己教師信号として活用して、バックドアサンプルを特定してフィルタリングするデータフィルタリングフレームワークである。
クリーンタスクのパフォーマンスを維持しながら、ほぼゼロの攻撃成功率を達成する。
論文 参考訳(メタデータ) (2025-05-22T17:11:58Z) - Data-Driven Calibration of Prediction Sets in Large Vision-Language Models Based on Inductive Conformal Prediction [0.0]
動的しきい値キャリブレーションとクロスモーダル整合性検証を統合したモデル非依存不確実性定量化法を提案する。
このフレームワークは、様々なキャリブレーションとテストの分割比で安定したパフォーマンスを実現し、医療、自律システム、その他の安全に敏感な領域における現実的な展開の堅牢性を強調している。
この研究は、マルチモーダルAIシステムにおける理論的信頼性と実用性の間のギャップを埋め、幻覚検出と不確実性を考慮した意思決定のためのスケーラブルなソリューションを提供する。
論文 参考訳(メタデータ) (2025-04-24T15:39:46Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。