論文の概要: Representation Signatures and Risk-Feedback Alignment in LLM Trading Agents
- arxiv url: http://arxiv.org/abs/2605.28850v1
- Date: Sat, 16 May 2026 16:53:34 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-06-01 02:55:43.041031
- Title: Representation Signatures and Risk-Feedback Alignment in LLM Trading Agents
- Title(参考訳): LLM処理剤における表現シグナチャとリスクフィードバックアライメント
- Authors: Weicheng Xue,
- Abstract要約: 金融決定環境における大規模言語モデル(LLM)エージェントの行動アライメントと表現ダイナミクスについて検討する。
提案手法では, プレドローダウン状態とは別個に, 正規状態のセントロイドからの埋め込み, 融合した計画リスク表現, および, 故障前の有効ランク収縮を示す。
また、構造的リスクフィードバックは微調整なしで外部アライメント信号として機能するが、普遍的な性能向上にはならない。
- 参考スコア(独自算出の注目度): 0.0635655952373977
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: We study behavioral alignment and representation dynamics of large language model (LLM) agents in financial decision environments. Using TradeArena, an auditable trading-agent testbed with risk reports, execution simulation, memory, and replayable trajectories, we analyze how rationales, positions, and interventions evolve under market stress. We find measurable pre-failure signatures: planning embeddings drift from normal-state centroids, fused plan-risk representations separate normal from pre-drawdown states, and manifold diagnostics show effective-rank contraction before failures. To address small-sample and embedding-choice concerns, we use 80 rolling failure anchors across eight LLM trajectories and show that contraction persists across hash, LSA, Transformer, and white-box hidden-state probes. Stress tests with CoT-free target weights, lexical controls, OHLCV noise, and false-audit reports indicate that rationale-level contraction can vanish without rationales, while intent-space contraction may remain; lexical diversity does not collapse; and fused signatures remain informative under noise. We also find that structured risk feedback can act as an external alignment signal without fine-tuning, but not as a universal performance enhancer: true audit feedback improves calibration for some models, return and drawdown for others, and reveals cases where hidden or placebo feedback has higher short-horizon return but weaker alignment diagnostics. Finally, a 51-stock intraday experiment reveals a correlation blind spot: LLM rationales often justify concentrated exposure to coupled assets that the risk layer repeatedly clips, with a rolling Markowitz baseline as a covariance reference. These results support a research claim rather than a profitability claim: auditable risk feedback and representation trajectories reveal when LLM financial reasoning is aligning, drifting, or failing.
- Abstract(参考訳): 金融決定環境における大規模言語モデル(LLM)エージェントの行動アライメントと表現動態について検討する。
リスクレポート、実行シミュレーション、メモリ、再生可能なトラジェクトリを備えた監査可能なトレーディングエージェントであるTradeArenaを用いて、市場ストレス下での合理的性、位置、介入がどのように進化するかを分析する。
正規状態のセントロイドからドリフトする埋め込み計画、プレドローダウン状態から正規状態と分離した混合計画リスク表現、故障前の有効ランク収縮を示す多様体診断などである。
8つのLSM軌道にまたがる80個のローリング障害アンカーを使用し、ハッシュ、LSA、トランスフォーマー、ホワイトボックスの隠れ状態プローブ間で収縮が持続することを示す。
CoTフリーターゲット重量、語彙制御、OHLCVノイズ、偽聴取によるストレステストでは、有理量レベルの収縮は合理性なしで消えるが、意図空間の収縮は残り、語彙の多様性は崩壊せず、融合したシグネチャはノイズの下で情報的のままである。
また、構造化されたリスクフィードバックは、微調整なしで外部アライメント信号として機能するが、普遍的なパフォーマンス向上器として機能しない。真の監査フィードバックは、いくつかのモデルの校正を改善し、他のモデルのリターンとドローダウンを改善し、隠れたあるいはプラセボフィードバックがより短水平リターンが高く、アライメント診断が弱いケースを明らかにする。
LLMの理論的根拠は、リスク層が繰り返しクリップする結合資産への集中曝露を正当化し、転がりマルコウィッツのベースラインを共分散基準とする。
監査可能なリスクフィードバックと表現軌道は、LLMの財政的推論が整列、漂流、または失敗しているときに明らかになる。
関連論文リスト
- The Alpha Illusion: Reported Alpha from LLM Trading Agents Should Not Be Treated as Deployment Evidence [23.772113719172896]
エンド・ツー・エンドのLLMトレーディングエージェントからのシャープ比率の報告は、配備証拠として扱われてはならない。
レポートの堅牢性はトレーダブルな確率ではなく、物語の推論は数値的な実行ではない。
論文 参考訳(メタデータ) (2026-05-16T09:14:35Z) - Beyond Semantic Relevance: Counterfactual Risk Minimization for Robust Retrieval-Augmented Generation [19.888565537472363]
CoRM-RAG(Counterfactual Risk Minimization for RAG)は、検索と意思決定の安全性を一致させるフレームワークである。
トレーニング中にユーザのバイアスをシミュレートする認知摂動プロトコルを導入し,それを軽量なエビデンス・クリティカルに蒸留する。
このスコアリングモジュールは、対向的なクエリの摂動にも拘わらず、モデルの正しさを判断するために十分な明らかな強度を持つ文書を特定することを学習する。
論文 参考訳(メタデータ) (2026-05-02T07:22:24Z) - Explainable AML Triage with LLMs: Evidence Retrieval and Counterfactual Checks [19.272001035427987]
本稿では,トリアージをエビデンス制約決定プロセスとして扱う,説明可能なAMLトリアージフレームワークを提案する。
提案手法は, (i) ポリシー/タイポロジーガイダンス, 顧客コンテキスト, 警告トリガ, トランザクションサブグラフと, (ii) 明示的な引用を必要とする構造的LCM出力契約, (iii) 矛盾や欠落した証拠から分離する構造的LCM出力契約, (iii) 最小限の, 妥当な摂動が, トリアージの推奨と理性の両方に一貫性のある変化をもたらすかどうかを検証した事実チェックを組み合わせる。
論文 参考訳(メタデータ) (2026-03-22T05:51:40Z) - Neural Uncertainty Principle: A Unified View of Adversarial Fragility and LLM Hallucination [60.197429875410286]
大規模言語モデルにおける視覚と幻覚の対立的脆弱性は、伝統的に別の問題と見なされている。
損失誘起状態下でのニューラル不確実性原理(NUP)の定式化により, ほぼバウンド状態においては, さらなる圧縮は感度分散の増大を伴うことが判明した。
視覚では、高度に結合したコンポーネントをマスキングすることで、コストのかかる敵の訓練なしに堅牢性を向上させる。
言語では、任意の応答トークンを生成する前に、同じプレフィルステージプローブが幻覚リスクを検出する。
論文 参考訳(メタデータ) (2026-03-20T02:07:10Z) - Information Fidelity in Tool-Using LLM Agents: A Martingale Analysis of the Model Context Protocol [69.11739400975445]
モデルコンテキストプロトコル(MCP)エージェントにおけるエラー蓄積を解析するための最初の理論的枠組みを紹介する。
累積歪みが線形成長と高確率偏差を$O(sqrtT)$で表すことを示す。
主な発見は、意味重み付けは歪みを80%減らし、周期的再接地は、エラー制御の約9ステップごとに十分である。
論文 参考訳(メタデータ) (2026-02-10T21:08:53Z) - Gaming the Judge: Unfaithful Chain-of-Thought Can Undermine Agent Evaluation [76.5533899503582]
大規模言語モデル(LLM)は、エージェントのパフォーマンスを評価するために、ますます裁判官として使われている。
このパラダイムは、エージェントのチェーン・オブ・シークレット(CoT)推論が内部の推論と環境状態の両方を忠実に反映していることを暗黙的に仮定している。
我々は、操作された推論だけで、様々なWebタスクにまたがる800の軌跡に対して、最先端のVLM審査員の偽陽性率を最大90%向上させることができることを実証した。
論文 参考訳(メタデータ) (2026-01-21T06:07:43Z) - DRIFT: Detecting Representational Inconsistencies for Factual Truthfulness [5.785021425715989]
LLMは流動性があるが誤った答えを出すことが多いが、このような幻覚を検出するには、通常、複数のサンプリングパスやポストホック検証が必要である。
隠れ状態から直接これらの信号を読み取るための軽量なプローブを提案する。
信頼性の高い問合せを即座に答えるとともに,不確実な問合せをより強力なモデルに委譲するLLMルータを開発した。
論文 参考訳(メタデータ) (2026-01-20T18:16:10Z) - Decision-Aware Trust Signal Alignment for SOC Alert Triage [0.0]
本稿では,SOC警告トリアージの信頼信号対応方式を提案する。
このフレームワークは、調整済みの信頼性、軽量不確実性、そしてコストに敏感な決定しきい値をコヒーレントな決定支持層に組み合わせている。
信頼度が不一致な表示によって偽陰性が大幅に増幅されるのに対し、コスト重み付き損失は決定整合信頼信号を持つモデル間での桁違いに減少することを示す。
論文 参考訳(メタデータ) (2026-01-08T01:41:54Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。