論文の概要: One Size Fits None: Heuristic Collapse in LLM Investment Advice
- arxiv url: http://arxiv.org/abs/2604.23837v1
- Date: Sun, 26 Apr 2026 18:45:11 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-04-28 17:12:07.586124
- Title: One Size Fits None: Heuristic Collapse in LLM Investment Advice
- Title(参考訳): LLM投資アドバイザにおけるヒューリスティックな崩壊
- Authors: Jillian Ross, Andrew W. Lo,
- Abstract要約: 大規模言語モデルは、ハイテイクドメインのアドバイザとしてますます多くデプロイされている。
我々は、フロンティアLSMが実際にこれを行うか、代わりに崩壊を示すかを検討する。
投資配分の決定は、主に自己申告されたリスク寛容によって決定されるが、他の関連する要因は最小限に寄与する。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Large language models are increasingly deployed as advisors in high-stakes domains -- answering medical questions, interpreting legal documents, recommending financial products -- where good advice requires integrating a user's full context rather than responding to salient surface features. We investigate whether frontier LLMs actually do this, or whether they instead exhibit heuristic collapse: a systematic reduction of complex, multi-factor decisions to a small number of dominant inputs. We study the phenomenon in investment advice, where legal standards explicitly require individualized reasoning over a client's full circumstances. Applying interpretable surrogate models to LLM outputs, we find systematic heuristic collapse: investment allocation decisions are largely determined by self-reported risk tolerance, while other relevant factors contribute minimally. We further find that web search partially attenuates heuristic collapse but does not resolve it. These findings suggest that heuristic collapse is not resolved by web search augmentation or model scale alone, and that deploying LLMs as advisors requires auditing input sensitivity, not just output quality.
- Abstract(参考訳): 大規模言語モデルは、医療上の問題に答え、法的文書を解釈し、金融商品を推奨するなど、高度な領域のアドバイザとしてますます多くデプロイされている。
我々は、フロンティアのLLMが実際にこれを行うのか、それともヒューリスティックな崩壊を示すのかを考察する: 複雑な多要素決定を少数の支配的な入力に体系的に還元する。
我々は、顧客の全状況に対して、法的基準が個別の推論を明示的に要求する投資アドバイスの現象を研究する。
LLMのアウトプットに解釈可能なサロゲートモデルを適用すると、投資配分の決定は、主に自己報告によるリスク許容によって決定されるが、他の関連する要因は、最小限に寄与する。
さらに、Web検索はヒューリスティックな崩壊を部分的に緩和するが、解決しない。
これらの結果から,Web検索の強化やモデルスケールのみではヒューリスティックな崩壊は解決せず,LCMをアドバイザーとしてデプロイするには,出力品質だけでなく,監査入力感度が必要であることが示唆された。
関連論文リスト
- When Do We Need LLMs? A Diagnostic for Language-Driven Bandits [44.62361611699998]
金融における非エピソジックなシーケンシャル意思決定問題に対する文脈的マルチアーメッド・バンド(CMAB)について検討する。
この結果は,コスト効率,不確実性を考慮した意思決定システムのための,原則的デプロイメントフレームワークを提供する。
論文 参考訳(メタデータ) (2026-04-07T13:20:06Z) - Reasoning with Confidence: Efficient Verification of LLM Reasoning Steps via Uncertainty Heads [104.9566359759396]
データ駆動の不確実性スコアに基づくステップレベルの推論検証の軽量な代替案を提案する。
本研究は, LLMの内部状態が不確実性を符号化し, 信頼性の高い検証信号として機能することが示唆された。
論文 参考訳(メタデータ) (2025-11-09T03:38:29Z) - FinLFQA: Evaluating Attributed Text Generation of LLMs in Financial Long-Form Question Answering [57.43420753842626]
FinLFQAは、複雑な財務問題に対する長文の回答を生成するための大規模言語モデルの能力を評価するために設計されたベンチマークである。
回答品質と属性品質の両方をカバーする自動評価フレームワークを提供する。
論文 参考訳(メタデータ) (2025-10-07T20:06:15Z) - LLM Enhancement with Domain Expert Mental Model to Reduce LLM Hallucination with Causal Prompt Engineering [0.3437656066916039]
本稿では,人間の機械対話とモノトーンブールとk値関数を最適化した技術を用いて,意思決定の計算処理可能なパーソナルエキスパート精神モデル(EMM)を探索する手法を提案する。
LLMプロンプトエンジニアリングのためのEMMアルゴリズムには,因子同定,(2)因子の階層的構造化,(3)一般化された専門家精神モデル仕様の生成,(4)その仕様から詳細な専門家精神モデルを生成する4つのステップがある。
論文 参考訳(メタデータ) (2025-09-13T14:35:51Z) - Your AI, Not Your View: The Bias of LLMs in Investment Analysis [62.388554963415906]
金融において、Large Language Models (LLMs) は、事前訓練されたパラメトリック知識とリアルタイム市場データとの相違から生じる、頻繁な知識紛争に直面している。
これらの対立は、モデル固有のバイアスが制度的目的と誤認される現実世界の投資サービスにおいて特に問題となる。
本研究では,このような紛争シナリオにおける創発的行動を調べるための実験的枠組みを提案し,投資分析におけるバイアスの定量的分析を行う。
論文 参考訳(メタデータ) (2025-07-28T16:09:38Z) - mR$^2$AG: Multimodal Retrieval-Reflection-Augmented Generation for Knowledge-Based VQA [78.45521005703958]
マルチモーダル検索拡張生成(mRAG)はMLLMに包括的で最新の知識を提供するために自然に導入されている。
我々は、適応的検索と有用な情報ローカライゼーションを実現する textbfRetrieval-textbfReftextbfAugmented textbfGeneration (mR$2$AG) という新しいフレームワークを提案する。
mR$2$AG は INFOSEEK と Encyclopedic-VQA の最先端MLLM を著しく上回る
論文 参考訳(メタデータ) (2024-11-22T16:15:50Z) - DeFine: Decision-Making with Analogical Reasoning over Factor Profiles [35.9909472797192]
textscDeFineは複雑なシナリオから確率係数プロファイルを構築するモジュラーフレームワークである。
次に、これらのプロファイルと類似の推論を統合して、新しい状況における重要な決定をLCMに導く。
このアプローチは、不確実性の下での意思決定が不可欠であるコンサルティングや金融交渉といった分野において特に有用である。
論文 参考訳(メタデータ) (2024-10-02T17:29:34Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。