論文の概要: Auditing Asset-Specific Preferences in Financial Large Language Models: Evidence from Bitcoin Representations and Portfolio Allocation
- arxiv url: http://arxiv.org/abs/2606.02528v1
- Date: Mon, 01 Jun 2026 17:36:06 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-06-02 21:34:32.541942
- Title: Auditing Asset-Specific Preferences in Financial Large Language Models: Evidence from Bitcoin Representations and Portfolio Allocation
- Title(参考訳): 金融大規模言語モデルにおけるアセット特長の検証:Bitcoin表現とポートフォリオアロケーションからの証拠
- Authors: Wenbin Wu,
- Abstract要約: ビットコインの通貨的指標のランキングはフレーム依存であることが示されています。
Gemma 3の何千ものスパースオートエンコーダ機能を対象とした検索では、主要なBitcoin選択機能が確認されている。
我々はこれをバウンドな行動レバレッジ(財務レバレッジではなく、アウトプットに対する因果的な影響を平均的に意味する)として特徴づける。
- 参考スコア(独自算出の注目度): 2.912535004465788
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Large language models now power robo-advisors and trading agents, yet whether they carry built-in biases toward specific assets is largely untested. We ask three questions: do LLMs systematically prefer certain financial instruments; can an internal representation with causal leverage over those preferences be identified; and does that representation affect downstream financial decisions? We develop a three-level audit protocol and apply it to Bitcoin. First, a behavioral audit of eight frontier LLMs shows that Bitcoin's ranking among money-like instruments is frame-dependent: models place it around rank 5 of 8 as "reliable money" but near the top under crisis and autonomous-agent frames, and an attribute-swap experiment confirms rankings track functional properties, not names. Second, we open a model's internals: a search across thousands of sparse-autoencoder features in Gemma 3 identifies a dominant Bitcoin-selective feature. Amplifying it shifts the model toward the asset and suppressing it shifts the model away, even when "Bitcoin" never appears in the prompt. Third, we test financial consequences: amplification raises Bitcoin's portfolio share by 5.2 percentage points while suppression lowers it by 4.6 pp, with amplification reallocating within crypto and suppression cutting total crypto exposure. We characterize this as bounded behavioral leverage (leverage meaning causal influence over outputs, not financial leverage): an identifiable internal feature can be perturbed to move financial choices, but only within measurable limits. The framework links internal representations to external recommendations, validated with random controls and mechanism boundaries. As LLMs become autonomous financial agents, this is a first step toward a behavioral layer for emerging know-your-agent (KYA) standards: knowing what an agent prefers, and how far that preference can be moved.
- Abstract(参考訳): 大規模言語モデルは今やロボアドバイザやトレーディングエージェントに電力を供給しているが、それらが特定の資産に対する組み込みバイアスを担っているかどうかはほとんどテストされていない。
我々は3つの質問に答える: LLMは体系的に特定の金融商品を好み、それらの選好よりも因果的レバレッジを伴う内部表現は特定できるか、そして、その表現は下流の金融決定に影響を及ぼすか?
我々は3段階の監査プロトコルを開発し、それをBitcoinに適用する。
まず、8つのフロンティアのLCMの行動監査では、ビットコインの通貨的指標のランクはフレーム依存であることが示されています。
次に、モデルの内部をオープンします。Gemma 3で何千ものスパースオートエンコーダ機能を対象とした検索は、主要なBitcoin選択機能を特定します。
モデルのアセットへのシフトを増幅し、プロンプトに"Bitcoin"が決して現れない場合でも、モデルからアセットへのシフトを抑える。
第3に、増幅はビットコインのポートフォリオシェアを5.2ポイント引き上げ、抑制は4.6pp下げ、増幅は暗号通貨内で再配置され、暗号通貨の露出を抑える。
金融レバレッジではなく、アウトプットに対する因果的な影響を平均的に意味する)境界的行動レバレッジ(bounded behavioral leverage)として特徴付けます。
このフレームワークは、内部表現を外部レコメンデーションにリンクし、ランダム制御とメカニズム境界で検証する。
LLMが自律的な金融エージェントになるにつれ、これは、エージェントが何を好むのか、その好みがどこまで移動できるかを知るという、新しいノウ・ユーア・エージェント(KYA)標準のための行動層への第一歩となる。
関連論文リスト
- Measurement Risk in Supervised Financial NLP: Rubric and Metric Sensitivity on JF-ICR [1.7107991816118835]
我が国の金融インシシデント・コミット認識における測定リスクについて検討する。
ルーブリックな単語は、モデル指定ラベルを根本的に変えることが判明した。
すべての計量は、JF-ICRクラス分布の下では情報的ではない。
論文 参考訳(メタデータ) (2026-04-30T03:39:14Z) - TRUST: A Framework for Decentralized AI Service v.0.1 [47.384270414446604]
大規模推論モデル (LRM) とマルチエージェントシステム (MAS) は, 信頼性の高い検証を必要とする。
TRUST(Transparent, Robust, and Unified Services for Trustworthy AI)は,3つのイノベーションを備えた分散フレームワークである。
我々は、悪質な俳優が損失を被っている間、正直な監査人の利益を確実に確保する安全利益理論を証明する。
論文 参考訳(メタデータ) (2026-04-29T19:32:58Z) - StableAML: Machine Learning for Behavioral Wallet Detection in Stablecoin Anti-Money Laundering on Ethereum [1.6492745888221318]
世界の違法なファンドフローは年間3.1兆ドルを超えており、流動性のために洗剤として好まれる。
本研究では、データセットを分析し、行動特徴を用いてロバストなAMLフレームワークを開発する。
高精度検出を自動化することにより、イノベーションを損なうことなく、経済的不作為の経済的コストを効果的に高めるアプローチを提案する。
論文 参考訳(メタデータ) (2026-02-19T21:13:39Z) - The Treasury Proof Ledger: A Cryptographic Framework for Accountable Bitcoin Treasuries [0.0]
本稿では,多ドメインBitcoin宝庫のためのBitcoin対応ロギングフレームワークであるSecretary Proof Ledger(TPL)を紹介する。
TPLインスタンスは、スナップショットの保存の証明、ドメイン間の移動の検証のレシート、ポリシーメタデータを記録する。
我々は、TPLが責任ある透明性ポリシーと将来のビットコインの固定的通貨供給と整合した将来的な機関間チェックをどのようにサポートするかを示す。
論文 参考訳(メタデータ) (2025-12-03T13:14:06Z) - When Agents Trade: Live Multi-Market Trading Benchmark for LLM Agents [74.55061622246824]
Agent Market Arena (AMA)は、LLM(Large Language Model)ベースのトレーディングエージェントを評価するための、初めてのリアルタイムベンチマークである。
AMAは、検証済みのトレーディングデータ、専門家チェックされたニュース、および統一されたトレーディングフレームワーク内に多様なエージェントアーキテクチャを統合する。
GPT-4o、GPT-4.1、Claude-3.5-haiku、Claude-sonnet-4、Gemini-2.0-flashにまたがる薬剤を評価する。
論文 参考訳(メタデータ) (2025-10-13T17:54:09Z) - Towards a Formal Foundation for Blockchain Rollups [5.770720128901053]
ZK-Rollupsは、トランザクションをオフチェーンで処理し、メインチェーンで検証することで、課題に対処することを目指している。
現在の形では、L2はマルチシグ攻撃の影響を受けやすいため、総ユーザー資金の損失につながる可能性がある。
本研究は,アロイ仕様言語を用いて,鍵層2の機能の検証と設計を行う形式解析である。
論文 参考訳(メタデータ) (2024-06-23T21:12:19Z) - From Asset Flow to Status, Action and Intention Discovery: Early Malice
Detection in Cryptocurrency [9.878712887719978]
理想的な検出モデルは, (I) 早期検出, (II) 良好な解釈性, (III) 様々な不正行為に対する汎用性の3つの重要な特性をすべて達成できることが期待される。
Intention-Monitor for early malice detection in Bitcoin (BTC)では、特定のアドレスのオンチェーンレコードデータが他の暗号通貨プラットフォームよりもはるかに少ない。
我々のモデルは高度に解釈可能であり、様々な違法な活動を検出することができる。
論文 参考訳(メタデータ) (2023-09-26T07:12:59Z) - Do the Rewards Justify the Means? Measuring Trade-Offs Between Rewards
and Ethical Behavior in the MACHIAVELLI Benchmark [61.43264961005614]
我々は、50万以上のリッチで多様なシナリオを含む134個のChoose-Your-Own-Adventureゲームのベンチマークを開発する。
我々は、エージェントの傾向をパワー・シーキングと評価し、不使用を生じさせ、倫理的違反を犯す。
以上の結果から,エージェントは有能かつ道徳的に行動できることが示唆された。
論文 参考訳(メタデータ) (2023-04-06T17:59:03Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。