論文の概要: Learning to Trade Like an Expert: Cognitive Fine-Tuning for Stable Financial Reasoning in Language Models
- arxiv url: http://arxiv.org/abs/2604.16862v1
- Date: Sat, 18 Apr 2026 06:24:41 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-04-21 21:52:52.206855
- Title: Learning to Trade Like an Expert: Cognitive Fine-Tuning for Stable Financial Reasoning in Language Models
- Title(参考訳): 専門家としての貿易を学ぶ:言語モデルにおける安定的財務推論のための認知的微調整
- Authors: Yuchen Pan, Soung Chang Liew,
- Abstract要約: 近年の大規模言語モデル(LLM)の自律的取引代理店としての展開は、金融決定能力が特定の市場パターンを超えて一般化するかどうかという疑問を提起している。
本稿では,このようなモデルをトレーニングし,評価するための構造化フレームワークを提案する。そのアプローチの中心は,古典的な教科書や歴史市場から派生した,キュレートされた多点質問(MCQ)データセットである。
- 参考スコア(独自算出の注目度): 13.434482682938842
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Recent deployments of large language models (LLMs) as autonomous trading agents raise questions about whether financial decision-making competence generalizes beyond specific market patterns and how it should be trained and evaluated in noisy markets lacking ground truth. We propose a structured framework for training and evaluating such models. Central to our approach is a curated, multiple-choice question (MCQ) dataset derived from classic textbooks and historical markets, verified by an AI committee, enriched with structured reasoning traces, and augmented to reduce shortcut learning. To evaluate whether performance on isolated MCQs generalizes to real-world trading, we introduce a two-stage protocol combining test-set evaluation with an MCQ-based chronological trading simulation. Extensive evaluations across market regimes provide statistically robust evidence that open models trained with our framework exhibit competitive, risk-aware behavior over time, outperform open-source baselines, and approach frontier-model performance at smaller scale. We release the dataset and evaluation framework to support further research.
- Abstract(参考訳): 近年の大規模言語モデル(LLM)の自律的取引代理店としての展開は、金融決定能力が特定の市場パターンを超えて一般化するかどうか、根本的真実を欠く騒々しい市場でどのように訓練・評価されるべきかという疑問を提起している。
本稿では,そのようなモデルをトレーニングし,評価するための構造化フレームワークを提案する。
我々のアプローチの中心は、古典的な教科書や歴史市場から派生した、構造化された推論トレースに富んだAI委員会によって検証され、ショートカット学習を減らすために強化された、キュレートされた多重選択質問データセット(MCQ)である。
分離MCQの性能が実世界取引に一般化するかどうかを評価するため,テストセット評価とMCQに基づく時系列取引シミュレーションを組み合わせた2段階のプロトコルを提案する。
市場体制全体にわたる広範囲な評価は、我々のフレームワークでトレーニングされたオープンモデルは、時間とともに競争力があり、リスクを認識し、オープンソースベースラインを上回り、より小さなスケールでフロンティアモデルのパフォーマンスにアプローチする、という統計的に堅牢な証拠を提供する。
さらなる研究を支援するためのデータセットと評価フレームワークをリリースする。
関連論文リスト
- Evaluation of Agents under Simulated AI Marketplace Dynamics [72.02953516461965]
本稿では,情報アクセスシステムを競争市場への参加として評価するシミュレーションに基づくパラダイムを提案する。
我々はこの枠組みを定式化し、TRECのような評価キャンペーンにおける市場シミュレーション、メトリクス、最適化、導入に関する、ビジネスと経済に動機付けられた研究課題の概要を述べる。
論文 参考訳(メタデータ) (2026-04-15T15:01:36Z) - Exploring a New Competency Modeling Process with Large Language Models [0.0]
本研究では,大規模言語モデル(LLM)に基づく新しい能力モデリングプロセスを提案する。
具体的には、LLMを利用して、生のテキストデータから行動的・心理的記述を抽出する。
学習可能なパラメータを導入し、異なる情報ソースを適応的に統合し、モデルが行動信号と心理信号の相対的重要性を決定できるようにする。
論文 参考訳(メタデータ) (2026-02-13T16:46:51Z) - Confidence as a Reward: Transforming LLMs into Reward Models [54.98336080630691]
Confidence-as-a-Reward (CRew) は、モデルの最終回答に対するトークンレベルの信頼を報酬のプロキシとして利用する、トレーニング不要の手法である。
CRew は MATH500 および RewardMATH ベンチマークにおいて,既存のトレーニングフリー報酬手法よりも優れていることを示す。
本稿では,信頼度スコアと正当性信号を組み合わせた選好データを構成する訓練戦略であるCRew-DPOを提案する。
論文 参考訳(メタデータ) (2025-10-15T12:51:47Z) - Trade in Minutes! Rationality-Driven Agentic System for Quantitative Financial Trading [57.28635022507172]
TiMiは、アーキテクチャ上、戦略開発を分単位のデプロイメントから切り離す合理性駆動型マルチエージェントシステムである。
本稿では,マクロパターンからマイクロカスタマイズ,トレーディングボット実装のための階層型プログラミング設計,数学的リフレクションによって駆動されるクローズドループ最適化までの2層解析パラダイムを提案する。
論文 参考訳(メタデータ) (2025-10-06T13:08:55Z) - To Trade or Not to Trade: An Agentic Approach to Estimating Market Risk Improves Trading Decisions [0.0]
大規模言語モデル(LLM)はますますエージェントフレームワークにデプロイされている。
我々は LLM を用いて金融時系列の微分方程式を反復的に発見するエージェントシステムを開発した。
モデルインフォームドトレーディング戦略は標準LLMエージェントよりも優れていた。
論文 参考訳(メタデータ) (2025-07-11T13:29:32Z) - Generative Market Equilibrium Models with Stable Adversarial Learning via Reinforcement [10.35300946640037]
我々は、最小限のモデリング仮定の下で、継続的金融市場均衡を解くための一般的な計算フレームワークを提案する。
GAN(Generative Adversarial Network)に触発された本手法では,新たな生成的深層強化学習フレームワークを採用する。
我々のアルゴリズムは、学習するだけでなく、市場参加者の内在的な取引行動から資産の返却とボラティリティがどのように出現するかを検証可能な予測も提供する。
論文 参考訳(メタデータ) (2025-04-05T23:29:46Z) - Benchmarks as Microscopes: A Call for Model Metrology [76.64402390208576]
現代の言語モデル(LM)は、能力評価において新たな課題を提起する。
メトリクスに自信を持つためには、モデルミアロジの新たな規律が必要です。
論文 参考訳(メタデータ) (2024-07-22T17:52:12Z) - An Auction-based Marketplace for Model Trading in Federated Learning [54.79736037670377]
フェデレートラーニング(FL)は、局所的な分散データを用いたトレーニングモデルにおいて、その効果がますます認識されている。
FLはモデルのマーケットプレースであり、顧客は買い手と売り手の両方として振る舞う。
本稿では,性能向上に基づく適切な価格設定を実現するため,オークションベースのソリューションを提案する。
論文 参考訳(メタデータ) (2024-02-02T07:25:53Z) - A Marketplace for Trading AI Models based on Blockchain and Incentives
for IoT Data [24.847898465750667]
機械学習(ML)の新たなパラダイムは、学習モデルを異種エージェントのグループに部分的に配信するフェデレートされたアプローチであり、エージェントは自身のデータでモデルをローカルにトレーニングすることができる。
モデルの評価の問題や、協調トレーニングやデータ/モデルの取引に対するインセンティブの問題は、文献において限られた扱いを受けてきた。
本稿では、信頼されたMLベースのネットワーク上でのMLモデルトレーディングの新しいエコシステムを提案する。買い手はML市場から関心のモデルを取得することができ、興味のある売り手はそのモデルの品質を高めるためにローカルな計算に費やす。
論文 参考訳(メタデータ) (2021-12-06T08:52:42Z) - Adaptive learning for financial markets mixing model-based and
model-free RL for volatility targeting [0.0]
モデルフリー強化学習は安定した環境において有意義な成果を上げてきたが、今日でも金融市場のような環境の変化に問題がある。
モデルフリーな深層強化学習により,様々なモデルベースアプローチを選択することで,この2つの手法のベストを組み合わせることを提案する。
論文 参考訳(メタデータ) (2021-04-19T19:20:22Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。