論文の概要: CN-Buzz2Portfolio: A Chinese-Market Dataset and Benchmark for LLM-Based Macro and Sector Asset Allocation from Daily Trending Financial News
- arxiv url: http://arxiv.org/abs/2603.22305v1
- Date: Wed, 18 Mar 2026 02:31:28 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-03-25 19:53:37.041142
- Title: CN-Buzz2Portfolio: A Chinese-Market Dataset and Benchmark for LLM-Based Macro and Sector Asset Allocation from Daily Trending Financial News
- Title(参考訳): CN-Buzz2Portfolio:日次トレンドファイナンシャルニュースからLLMベースのマクロおよびセクターアセットの中国市場データセットとベンチマーク
- Authors: Liyuan Chen, Shilong Li, Jiangpeng Yan, Shuoling Liu, Qiang Yang, Xiu Li,
- Abstract要約: 大規模言語モデル(LLM)は、静的自然言語処理(NLP)タスクから動的意思決定エージェントへと急速に移行している。
直接のライブトレーディングは非生産的であり、スキルに幸運を抱くことによって結果バイアスを起こす傾向にあるが、既存の静的ベンチマークはエンティティレベルの株式選択に限定され、より広範な市場注目を無視することが多い。
この研究は、一般的な推論と金融決定の整合性に関する新たな洞察を与え、持続可能な金融エージェントの研究を促進するために、すべてのデータ、コード、実験がリリースされる。
- 参考スコア(独自算出の注目度): 21.498084305999992
- License: http://creativecommons.org/licenses/by-nc-sa/4.0/
- Abstract: Large Language Models (LLMs) are rapidly transitioning from static Natural Language Processing (NLP) tasks including sentiment analysis and event extraction to acting as dynamic decision-making agents in complex financial environments. However, the evolution of LLMs into autonomous financial agents faces a significant dilemma in evaluation paradigms. Direct live trading is irreproducible and prone to outcome bias by confounding luck with skill, whereas existing static benchmarks are often confined to entity-level stock picking and ignore broader market attention. To facilitate the rigorous analysis of these challenges, we introduce CN-Buzz2Portfolio, a reproducible benchmark grounded in the Chinese market that maps daily trending news to macro and sector asset allocation. Spanning a rolling horizon from 2024 to mid-2025, our dataset simulates a realistic public attention stream, requiring agents to distill investment logic from high-exposure narratives instead of pre-filtered entity news. We propose a Tri-Stage CPA Agent Workflow involving Compression, Perception, and Allocation to evaluate LLMs on broad asset classes such as Exchange Traded Funds (ETFs) rather than individual stocks, thereby reducing idiosyncratic volatility. Extensive experiments on nine LLMs reveal significant disparities in how models translate macro-level narratives into portfolio weights. This work provides new insights into the alignment between general reasoning and financial decision-making, and all data, codes, and experiments are released to promote sustainable financial agent research.
- Abstract(参考訳): 大規模言語モデル(LLM)は、感情分析やイベント抽出を含む静的自然言語処理(NLP)タスクから、複雑な金融環境における動的意思決定エージェントとしての機能へと急速に移行している。
しかし、LLMの自律的金融エージェントへの進化は、評価パラダイムにおいて大きなジレンマに直面している。
直接のライブトレーディングは非生産的であり、スキルに幸運を抱くことによって結果バイアスを起こす傾向にあるが、既存の静的ベンチマークはエンティティレベルの株式選択に限定され、より広範な市場注目を無視することが多い。
これらの課題の厳密な分析を容易にするため,中国市場において,毎日のトレンドニュースをマクロやセクターのアセットアロケーションにマッピングする再現可能なベンチマークであるCN-Buzz2Portfolioを導入する。
2024年から2025年半ばにかけて、我々のデータセットは現実的な大衆の注目の流れをシミュレートし、エージェントは事前にフィルターされたエンティティニュースではなく、高露出の物語から投資ロジックを抽出する必要がある。
本稿では,圧縮・知覚・割当を含む3段階のCPAエージェントワークフローを提案し,個々の株式よりもETF(Exchange Traded Funds)などの幅広い資産クラスでLCMを評価することにより,慣用的ボラティリティの低減を図る。
9つのLLMに関する大規模な実験は、モデルがマクロレベルの物語をポートフォリオの重みにどのように変換するかにおいて、大きな違いを示している。
この研究は、一般的な推論と金融決定の整合性に関する新たな洞察を与え、持続可能な金融エージェントの研究を促進するために、すべてのデータ、コード、実験がリリースされる。
関連論文リスト
- LiveTradeBench: Seeking Real-World Alpha with Large Language Models [26.976122048323873]
大規模言語モデル(LLM)は、ベンチマーク全体で強力なパフォーマンスを達成する。
これらのテストは静的な設定で行われ、実際のダイナミクスと不確実性が欠如している。
LLMエージェントを現実的で発展途上国で評価するためのライブトレーディング環境であるLiveTradeBenchを紹介する。
論文 参考訳(メタデータ) (2025-11-05T16:47:26Z) - StockBench: Can LLM Agents Trade Stocks Profitably In Real-world Markets? [44.10622904101254]
大規模言語モデル(LLM)は、最近、自律エージェントとして強力な能力を示した。
実時間複数ヶ月の株式トレーディング環境でLLMエージェントを評価するためのベンチマークであるStockBenchを紹介する。
我々の評価では、ほとんどのLLMエージェントは、単純な買い買い得ベースラインよりも優れているが、いくつかのモデルでは、より高いリターンをもたらし、より効果的にリスクを管理する可能性を実証している。
論文 参考訳(メタデータ) (2025-10-02T16:54:57Z) - Time Travel is Cheating: Going Live with DeepFund for Real-Time Fund Investment Benchmarking [14.366119135730512]
LLM(Large Language Models)は、財務タスクにまたがる顕著な機能を示す。
複雑なファンド投資を管理するための現実的な効果は、まだ不十分に評価されている。
我々は,LLMをリアルタイム市場環境で厳格に評価するために設計された,ライブファンドベンチマークツールであるDeepFundを紹介する。
論文 参考訳(メタデータ) (2025-05-16T10:00:56Z) - Will LLMs be Professional at Fund Investment? DeepFund: A Live Arena Perspective [10.932591941137698]
大規模言語モデル(LLM)は、様々な領域にまたがって印象的な能力を示してきたが、財務的な意思決定におけるその効果は、いまだに不十分である。
実環境におけるLCMベースのトレーディング戦略を評価するための総合的なアリーナプラットフォームであるDeepFundを紹介する。
当社のアプローチでは,実世界の投資決定プロセスを実現する上で,複数の重要な役割を担うマルチエージェントフレームワークを実装している。
論文 参考訳(メタデータ) (2025-03-24T03:32:13Z) - Agent Trading Arena: A Study on Numerical Understanding in LLM-Based Agents [69.58565132975504]
大規模言語モデル(LLM)は、自然言語処理において顕著な能力を示した。
LLMをベースとしたエージェントが競合するマルチエージェント取引を行う仮想ゼロサム株式市場であるエージェントトレーディングアリーナを提示する。
論文 参考訳(メタデータ) (2025-02-25T08:41:01Z) - When AI Meets Finance (StockAgent): Large Language Model-based Stock Trading in Simulated Real-world Environments [55.19252983108372]
LLMによって駆動される、StockAgentと呼ばれるマルチエージェントAIシステムを開発した。
StockAgentを使えば、ユーザーはさまざまな外部要因が投資家取引に与える影響を評価することができる。
AIエージェントに基づく既存のトレーディングシミュレーションシステムに存在するテストセットのリーク問題を回避する。
論文 参考訳(メタデータ) (2024-07-15T06:49:30Z) - Can ChatGPT Forecast Stock Price Movements? Return Predictability and Large Language Models [48.87381259980254]
我々は、ChatGPTのような大規模言語モデル(LLM)が、直接の金融トレーニングなしでニュースの見出しから株式市場の反応を予測する能力について文書化している。
GPT-4は、認識後カットオフの見出しを使って、最初の市場の反応を捉え、取引不能な初期反応に対して、ポートフォリオの1日当たりのヒット率を約90%達成している。
論文 参考訳(メタデータ) (2023-04-15T19:22:37Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。