論文の概要: When Agents Trade: Live Multi-Market Trading Benchmark for LLM Agents
- arxiv url: http://arxiv.org/abs/2510.11695v1
- Date: Mon, 13 Oct 2025 17:54:09 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-10-14 18:06:30.498158
- Title: When Agents Trade: Live Multi-Market Trading Benchmark for LLM Agents
- Title(参考訳): エージェントが取引する時 - LLMエージェントのマルチマーケットトレーディングベンチマーク
- Authors: Lingfei Qian, Xueqing Peng, Yan Wang, Vincent Jim Zhang, Huan He, Hanley Smith, Yi Han, Yueru He, Haohang Li, Yupeng Cao, Yangyang Yu, Alejandro Lopez-Lira, Peng Lu, Jian-Yun Nie, Guojun Xiong, Jimin Huang, Sophia Ananiadou,
- Abstract要約: Agent Market Arena (AMA)は、LLM(Large Language Model)ベースのトレーディングエージェントを評価するための、初めてのリアルタイムベンチマークである。
AMAは、検証済みのトレーディングデータ、専門家チェックされたニュース、および統一されたトレーディングフレームワーク内に多様なエージェントアーキテクチャを統合する。
GPT-4o、GPT-4.1、Claude-3.5-haiku、Claude-sonnet-4、Gemini-2.0-flashにまたがる薬剤を評価する。
- 参考スコア(独自算出の注目度): 74.55061622246824
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Although Large Language Model (LLM)-based agents are increasingly used in financial trading, it remains unclear whether they can reason and adapt in live markets, as most studies test models instead of agents, cover limited periods and assets, and rely on unverified data. To address these gaps, we introduce Agent Market Arena (AMA), the first lifelong, real-time benchmark for evaluating LLM-based trading agents across multiple markets. AMA integrates verified trading data, expert-checked news, and diverse agent architectures within a unified trading framework, enabling fair and continuous comparison under real conditions. It implements four agents, including InvestorAgent as a single-agent baseline, TradeAgent and HedgeFundAgent with different risk styles, and DeepFundAgent with memory-based reasoning, and evaluates them across GPT-4o, GPT-4.1, Claude-3.5-haiku, Claude-sonnet-4, and Gemini-2.0-flash. Live experiments on both cryptocurrency and stock markets demonstrate that agent frameworks display markedly distinct behavioral patterns, spanning from aggressive risk-taking to conservative decision-making, whereas model backbones contribute less to outcome variation. AMA thus establishes a foundation for rigorous, reproducible, and continuously evolving evaluation of financial reasoning and trading intelligence in LLM-based agents.
- Abstract(参考訳): LLM(Large Language Model)ベースのエージェントは金融取引での利用が増えているが、エージェントの代わりにモデルを試し、限られた期間と資産をカバーし、検証されていないデータに依存しているため、ライブマーケットで理屈と適応が可能であるかどうかは不明だ。
これらのギャップに対処するため、複数の市場にわたるLSMベースのトレーディングエージェントを評価するための、最初の生涯リアルタイムベンチマークであるエージェントマーケットアリーナ(AMA)を紹介します。
AMAは、検証済みのトレーディングデータ、専門家チェックされたニュース、および多様なエージェントアーキテクチャを統合されたトレーディングフレームワークに統合し、実際の条件下での公正かつ継続的な比較を可能にする。
単一のエージェントとしてInvestorAgent、異なるリスクスタイルでTradeAgentとHedgeFundAgent、メモリベースの推論でDeepFundAgent、GPT-4o、GPT-4.1、Claude-3.5-haiku、Claude-sonnet-4、Gemini-2.0-flashの4つのエージェントを実装している。
暗号通貨と株式市場の両方でのライブ実験では、攻撃的なリスクテイキングから保守的な意思決定まで、エージェントフレームワークが明らかに異なる行動パターンを示すのに対し、モデルバックボーンは結果の変動にはあまり寄与しないことを示した。
したがって、AMAは、LLMベースのエージェントにおける、厳格で再現性があり、継続的な発展を続ける金融推論とトレーディングインテリジェンスの評価の基礎を確立している。
関連論文リスト
- StockBench: Can LLM Agents Trade Stocks Profitably In Real-world Markets? [44.10622904101254]
大規模言語モデル(LLM)は、最近、自律エージェントとして強力な能力を示した。
実時間複数ヶ月の株式トレーディング環境でLLMエージェントを評価するためのベンチマークであるStockBenchを紹介する。
我々の評価では、ほとんどのLLMエージェントは、単純な買い買い得ベースラインよりも優れているが、いくつかのモデルでは、より高いリターンをもたらし、より効果的にリスクを管理する可能性を実証している。
論文 参考訳(メタデータ) (2025-10-02T16:54:57Z) - Agent Trading Arena: A Study on Numerical Understanding in LLM-Based Agents [69.58565132975504]
大規模言語モデル(LLM)は、自然言語処理において顕著な能力を示した。
LLMをベースとしたエージェントが競合するマルチエージェント取引を行う仮想ゼロサム株式市場であるエージェントトレーディングアリーナを提示する。
論文 参考訳(メタデータ) (2025-02-25T08:41:01Z) - TradingAgents: Multi-Agents LLM Financial Trading Framework [4.293484524693143]
TradingAgentsは、トレーディング会社にインスパイアされた新しい株式トレーディングフレームワークを提案する。
基本的なアナリスト、センチメントアナリスト、テクニカルアナリスト、さまざまなリスクプロファイルを持つトレーダーといった専門的な役割でLLMを動力とするエージェントが特徴である。
動的で協調的なトレーディング環境をシミュレートすることで、このフレームワークはトレーディングのパフォーマンスを改善することを目指している。
論文 参考訳(メタデータ) (2024-12-28T12:54:06Z) - When AI Meets Finance (StockAgent): Large Language Model-based Stock Trading in Simulated Real-world Environments [55.19252983108372]
LLMによって駆動される、StockAgentと呼ばれるマルチエージェントAIシステムを開発した。
StockAgentを使えば、ユーザーはさまざまな外部要因が投資家取引に与える影響を評価することができる。
AIエージェントに基づく既存のトレーディングシミュレーションシステムに存在するテストセットのリーク問題を回避する。
論文 参考訳(メタデータ) (2024-07-15T06:49:30Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。