論文の概要: FutureX-Pro: Extending Future Prediction to High-Value Vertical Domains
- arxiv url: http://arxiv.org/abs/2601.12259v1
- Date: Sun, 18 Jan 2026 04:44:49 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-01-21 22:47:22.53325
- Title: FutureX-Pro: Extending Future Prediction to High-Value Vertical Domains
- Title(参考訳): FutureX-Pro: 将来予測を高価値の垂直領域に拡張
- Authors: Jiashuo Liu, Siyuan Chen, Zaiyuan Wang, Zhiyuan Zeng, Jiacheng Guo, Liang Hu, Lingyue Yin, Suozhi Huang, Wenxin Hao, Yang Yang, Zerui Cheng, Zixin Yao, Lingyue Yin, Haoxin Liu, Jiayi Cheng, Yuzhen Li, Zezhong Ma, Bingjie Wang, Bingsen Qiu, Xiao Liu, Zeyang Zhang, Zijian Liu, Jinpeng Wang, Mingren Yin, Tianci He, Yali Liao, Yixiao Tian, Zhenwei Zhu, Anqi Dai, Ge Zhang, Jingkai Liu, Kaiyuan Zhang, Wenlong Wu, Xiang Gao, Xinjie Chen, Zhixin Yao, Zhoufutu Wen, B. Aditya Prakash, Jose Blanchet, Mengdi Wang, Nian Si, Wenhao Huang,
- Abstract要約: FutureX-Proは、財政、小売、公衆衛生、自然災害の4つの経済と社会的に重要な分野をターゲットにしている。
本稿では、FutureX-Finance、FutureX-Retail、FutureX-PublicHealth、FutureX-NaturalDisaster、FutureX-SearchなどのFutureX-Proを紹介する。
- 参考スコア(独自算出の注目度): 65.93452691624212
- License: http://creativecommons.org/licenses/by-nc-sa/4.0/
- Abstract: Building upon FutureX, which established a live benchmark for general-purpose future prediction, this report introduces FutureX-Pro, including FutureX-Finance, FutureX-Retail, FutureX-PublicHealth, FutureX-NaturalDisaster, and FutureX-Search. These together form a specialized framework extending agentic future prediction to high-value vertical domains. While generalist agents demonstrate proficiency in open-domain search, their reliability in capital-intensive and safety-critical sectors remains under-explored. FutureX-Pro targets four economically and socially pivotal verticals: Finance, Retail, Public Health, and Natural Disaster. We benchmark agentic Large Language Models (LLMs) on entry-level yet foundational prediction tasks -- ranging from forecasting market indicators and supply chain demands to tracking epidemic trends and natural disasters. By adapting the contamination-free, live-evaluation pipeline of FutureX, we assess whether current State-of-the-Art (SOTA) agentic LLMs possess the domain grounding necessary for industrial deployment. Our findings reveal the performance gap between generalist reasoning and the precision required for high-value vertical applications.
- Abstract(参考訳): 本報告では,FutureX-Finance,FutureX-Retail,FutureX-PublicHealth,FutureX-NaturalDisaster,FutureX-Searchなど,汎用のFutureX-Proのライブベンチマークを構築した。
これらは、エージェントの将来の予測を高価値の垂直領域に拡張する特別なフレームワークを形成する。
ジェネラリストのエージェントは、オープンドメイン検索の習熟度を示す一方で、資本集約的かつ安全クリティカルなセクターにおける信頼性は未調査のままである。
FutureX-Proは、金融、小売、公衆衛生、自然災害の4つの経済と社会的に重要な分野をターゲットにしている。
我々は、市場指標やサプライチェーン需要の予測から、流行の傾向や自然災害の追跡まで、エントリーレベルでありながら基礎的な予測タスクに関するエージェント型大規模言語モデル(LLM)をベンチマークする。
本研究では,FutureXの汚染のない実地評価パイプラインに適応して,現在のSOTAエージェントLLMが産業展開に必要なドメイン基盤を持っているかどうかを評価する。
以上の結果から,高値垂直適用に必要な一般化的推論と精度の差が明らかとなった。
関連論文リスト
- FutureX: An Advanced Live Benchmark for LLM Agents in Future Prediction [92.7392863957204]
FutureXは、将来の予測のための最大かつ最も多様なライブベンチマークである。
リアルタイムの日次更新をサポートし、質問収集と回答収集のための自動パイプラインを通じてデータの汚染を取り除く。
推論,検索機能,外部ツールの統合などを含む25のLLM/エージェントモデルを評価した。
論文 参考訳(メタデータ) (2025-08-16T08:54:08Z) - Deriving Strategic Market Insights with Large Language Models: A Benchmark for Forward Counterfactual Generation [55.2788567621326]
本稿では,FIN-FORCE-FINancial Forward Counterfactual Evaluationを提案する。
FIN-FORCEは金融ニュースの見出しをまとめることで、LLMベースの対実生成を支援する。
これにより、将来の市場展開を探索し、予測するためのスケーラブルで自動化されたソリューションの道を開くことができる。
論文 参考訳(メタデータ) (2025-05-26T02:41:50Z) - F-FOMAML: GNN-Enhanced Meta-Learning for Peak Period Demand Forecasting with Proxy Data [65.6499834212641]
本稿では,需要予測をメタラーニング問題として定式化し,F-FOMAMLアルゴリズムを開発した。
タスク固有のメタデータを通してドメインの類似性を考慮することにより、トレーニングタスクの数が増加するにつれて過剰なリスクが減少する一般化を改善した。
従来の最先端モデルと比較して,本手法では需要予測精度が著しく向上し,内部自動販売機データセットでは平均絶対誤差が26.24%,JD.comデータセットでは1.04%削減された。
論文 参考訳(メタデータ) (2024-06-23T21:28:50Z) - HoTPP Benchmark: Are We Good at the Long Horizon Events Forecasting? [1.3654846342364308]
長軸予測を厳格に評価するために設計された最初のベンチマークである HoTPP を紹介する。
我々は,広く使用されている評価指標の欠点を特定し,理論的に基礎付けられたT-mAP尺度を提案し,人気モデルの効率的な実装を提供する。
我々は,自己回帰と強度に基づく損失が予測品質に与える影響を分析し,今後の研究に向けた有望な方向性を概説する。
論文 参考訳(メタデータ) (2024-06-20T14:09:00Z) - Trading Signals In VIX Futures [0.19116784879310023]
我々は、VIX 未来という用語構造がマルコフモデルに従うと仮定する。
我々のトレーディング戦略は、日頭地平線に対する期待効用を最大化することで、VIX先物におけるポジションを選択する。
論文 参考訳(メタデータ) (2021-03-02T20:42:21Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。