論文の概要: The World Leaks the Future: Harness Evolution for Future Prediction Agents
- arxiv url: http://arxiv.org/abs/2604.15719v1
- Date: Fri, 17 Apr 2026 05:43:07 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-04-20 22:00:19.754941
- Title: The World Leaks the Future: Harness Evolution for Future Prediction Agents
- Title(参考訳): 世界が未来を漏らす:未来予測エージェントのハーネス進化
- Authors: Chuyang Wei, Maohang Gao, Zhixin Han, Kefei Chen, Yu Zhuang, Haoxiang Guan, Yanzhi Zhang, Yilin Cheng, Jiyan He, Huanhuan Chen, Jian Li, Yu Shi, Yitong Duan, Shuxin Zheng,
- Abstract要約: 本稿では,因子追跡,エビデンス収集・解釈,不確実性処理のための持続的エンファンフューチャー予測ハーネスを更新する,自己進化型エージェントシステムであるemphMilkywayを紹介する。
FutureXとFutureWorldでは、FutureXを44.07から60.90に改善し、FutureWorldを62.22から77.96に改善した。
- 参考スコア(独自算出の注目度): 29.472216827724882
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Many consequential decisions must be made before the relevant outcome is known. Such problems are commonly framed as \emph{future prediction}, where an LLM agent must form a prediction for an unresolved question using only the public information available at the prediction time. The setting is difficult because public evidence evolves while useful supervision arrives only after the question is resolved, so most existing approaches still improve mainly from final outcomes. Yet final outcomes are too coarse to guide earlier factor tracking, evidence gathering and interpretation, or uncertainty handling. When the same unresolved question is revisited over time, temporal contrasts between earlier and later predictions can expose omissions in the earlier prediction process; we call this signal \emph{internal feedback}. We introduce \emph{Milkyway}, a self-evolving agent system that keeps the base model fixed and instead updates a persistent \emph{future prediction harness} for factor tracking, evidence gathering and interpretation, and uncertainty handling. Across repeated predictions on the same unresolved question, \emph{Milkyway} extracts internal feedback and writes reusable guidance back into the harness, so later predictions on that question can improve before the outcome is known. After the question is resolved, the final outcome provides a \emph{retrospective check} before the updated harness is carried forward to subsequent questions. On FutureX and FutureWorld, Milkyway achieves the best overall score among the compared methods, improving FutureX from 44.07 to 60.90 and FutureWorld from 62.22 to 77.96.
- Abstract(参考訳): 関連する結果が知られる前に、多くの連続的な決定をしなければならない。
このような問題は一般に 'emph{future prediction} と呼ばれ、LLMエージェントは予測時に利用可能な公開情報のみを使用して未解決の質問を予測しなければならない。
この設定は、公的な証拠が進化する一方、有効な監視は問題解決後にのみ行われるため、既存のほとんどのアプローチは、主に最終結果から改善されている。
しかし、最終的な結果は、早期の要因追跡、証拠収集と解釈、不確実性処理を導くには大きすぎる。
同じ未解決の質問が時間とともに再検討されるとき、それ以前の予測と後の予測の時間的コントラストは、以前の予測プロセスで省略を露呈し、このシグナルを「emph{internal feedback}」と呼ぶ。
本稿では,基本モデルを固定した自己進化エージェントシステムである \emph{Milkyway を紹介し,その代わりに要素追跡,エビデンス収集,解釈,不確実性処理のための永続的な \emph{future prediction harness} を更新する。
同じ未解決の質問に対する繰り返し予測の中で、 \emph{Milkyway} は内部フィードバックを抽出し、再利用可能なガイダンスをハーネスに書き込む。
問題が解決した後、最終的な結果は、更新されたハーネスがその後の質問に進む前に \emph{retrospective check} を提供する。
FutureXとFutureWorldでは、FutureXを44.07から60.90に改善し、FutureWorldを62.22から77.96に改善した。
関連論文リスト
- Future-as-Label: Scalable Supervision from Real-World Outcomes [0.0]
時が自由な監督を生み出す: 現実の出来事に関する予測は、検証可能な結果に解決する。
我々は、実世界の予測に時間をかけて検証可能な報酬で強化学習を拡張した。
我々は、因果的にマスキングされた情報から確率予測を行うために言語モデルを訓練する。
論文 参考訳(メタデータ) (2026-01-09T22:15:12Z) - Performative Prediction on Games and Mechanism Design [69.7933059664256]
エージェントが過去の正確性に基づいて予測を信頼するかを判断する集団リスクジレンマについて検討する。
予測が集合的な結果を形成するにつれて、社会福祉は関心の指標として自然に現れる。
よりよいトレードオフを実現し、それらをメカニズム設計に使用する方法を示します。
論文 参考訳(メタデータ) (2024-08-09T16:03:44Z) - Back to the Future: GNN-based NO$_2$ Forecasting via Future Covariates [49.93577170464313]
都市全域にわたる地上監視ネットワークにおける大気質観測について検討する。
我々は過去と将来の共変分を現在の観測に埋め込む条件付きブロックを提案する。
将来の気象情報に対する条件付けは,過去の交通状況を考えるよりも影響が大きいことが判明した。
論文 参考訳(メタデータ) (2024-04-08T09:13:16Z) - Best of Many in Both Worlds: Online Resource Allocation with Predictions under Unknown Arrival Model [16.466711636334587]
オンライン意思決定者は、到着や要求など、将来の変数に関する予測を得ることが多い。
意思決定者にとって予測精度は未知であるため、予測に盲目的に追従することは有害である。
我々は未知の予測精度に頑健な方法で予測を利用するアルゴリズムを開発した。
論文 参考訳(メタデータ) (2024-02-21T04:57:32Z) - Adaptive Human Trajectory Prediction via Latent Corridors [49.13061580045407]
シーン固有の適応軌道予測の問題を定式化する。
本稿では,潜伏回廊と呼ばれる即時チューニングにインスパイアされた新しい適応手法を提案する。
0.1%の追加モデルパラメータでは、MOTシンスシミュレーションデータの改善が23.9%、MOTおよびワイルドトラックにおけるADEが16.4%となる。
論文 参考訳(メタデータ) (2023-12-11T18:59:12Z) - Stochastic Future Prediction in Real World Driving Scenarios [0.0]
将来予測法は、堅牢である可能性全体を網羅するべきである。
自動運転では、予測部分の複数のモードをカバーすることが、安全クリティカルな決定を下す上で極めて重要である。
本研究では,動きを明示的にモデル化し,時間的ダイナミクスを潜時空間で学習する手法を提案する。
論文 参考訳(メタデータ) (2022-09-21T22:34:31Z) - What Should I Know? Using Meta-gradient Descent for Predictive Feature
Discovery in a Single Stream of Experience [63.75363908696257]
計算強化学習は、未来の感覚の予測を通じて、エージェントの世界の知覚を構築しようとする。
この一連の作業において、オープンな課題は、エージェントがどの予測が意思決定を最も支援できるかを、無限に多くの予測から決定することである。
本稿では,エージェントが何を予測するかを学習するメタ段階的な降下過程,(2)選択した予測の見積もり,3)将来の報酬を最大化するポリシーを生成する方法を紹介する。
論文 参考訳(メタデータ) (2022-06-13T21:31:06Z) - StretchBEV: Stretching Future Instance Prediction Spatially and
Temporally [0.0]
自動運転車では、車を取り巻くすべてのエージェントの位置と動きから未来を予測することが、計画にとって重要な要件である。
近年,複数のカメラから知覚されるリッチな感覚情報を小型の鳥眼ビュー表現に融合させて予測を行うことにより,知覚と予測の新たな共同定式化が進んでいる。
しかし、将来の予測の質は、複数の妥当な予測のために、より長い時間的地平線に拡張しながら、時間とともに劣化する。
本研究では,将来の予測におけるこのような不確実性に時間的モデルを用いて対処する。
論文 参考訳(メタデータ) (2022-03-25T13:28:44Z) - Probability Paths and the Structure of Predictions over Time [14.208729304407536]
天気予報から政治的予測に至るまで、将来の2次結果の確率推定はしばしば時間とともに進化する。
時間とともに動的予測の構造をモデル化するためのベイズ的枠組みを導入する。
予測の動的構造を時間とともに解明することで、個人がより情報のある選択を行えるようにしたいと考えています。
論文 参考訳(メタデータ) (2021-06-11T17:18:05Z) - Ambiguity in Sequential Data: Predicting Uncertain Futures with
Recurrent Models [110.82452096672182]
逐次データによる曖昧な予測を扱うために,Multiple hypothesis Prediction(MHP)モデルの拡張を提案する。
また、不確実性を考慮するのに適した曖昧な問題に対する新しい尺度も導入する。
論文 参考訳(メタデータ) (2020-03-10T09:15:42Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。