論文の概要: What If TSF: A Benchmark for Reframing Forecasting as Scenario-Guided Multimodal Forecasting
- arxiv url: http://arxiv.org/abs/2601.08509v1
- Date: Tue, 13 Jan 2026 12:47:43 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-01-14 18:27:19.198609
- Title: What If TSF: A Benchmark for Reframing Forecasting as Scenario-Guided Multimodal Forecasting
- Title(参考訳): TSF:シナリオガイドによるマルチモーダル予測のためのベンチマーク
- Authors: Jinkwan Jang, Hyunbin Jin, Hyungjin Park, Kyubyung Chae, Taesup Kim,
- Abstract要約: TSF(WIT)は、モデルが文脈テキストで予測を条件付けできるかどうかを評価するためのベンチマークである。
WITはシナリオ誘導型マルチモーダル予測のための厳格なテストベッドを提供する。
- 参考スコア(独自算出の注目度): 8.593646221015264
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Time series forecasting is critical to real-world decision making, yet most existing approaches remain unimodal and rely on extrapolating historical patterns. While recent progress in large language models (LLMs) highlights the potential for multimodal forecasting, existing benchmarks largely provide retrospective or misaligned raw context, making it unclear whether such models meaningfully leverage textual inputs. In practice, human experts incorporate what-if scenarios with historical evidence, often producing distinct forecasts from the same observations under different scenarios. Inspired by this, we introduce What If TSF (WIT), a multimodal forecasting benchmark designed to evaluate whether models can condition their forecasts on contextual text, especially future scenarios. By providing expert-crafted plausible or counterfactual scenarios, WIT offers a rigorous testbed for scenario-guided multimodal forecasting. The benchmark is available at https://github.com/jinkwan1115/WhatIfTSF.
- Abstract(参考訳): 時系列の予測は現実の意思決定にとって重要であるが、既存のアプローチのほとんどは非定型的であり、歴史的パターンの補間に依存している。
大規模言語モデル(LLMs)の最近の進歩は、マルチモーダルな予測の可能性を強調しているが、既存のベンチマークは、主に振り返りや生のコンテキストが一致していないため、そのようなモデルがテキスト入力を有意に活用するかどうかは不明である。
実際には、人間の専門家は、過去の証拠に何のシナリオを組み込んでおり、しばしば異なるシナリオの下で同じ観測から異なる予測を生成する。
そこで本研究では,文脈テキスト,特に将来のシナリオにおいて,モデルが予測を条件付けることができるかどうかを評価するためのマルチモーダル予測ベンチマークであるWhat If TSF(WIT)を紹介する。
WITは、専門家が作成する有望なシナリオや反現実的なシナリオを提供することで、シナリオ誘導マルチモーダル予測のための厳密なテストベッドを提供する。
ベンチマークはhttps://github.com/jinkwan1115/WhatIfTSFで公開されている。
関連論文リスト
- Realistic Test-Time Adaptation of Vision-Language Models [23.972884634610413]
VLM(Vision-Language Models)は、予測性能を改善するために広く活用されている。
トランスダクティブまたはテストタイム適応(TTA)に関する以前の研究は、しばしばデータ分布について強い仮定を下す。
私たちの作業は、これらの好ましいデプロイメントシナリオに挑戦し、より現実的な評価フレームワークを導入します。
論文 参考訳(メタデータ) (2025-01-07T12:17:25Z) - Context is Key: A Benchmark for Forecasting with Essential Textual Information [87.3175915185287]
コンテキスト is Key" (CiK) は、数値データを多種多様なテキストコンテキストと組み合わせた予測ベンチマークである。
我々は,統計モデル,時系列基礎モデル,LLMに基づく予測モデルなど,さまざまなアプローチを評価する。
提案手法は,提案するベンチマークにおいて,他の試験手法よりも優れる簡易かつ効果的なLCMプロンプト法である。
論文 参考訳(メタデータ) (2024-10-24T17:56:08Z) - HoTPP Benchmark: Are We Good at the Long Horizon Events Forecasting? [1.3654846342364308]
長軸予測を厳格に評価するために設計された最初のベンチマークである HoTPP を紹介する。
我々は,広く使用されている評価指標の欠点を特定し,理論的に基礎付けられたT-mAP尺度を提案し,人気モデルの効率的な実装を提供する。
我々は,自己回帰と強度に基づく損失が予測品質に与える影響を分析し,今後の研究に向けた有望な方向性を概説する。
論文 参考訳(メタデータ) (2024-06-20T14:09:00Z) - Benchmarking Sequential Visual Input Reasoning and Prediction in
Multimodal Large Language Models [21.438427686724932]
本稿では,MLLMの予測推論能力を様々なシナリオで評価する新しいベンチマークを提案する。
本ベンチマークでは,抽象パターン推論,人間活動予測,物理的相互作用予測という3つの重要な領域を対象としている。
実験により,提案したベンチマークの音質と評価方法が検証された。
論文 参考訳(メタデータ) (2023-10-20T13:14:38Z) - Learning Interpretable Deep State Space Model for Probabilistic Time
Series Forecasting [98.57851612518758]
確率的時系列予測は、その歴史に基づいて将来の分布を推定する。
本稿では,非線形エミッションモデルと遷移モデルとをネットワークによってパラメータ化した,確率的時系列予測のための深部状態空間モデルを提案する。
実験では,我々のモデルが正確かつ鋭い確率予測を生成することを示す。
論文 参考訳(メタデータ) (2021-01-31T06:49:33Z) - Ambiguity in Sequential Data: Predicting Uncertain Futures with
Recurrent Models [110.82452096672182]
逐次データによる曖昧な予測を扱うために,Multiple hypothesis Prediction(MHP)モデルの拡張を提案する。
また、不確実性を考慮するのに適した曖昧な問題に対する新しい尺度も導入する。
論文 参考訳(メタデータ) (2020-03-10T09:15:42Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。