論文の概要: ODTQA-FoRe: An Open-Domain Tabular Question Answering Dataset for Future Data Forecasting and Reasoning
- arxiv url: http://arxiv.org/abs/2606.02433v1
- Date: Mon, 01 Jun 2026 16:06:20 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-06-02 21:34:32.484254
- Title: ODTQA-FoRe: An Open-Domain Tabular Question Answering Dataset for Future Data Forecasting and Reasoning
- Title(参考訳): ODTQA-FoRe: 将来のデータ予測と推論のためのオープンドメイン質問回答データセット
- Authors: Zhensheng Wang, Xiaole Liu, Wenmian Yang, Kun Zhou, Yiquan Zhang, Weijia Jia,
- Abstract要約: 本稿では,将来データ予測と推論のための新しいタスク,オープンドメインタブラリ質問応答を導入する。
本稿では,不動産データを用いた時系列予測と予測に基づく推論シナリオを対象とした最初のデータセットを提案する。
- 参考スコア(独自算出の注目度): 21.778012103067805
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: The rapid development of LLMs has significantly advanced tabular question answering, but most systems cannot perform future-oriented numerical prediction. To address this gap, we introduce a novel task, Open-Domain Tabular Question Answering for Future Data Forecasting and Reasoning, and propose the first dataset to cover time-series forecasting and forecast-based reasoning scenarios using real estate data. This task poses challenges in retrieving precise historical data, overcoming the forecasting limitations of LLMs, and standardizing responses for diverse queries. To solve the above challenges, we propose TimeFore, an LLM agent-based framework that decomposes the problem into three collaborative roles: a Retriever autonomously generates SQL to fetch data, a Forecaster invokes external time-series models for higher accuracy, and an Analyzer synthesizes the results to construct a precise and consistent final answer. Extensive experiments demonstrate the effectiveness of our TimeFore.
- Abstract(参考訳): LLMの急速な開発は、表型質問応答を著しく進歩させたが、ほとんどのシステムは将来的な数値予測を行うことができない。
このギャップに対処するため、我々は、未来データ予測と推論のための新しいタスクであるOpen-Domain Tabular Question Answeringを導入し、不動産データを用いた時系列予測と予測に基づく推論シナリオをカバーする最初のデータセットを提案する。
このタスクは、正確な履歴データを取得し、LSMの予測限界を克服し、多様なクエリに対するレスポンスを標準化する上で、課題となる。
上記の課題を解決するために、我々はLLMエージェントベースのフレームワークであるTimeForeを提案する。RetrieverはデータをフェッチするためにSQLを自律的に生成し、Forecasterは外部時系列モデルを実行し、Analyzerは結果を合成し、正確で一貫した最終回答を構築する。
大規模な実験により、TimeForeの有効性が実証された。
関連論文リスト
- TopBench: A Benchmark for Implicit Prediction and Reasoning over Tabular Question Answering [80.93487993878836]
現実世界のクエリの一般的なクラスは暗黙的に予測され、単に検索するのではなく、歴史的パターンから観測されていない回答を推測する必要がある。
これらのクエリには、潜在意図を認識することと、大規模テーブル上での信頼性の高い予測推論という2つの課題がある。
単点予測から意思決定,処理効果分析,複雑な推論に至るまで,4つのサブタスクにわたる779のサンプルからなるベンチマークであるTopBenchを紹介する。
論文 参考訳(メタデータ) (2026-04-30T16:22:51Z) - Time-MQA: Time Series Multi-Task Question Answering with Context Enhancement [55.2439260314328]
Time Series Multi-Task Question Answering (Time-MQA)は、複数の時系列タスクにわたる自然言語クエリを可能にする統合フレームワークである。
Time-MQAの中心はTSQAデータセットである。
論文 参考訳(メタデータ) (2025-02-26T13:47:13Z) - Retrieval-augmented Large Language Models for Financial Time Series Forecasting [29.769616823587594]
我々は、金融時系列予測のための新しいドメイン固有検索器FinSeerを備えた、最初の検索拡張世代(RAG)フレームワークであるFinSragを紹介する。
FinSeer は LLM フィードバックによって改良された候補選択機構と類似性駆動型トレーニング目標を活用し、財務ノイズを除去しながらクエリを歴史的に影響力のあるシーケンスと整合させる。
我々は、より広範な金融指標を統合する新しいデータセットをキュレートすることで、検索コーパスを強化し、これまで見過ごされていた市場のダイナミクスを捉えます。
論文 参考訳(メタデータ) (2025-02-09T12:26:05Z) - Enhancing Temporal Understanding in LLMs for Semi-structured Tables [50.59009084277447]
我々は、大規模言語モデル(LLM)の特定の限界を特定するために、時間的データセットの包括的な分析を行う。
調査の結果,時間的時間的質問応答に特化したデータセットであるTempTabQAが強化された。
我々は,この領域におけるLLM機能を強化するために,新しいアプローチC.L.E.A.R.を導入する。
論文 参考訳(メタデータ) (2024-07-22T20:13:10Z) - A Comprehensive Evaluation of Large Language Models on Temporal Event Forecasting [45.0261082985087]
時間的事象予測のための大規模言語モデル(LLM)を総合的に評価する。
テキストによる微調整 LLM は性能を著しく向上させることができる。
しかし、LLMでは人気バイアスやロングテール問題などの問題が続いている。
論文 参考訳(メタデータ) (2024-07-16T11:58:54Z) - Pushing the Limits of Pre-training for Time Series Forecasting in the
CloudOps Domain [54.67888148566323]
クラウドオペレーションドメインから,大規模時系列予測データセットを3つ導入する。
強力なゼロショットベースラインであり、モデルとデータセットサイズの両方において、さらなるスケーリングの恩恵を受けています。
これらのデータセットと結果を取得することは、古典的および深層学習のベースラインを事前訓練された方法と比較した総合的なベンチマーク結果の集合である。
論文 参考訳(メタデータ) (2023-10-08T08:09:51Z) - Optimal Latent Space Forecasting for Large Collections of Short Time
Series Using Temporal Matrix Factorization [0.0]
複数の手法を評価し、それらの方法の1つを選択することや、最良の予測を生成するためのアンサンブルを選択するのが一般的である。
本稿では,低ランク時間行列係数化と潜在時系列上での最適モデル選択を組み合わせることで,短時間の高次元時系列データを予測するためのフレームワークを提案する。
論文 参考訳(メタデータ) (2021-12-15T11:39:21Z) - ForecastQA: A Question Answering Challenge for Event Forecasting with
Temporal Text Data [43.400630267599084]
イベント予測は、人間が常に未来に向けて計画しようとするため、難しいが重要な課題である。
タスクを定式化し、データセットを構築し、大量の構造化されていないテキストデータを用いたイベント予測手法を開発するためのベンチマークを提供する。
BERTベースのモデルを用いてForecastQA実験を行い、データセット上で最高のモデルが60.1%の精度で達成していることを確認した。
論文 参考訳(メタデータ) (2020-05-02T11:03:40Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。