論文の概要: TabSieve: Explicit In-Table Evidence Selection for Tabular Prediction
- arxiv url: http://arxiv.org/abs/2602.11700v1
- Date: Thu, 12 Feb 2026 08:28:58 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-02-13 21:07:25.718597
- Title: TabSieve: Explicit In-Table Evidence Selection for Tabular Prediction
- Title(参考訳): TabSieve: 単語予測のための明示的なIn-Tableエビデンス選択
- Authors: Yongyao Wang, Ziqi Miao, Lu Yang, Haonan Jia, Wenting Yan, Chen Qian, Lijun Li,
- Abstract要約: 提案するTabSieveは,エビデンスの使用を明確化し,監査可能にする,セレクトthen予測フレームワークである。
テーブルとクエリ行が与えられた後、TabSieveはまず、証拠として情報行の小さなセットを選択し、選択されたエビデンスに条件付けられた不足ターゲットを予測する。
75の分類と52の回帰表のホールドアウトベンチマークの実験は、TabSieveがショット予算で一貫してパフォーマンスを改善していることを示している。
- 参考スコア(独自算出の注目度): 14.270578219134997
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Tabular prediction can benefit from in-table rows as few-shot evidence, yet existing tabular models typically perform instance-wise inference and LLM-based prompting is often brittle. Models do not consistently leverage relevant rows, and noisy context can degrade performance. To address this challenge, we propose TabSieve, a select-then-predict framework that makes evidence usage explicit and auditable. Given a table and a query row, TabSieve first selects a small set of informative rows as evidence and then predicts the missing target conditioned on the selected evidence. To enable this capability, we construct TabSieve-SFT-40K by synthesizing high-quality reasoning trajectories from 331 real tables using a strong teacher model with strict filtering. Furthermore, we introduce TAB-GRPO, a reinforcement learning recipe that jointly optimizes evidence selection and prediction correctness with separate rewards, and stabilizes mixed regression and classification training via dynamic task-advantage balancing. Experiments on a held-out benchmark of 75 classification and 52 regression tables show that TabSieve consistently improves performance across shot budgets, with average gains of 2.92% on classification and 4.45% on regression over the second-best baseline. Further analysis indicates that TabSieve concentrates more attention on the selected evidence, which improves robustness to noisy context.
- Abstract(参考訳): タブラル予測は、少数の証拠としてテーブル内行の恩恵を受けることができるが、既存の表型モデルは、通常インスタンスワイズ推論を行い、LLMベースのプロンプトは不安定であることが多い。
モデルは関連する行を一貫して利用せず、ノイズの多いコンテキストはパフォーマンスを低下させる。
この課題に対処するため,我々は,エビデンスを明示的かつ監査可能な選択式予測フレームワークであるTabSieveを提案する。
テーブルとクエリ行が与えられた後、TabSieveはまず、証拠として情報行の小さなセットを選択し、選択されたエビデンスに条件付けられた不足ターゲットを予測する。
この機能を実現するために,厳密なフィルタリングを持つ強力な教師モデルを用いて,実テーブル331から高品質な推論軌道を合成し,TabSieve-SFT-40Kを構築する。
さらに,TAB-GRPOは,証拠選択と予測正当性を個別の報酬と共同で最適化し,動的タスクアドバンテージバランスによる混合回帰と分類訓練を安定化する強化学習法である。
75分類と52レグレッションテーブルのホールドアウトベンチマークの実験では、TabSieveはショット予算全体のパフォーマンスを一貫して改善し、平均2.92%が分類、4.45%が第2ベット基準よりもレグレッションが向上した。
さらなる分析は、TabSieveが選択された証拠により多くの注意を集中していることを示し、ノイズのある文脈に対する堅牢性を改善する。
関連論文リスト
- Explicit Uncertainty Modeling for Active CLIP Adaptation with Dual Prompt Tuning [51.99383151474742]
デュアルプロンプトチューニングに基づくアクティブCLIP適応のためのロバストな不確実性モデリングフレームワークを提案する。
提案手法は,同一のアノテーション予算の下で,既存のアクティブラーニング手法よりも一貫して優れていることを示す。
論文 参考訳(メタデータ) (2026-02-04T09:01:55Z) - CORE-T: COherent REtrieval of Tables for Text-to-SQL [91.76918495375384]
CORE-Tはスケーラブルでトレーニング不要なフレームワークで、テーブルに目的のメタデータを付加し、軽量なテーブル互換キャッシュをプリコンプリートする。
バード、スパイダー、MMQAを越えて、CORE-Tはテーブル選択F1を最大22.7ポイント改善し、最大42%のテーブルを検索する。
論文 参考訳(メタデータ) (2026-01-19T14:51:23Z) - Reasoning-Table: Exploring Reinforcement Learning for Table Reasoning [24.624844234355734]
Reasoning-Tableは、テーブル推論への強化学習(RL)の最初の応用であり、最先端の性能を実現している。
Reasoning-Tableは大きな言語モデルを推論する堅牢なテーブルとして登場し、Claude-3.7-Sonnetのようなより大きなプロプライエタリなモデルを4.0%上回っている。
論文 参考訳(メタデータ) (2025-06-02T14:18:09Z) - Towards Fair In-Context Learning with Tabular Foundation Models [6.4989916051093815]
トランスフォーマーを用いたインコンテクスト学習(ICL)におけるフェアネスの最初の研究について述べる。
最近提案された3つの基盤モデル(TabPFNv2、TabICL、TabDPT)をベンチマークデータセットで評価した。
実験の結果、不確実性に基づく戦略は、予測精度に最小限の影響を伴って、グループフェアネスの指標を一貫して改善することが示された。
論文 参考訳(メタデータ) (2025-05-14T15:53:14Z) - The Mighty ToRR: A Benchmark for Table Reasoning and Robustness [45.420943398134845]
ToRRはテーブル推論とロバストネスのベンチマークであり、テーブル関連のタスクにおけるモデル性能とロバストネスを測定している。
本稿では,ToRR上での先行モデルの結果を総合的に分析するとともに,リーダーボードを提案する。
論文 参考訳(メタデータ) (2025-02-26T18:56:38Z) - FLEXTAF: Enhancing Table Reasoning with Flexible Tabular Formats [48.47559543509975]
フレキシブルフォーマットを用いてテーブル推論性能を向上させるためのFLEXTAF-SingleとFLEXTAF-Voteを提案する。
WikiTableQuestionsとTabFactに関する我々の実験は、平均的な2.3%と4.8%の大幅な改善を示している。
論文 参考訳(メタデータ) (2024-08-16T17:00:11Z) - Chain-of-Table: Evolving Tables in the Reasoning Chain for Table
Understanding [79.9461269253121]
そこで我々は、中間思考のプロキシとして、図表データを推論チェーンで明示的に使用するChain-of-Tableフレームワークを提案する。
Chain-of-TableはWikiTQ、FeTaQA、TabFactベンチマークで最新のパフォーマンスを実現している。
論文 参考訳(メタデータ) (2024-01-09T07:46:26Z) - TAP4LLM: Table Provider on Sampling, Augmenting, and Packing Semi-structured Data for Large Language Model Reasoning [55.33939289989238]
テーブルベースタスクにおいて,大規模言語モデル(LLM)を効果的に活用するための汎用プリプロセッサスイートとして,TAP4LLMを提案する。
1)大きなテーブルをクエリセマンティクスに基づいて管理可能なサブテーブルに分解するテーブルサンプリング、(2)外部ソースやモデルから追加の知識でテーブルを拡張するテーブル拡張、(3)テーブルパッキングとシリアライゼーションによりテーブルをLLMの理解に適したさまざまなフォーマットに変換する。
論文 参考訳(メタデータ) (2023-12-14T15:37:04Z) - TabPert: An Effective Platform for Tabular Perturbation [6.555691728969102]
TabPertを使用すると、ユーザはテーブルを更新し、関連する仮説を変更し、ラベルを変更し、仮説分類に重要な行をハイライトすることができる。
これらのカウンターファクトテーブルと仮説は、メタデータと同様に、既存のモデルの欠点を体系的かつ定量的に探求するために使用することができる。
論文 参考訳(メタデータ) (2021-08-02T02:37:48Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。