論文の概要: From Table to Cell: Attention for Better Reasoning with TABALIGN
- arxiv url: http://arxiv.org/abs/2605.14465v1
- Date: Thu, 14 May 2026 07:00:26 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-05-15 21:45:34.676494
- Title: From Table to Cell: Attention for Better Reasoning with TABALIGN
- Title(参考訳): テーブルからセルへ:TABALIGNによる推論改善への留意
- Authors: Tung Sum Thomas Kwok, Zeyong Zhang, Xinyu Wang, Chunhe Wang, Xiaofeng Lin, Hanwei Wu, Lei Ding, Guang Cheng, Zhijiang Guo,
- Abstract要約: 計画と実行が明示的なセルグラウンド契約を共有しないため、構造化テーブル上の多段階LSM推論は失敗する。
契約を運用するテーブル推論フレームワークであるTABALIGNを提案する。
- 参考スコア(独自算出の注目度): 17.847003670797324
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Multi-step LLM reasoning over structured tables fails because planning and execution share no explicit cell-grounding contract. Existing methods constrain the planner to a left-to-right factorization at odds with table permutation invariance, and score intermediate states by generated content alone, overlooking cell grounding. We conduct a pilot study showing that diffusion language models (DLMs) produce more human-aligned and permutation-stable cell attention on tables than autoregressive models, with a 40.2% median reduction in attention-AUROC variability under row reordering. Motivated by this, we propose TABALIGN, a planned table reasoning framework that operationalizes the contract. TABALIGN pairs a masked DLM planner, whose bidirectional denoising emits plan steps as binary cell masks, with TABATTN, a lightweight verifier trained on 1,600 human-verified attention standards to score each step by its attention overlap with the plan-designated mask. Across eight benchmarks covering table question answering and fact verification, TABALIGN improves average accuracy by 15.76 percentage points over the strongest open-source baseline at comparable 8B-class scale, with a matched-backbone ablation attributing 2.87 percentage points of this gain to the DLM planner over an AR planner on a fixed reasoner. Cleaner DLM plans also accelerate downstream reasoning execution by 44.64%.
- Abstract(参考訳): 計画と実行が明示的なセルグラウンド契約を共有しないため、構造化テーブル上の多段階LSM推論は失敗する。
既存の方法は、テーブルの置換不変性と相反して、プランナーを左から右への分解に制限し、セルの接地を見渡して、生成されたコンテンツだけで中間状態をスコアする。
本研究では,拡散言語モデル (DLMs) が自己回帰モデルよりも表上でより人間に順応し,順応可能なセルアテンションを生じさせることを示すパイロット実験を行い,行再注文時のアテンション-AUROC 変動の中央値が 40.2% 減少することを示した。
そこで本研究では,契約を運用するテーブル推論フレームワークであるTABALIGNを提案する。
TABATTNは、1,600人の認証された注意基準に基づいてトレーニングされた軽量検証器で、計画指定のマスクと重なり合うように各ステップをスコア付けする。
テーブル質問応答と事実検証をカバーする8つのベンチマークで、TABALIGNは8Bクラスの最強のオープンソースベースラインに対して平均精度を15.76ポイント向上し、一致したバックボーンのアブレーションは、固定された推論器上のARプランナーよりもDLMプランナーに2.87ポイント貢献する。
よりクリーンなDLM計画は下流の推論の実行を44.64%加速させる。
関連論文リスト
- TableMind++: An Uncertainty-Aware Programmatic Agent for Tool-Augmented Table Reasoning [44.20336483508951]
テーブル推論は、意味的理解と正確な数値操作を共同で行うモデルを必要とする。
これらの制約に対処するため、我々は以前TableMindをチューニングベースの自律型プログラムエージェントとして提案した。
この基盤をTableMind++に拡張し、新しい不確実性を認識した推論フレームワークを導入しました。
論文 参考訳(メタデータ) (2026-03-08T08:31:33Z) - CORE-T: COherent REtrieval of Tables for Text-to-SQL [91.76918495375384]
CORE-Tはスケーラブルでトレーニング不要なフレームワークで、テーブルに目的のメタデータを付加し、軽量なテーブル互換キャッシュをプリコンプリートする。
バード、スパイダー、MMQAを越えて、CORE-Tはテーブル選択F1を最大22.7ポイント改善し、最大42%のテーブルを検索する。
論文 参考訳(メタデータ) (2026-01-19T14:51:23Z) - Subspace Alignment for Vision-Language Model Test-time Adaptation [82.83192844597593]
視覚言語モデル(VLM)は分布シフトに対して脆弱である。
既存のテスト時間適応法は、自己学習のための擬似ラベルとしてゼロショット予測に依存している。
両モードのセマンティック部分空間を整列させてゼロショット予測を強化するSubTTAを提案する。
論文 参考訳(メタデータ) (2026-01-13T02:02:41Z) - TabR1: Taming GRPO for tabular reasoning LLMs [12.303771262614484]
本稿では,多段階推論を用いた表型予測のための最初の推論LLMであるTabR1を提案する。
その中核は、単純だが効率的な強化学習法である置換相対ポリシー最適化(PRPO)である。
PRPOはスパース報酬を濃密な学習信号に変換し、一般化を改善する。
論文 参考訳(メタデータ) (2025-10-20T10:22:01Z) - TaTToo: Tool-Grounded Thinking PRM for Test-Time Scaling in Tabular Reasoning [77.01182934427095]
TaTTooは、ツールベースの検証を統合し、正確な報酬管理を提供する新しいテーブルグラウンドのPRMフレームワークである。
私たちはTTTooを2段階のパラダイムでトレーニングします。ツール使用推論パターンをキャプチャするために、コールドスタートの教師による微調整を行い、続いて強化学習を行い、私たちのモデルをテーブルベースの検証と整合させます。
論文 参考訳(メタデータ) (2025-10-07T17:59:41Z) - Table-r1: Self-supervised and Reinforcement Learning for Program-based Table Reasoning in Small Language Models [52.94091440130039]
表推論(TR)は、半構造化データに対する構造化推論を必要とする。
小型言語モデル(SLM)は、大きなLM(LLM、例えばGPT-4o)と比較して限られた能力を持つ。
実行可能プログラムを生成することで、テキストベースTR(T-TR)の鍵となる制限を回避するプログラムベースTR(P-TR)を提案する。
4つのTRベンチマークの実験により、Table-r1は全てのSLMベースの手法より優れていることが示された。
論文 参考訳(メタデータ) (2025-06-06T14:52:19Z) - Exploring Performance Contrasts in TableQA: Step-by-Step Reasoning Boosts Bigger Language Models, Limits Smaller Language Models [6.083393426133172]
本稿では,大小言語モデル(LM)の性能コントラストを検討するために,テーブル論理(Table-Logic)と呼ばれる詳細なプロンプトフローを提案する。
本手法の展開により,Llama-3-70Bのような大型LMにおいて,HybridQA上のバニラに比べて7.8%の精度向上が見られた。
本研究は,小型モデルにおけるステップ・バイ・ステップの推論手法の限界を浮き彫りにし,改善のための潜在的洞察を提供するものである。
論文 参考訳(メタデータ) (2024-11-24T22:48:44Z) - TAP4LLM: Table Provider on Sampling, Augmenting, and Packing Semi-structured Data for Large Language Model Reasoning [55.33939289989238]
テーブルベースタスクにおいて,大規模言語モデル(LLM)を効果的に活用するための汎用プリプロセッサスイートとして,TAP4LLMを提案する。
1)大きなテーブルをクエリセマンティクスに基づいて管理可能なサブテーブルに分解するテーブルサンプリング、(2)外部ソースやモデルから追加の知識でテーブルを拡張するテーブル拡張、(3)テーブルパッキングとシリアライゼーションによりテーブルをLLMの理解に適したさまざまなフォーマットに変換する。
論文 参考訳(メタデータ) (2023-12-14T15:37:04Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。