論文の概要: Tabular Data Understanding with LLMs: A Survey of Recent Advances and Challenges
- arxiv url: http://arxiv.org/abs/2508.00217v1
- Date: Thu, 31 Jul 2025 23:41:31 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-08-04 18:08:53.689447
- Title: Tabular Data Understanding with LLMs: A Survey of Recent Advances and Challenges
- Title(参考訳): LLMを用いた語彙データ理解 : 最近の進歩と課題
- Authors: Xiaofeng Wu, Alan Ritter, Wei Xu,
- Abstract要約: 本稿では,表型入力表現の分類と表理解タスクの導入を通じて,重要な概念を紹介する。
テーブルは2次元であり、構造化されたデータベーステーブルから複雑な多層スプレッドシートまで、それぞれ異なる目的を持った形式を含んでいる。
我々は、さらなる研究の必要性を示す分野におけるいくつかの重要なギャップを強調している。
- 参考スコア(独自算出の注目度): 22.054723113358865
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Tables have gained significant attention in large language models (LLMs) and multimodal large language models (MLLMs) due to their complex and flexible structure. Unlike linear text inputs, tables are two-dimensional, encompassing formats that range from well-structured database tables to complex, multi-layered spreadsheets, each with different purposes. This diversity in format and purpose has led to the development of specialized methods and tasks, instead of universal approaches, making navigation of table understanding tasks challenging. To address these challenges, this paper introduces key concepts through a taxonomy of tabular input representations and an introduction of table understanding tasks. We highlight several critical gaps in the field that indicate the need for further research: (1) the predominance of retrieval-focused tasks that require minimal reasoning beyond mathematical and logical operations; (2) significant challenges faced by models when processing complex table structures, large-scale tables, length context, or multi-table scenarios; and (3) the limited generalization of models across different tabular representations and formats.
- Abstract(参考訳): テーブルは、その複雑で柔軟な構造のため、大型言語モデル (LLM) やマルチモーダル・大規模言語モデル (MLLM) に大きな注目を集めている。
線形テキスト入力とは異なり、テーブルは2次元であり、構造化されたデータベーステーブルから複雑な多層スプレッドシートまで、それぞれ異なる目的を持った形式を含んでいる。
この形式と目的の多様性は、普遍的なアプローチではなく、特殊な方法やタスクの開発をもたらし、テーブル理解タスクのナビゲーションを困難にしている。
これらの課題に対処するために,表型入力表現の分類と表理解タスクの導入を通じて重要な概念を紹介する。
1)数学的および論理的操作を超える最小の推論を必要とする検索中心のタスクの優位性、(2)複雑なテーブル構造、大規模テーブル、長さコンテキスト、マルチテーブルシナリオを処理する場合のモデルが直面する重大な課題、(3)異なる表表表現や形式にまたがるモデルの限定的な一般化。
関連論文リスト
- Multimodal Tabular Reasoning with Privileged Structured Information [67.40011423365712]
ブリッジインfOrmation (sc Turbo) を用いたタブウラー推論(TabUlar Reasoning)について紹介する。
sc TurboはDeepSeek-R1をベースにした構造対応の推論トレースジェネレータの恩恵を受ける。
sc Turboは、複数のデータセットで最先端のパフォーマンス(+7.2%対以前のSOTA)を達成する。
論文 参考訳(メタデータ) (2025-06-04T15:46:30Z) - Enhancing Large Vision-Language Models with Layout Modality for Table Question Answering on Japanese Annual Securities Reports [4.2134954427867]
In-table テキストコンテンツとレイアウト機能を組み込んだ LVLM を用いたテーブル理解手法を提案する。
実験により,これらの補助モーダルは性能を著しく向上することが示された。
論文 参考訳(メタデータ) (2025-05-23T08:36:22Z) - QFMTS: Generating Query-Focused Summaries over Multi-Table Inputs [63.98556480088152]
表要約は、情報を簡潔で分かりやすいテキスト要約に凝縮するための重要な課題である。
本稿では,クエリ中心のマルチテーブル要約を導入することで,これらの制約に対処する新しい手法を提案する。
提案手法は,テーブルシリアライズモジュール,要約コントローラ,および大規模言語モデルからなり,ユーザの情報要求に合わせたクエリ依存のテーブル要約を生成する。
論文 参考訳(メタデータ) (2024-05-08T15:05:55Z) - Large Language Model for Table Processing: A Survey [18.32332372134988]
本調査では,テーブル関連タスクの概要について概観する。
テーブル質問応答やスプレッドシート操作やテーブルデータ分析といった新しいフィールドなど、従来のタスクをカバーしています。
論文 参考訳(メタデータ) (2024-02-04T00:47:53Z) - TAP4LLM: Table Provider on Sampling, Augmenting, and Packing Semi-structured Data for Large Language Model Reasoning [55.33939289989238]
テーブルベースタスクにおいて,大規模言語モデル(LLM)を効果的に活用するための汎用プリプロセッサスイートとして,TAP4LLMを提案する。
1)大きなテーブルをクエリセマンティクスに基づいて管理可能なサブテーブルに分解するテーブルサンプリング、(2)外部ソースやモデルから追加の知識でテーブルを拡張するテーブル拡張、(3)テーブルパッキングとシリアライゼーションによりテーブルをLLMの理解に適したさまざまなフォーマットに変換する。
論文 参考訳(メタデータ) (2023-12-14T15:37:04Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。