Fugu-MT 論文翻訳(概要): Large Language Model for Table Processing: A Survey

論文の概要: Large Language Model for Table Processing: A Survey

arxiv url: http://arxiv.org/abs/2402.05121v2
Date: Fri, 26 Jul 2024 14:12:33 GMT
ステータス: 翻訳完了
システム内更新日: 2024-07-29 18:21:50.264939
Title: Large Language Model for Table Processing: A Survey
Title（参考訳）: テーブル処理のための大規模言語モデル:サーベイ
Authors: Weizheng Lu, Jing Zhang, Ju Fan, Zihao Fu, Yueguo Chen, Xiaoyong Du,
Abstract要約: 本調査では,テーブル関連タスクの概要について概観する。テーブル質問応答やスプレッドシート操作やテーブルデータ分析といった新しいフィールドなど、従来のタスクをカバーしています。
参考スコア（独自算出の注目度）: 18.32332372134988
License: http://creativecommons.org/licenses/by/4.0/
Abstract: Tables, typically two-dimensional and structured to store large amounts of data, are essential in daily activities like database queries, spreadsheet manipulations, web table question answering, and image table information extraction. Automating these table-centric tasks with Large Language Models (LLMs) or Visual Language Models (VLMs) offers significant public benefits, garnering interest from academia and industry. This survey provides a comprehensive overview of table-related tasks, examining both user scenarios and technical aspects. It covers traditional tasks like table question answering as well as emerging fields such as spreadsheet manipulation and table data analysis. We summarize the training techniques for LLMs and VLMs tailored for table processing. Additionally, we discuss prompt engineering, particularly the use of LLM-powered agents, for various table-related tasks. Finally, we highlight several challenges, including processing implicit user intentions and extracting information from various table sources.
Abstract（参考訳）: テーブルは一般的に2次元で、大量のデータを格納するために構成され、データベースクエリ、スプレッドシートの操作、ウェブテーブルの質問応答、画像テーブルの情報抽出といった日々の作業に欠かせない。これらのテーブル中心のタスクをLLM(Large Language Models)やVisual Language Models(Visual Language Models)で自動化することは、学術や産業からの関心を惹きつける、大きな公共の利益をもたらす。この調査は、ユーザシナリオと技術的な側面の両方を調べ、テーブル関連のタスクの包括的な概要を提供する。テーブル質問応答やスプレッドシート操作やテーブルデータ分析といった新しいフィールドなど、従来のタスクをカバーしています。テーブル処理に適したLLMとVLMのトレーニングテクニックを要約する。さらに,様々なテーブル関連タスクに対して,プロンプトエンジニアリング,特にLLMエージェントの使用について論じる。最後に、暗黙のユーザ意図の処理や、さまざまなテーブルソースからの情報抽出など、いくつかの課題を強調した。

関連論文リスト

Efficient Table Retrieval and Understanding with Multimodal Large Language Models [22.49099892041409]
タブラルデータは、財務報告、手書き記録、文書スキャンなど、幅広い現実世界のシナリオで画像形式でキャプチャされることが多い。これらの視覚表現は、構造的複雑さと視覚的複雑さの両方を組み合わせることによって、機械理解に固有の課題をもたらす。本研究では,MLLMがテーブルイメージの大規模なコレクション上でクエリに応答できるフレームワークであるTabRAGを提案する。
論文参考訳（メタデータ） (2026-02-07T17:50:33Z)
Tabular Data Understanding with LLMs: A Survey of Recent Advances and Challenges [22.054723113358865]
本稿では,表型入力表現の分類と表理解タスクの導入を通じて,重要な概念を紹介する。テーブルは2次元であり、構造化されたデータベーステーブルから複雑な多層スプレッドシートまで、それぞれ異なる目的を持った形式を含んでいる。我々は、さらなる研究の必要性を示す分野におけるいくつかの重要なギャップを強調している。
論文参考訳（メタデータ） (2025-07-31T23:41:31Z)
Table Understanding and (Multimodal) LLMs: A Cross-Domain Case Study on Scientific vs. Non-Scientific Data [12.56716294438794]
表理解タスクにおけるテキストベースLLMとマルチモーダルLLMの両方の有効性について検討する。我々は, 科学的文脈と非科学的文脈の表上でのパフォーマンスを比較し, 画像として表される表上での頑健さを, テキストで比較した。
論文参考訳（メタデータ） (2025-06-30T18:04:36Z)
MMTU: A Massive Multi-Task Table Understanding and Reasoning Benchmark [70.47478110973042]
MMTUは、25の現実世界のテーブルタスクに30万以上の質問がある大規模なベンチマークである。 MMTUは、専門家レベルで実際のテーブルを理解し、推論し、操作できるモデルを包括的に評価するように設計されている。 MMTUはテーブル理解、推論、コーディングといった、今日のフロンティアモデルにとって困難なスキルの組み合わせを必要としています。
論文参考訳（メタデータ） (2025-06-05T21:05:03Z)
GTR: Graph-Table-RAG for Cross-Table Question Answering [53.11230952572134]
テーブルコーパスをヘテロジニアスグラフに再構成するグラフテーブル-テーブル-RAG フレームワーク GTR を提案する。 GTRは、高いデプロイメント効率を維持しながら、より優れたクロステーブル質問応答性能を示し、実際の実用性を示している。
論文参考訳（メタデータ） (2025-04-02T04:24:41Z)
Multimodal Table Understanding [26.652797853893233]
直感的な視覚情報を使ってテーブルを直接理解する方法は、より実用的なアプリケーションを開発する上で極めて重要かつ緊急の課題である。そこで我々は,様々なテーブル関連要求に対して,モデルが正しい応答を生成する必要がある,新しい問題であるマルチモーダルテーブル理解を提案する。汎用マルチモーダル大言語モデル(MLLM)であるTable-LLaVAを開発した。
論文参考訳（メタデータ） (2024-06-12T11:27:03Z)
TACT: Advancing Complex Aggregative Reasoning with Information Extraction Tools [51.576974932743596]
大規模言語モデル(LLM)は、テキスト間の情報の集約を必要とするクエリではよく機能しないことが多い。 TACTには、1つ以上のテキストに散らばる縫合情報を要求する難しい命令が含まれている。既存のテキストと関連するテーブルのデータセットを活用することで、このデータセットを構築します。現代のLLMはいずれも,このデータセットでは性能が悪く,精度が38%以下であることが実証された。
論文参考訳（メタデータ） (2024-06-05T20:32:56Z)
TabPedia: Towards Comprehensive Visual Table Understanding with Concept Synergy [81.76462101465354]
本稿では,概念相乗効果機構を備えた新しい大型視触覚モデルTabPediaを提案する。この統合されたフレームワークにより、TabPediaはテーブル検出、テーブル構造認識、テーブルクエリ、テーブル質問応答などのVTUタスクをシームレスに統合できる。実世界のシナリオにおけるVTUタスクをよりよく評価するために、新しい総合的なテーブルVQAベンチマークComTQAを構築した。
論文参考訳（メタデータ） (2024-06-03T13:54:05Z)
TAP4LLM: Table Provider on Sampling, Augmenting, and Packing Semi-structured Data for Large Language Model Reasoning [55.33939289989238]
テーブルベースタスクにおいて,大規模言語モデル(LLM)を効果的に活用するための汎用プリプロセッサスイートとして,TAP4LLMを提案する。 1)大きなテーブルをクエリセマンティクスに基づいて管理可能なサブテーブルに分解するテーブルサンプリング、(2)外部ソースやモデルから追加の知識でテーブルを拡張するテーブル拡張、(3)テーブルパッキングとシリアライゼーションによりテーブルをLLMの理解に適したさまざまなフォーマットに変換する。
論文参考訳（メタデータ） (2023-12-14T15:37:04Z)
MultiTabQA: Generating Tabular Answers for Multi-Table Question Answering [61.48881995121938]
実世界のクエリは本質的に複雑で、リレーショナルデータベースやWebページ内の複数のテーブルにまたがることが多い。我々のモデルであるMultiTabQAは、複数のテーブル上の質問に答えるだけでなく、表形式の回答を生成するために一般化する。
論文参考訳（メタデータ） (2023-05-22T08:25:15Z)
OmniTab: Pretraining with Natural and Synthetic Data for Few-shot Table-based Question Answering [106.73213656603453]
最小限のアノテーションによるテーブルベースのQAモデルを構築した。本稿では、自然データと合成データの両方を消費する全能事前学習手法を提案する。
論文参考訳（メタデータ） (2022-07-08T01:23:45Z)
Table Retrieval May Not Necessitate Table-specific Model Design [83.27735758203089]
テーブル検索のタスクに焦点をあてて、"テーブル固有のモデル設計はテーブル検索に必要か? 自然質問データセット (NQ-table) の表に基づく分析の結果, 70%以上の症例では構造が無視できる役割を担っていることがわかった。次に、テーブル構造、すなわち補助列/カラム埋め込み、ハードアテンションマスク、ソフトリレーションに基づくアテンションバイアスを明示的にエンコードする3つのモジュールを実験する。いずれも大きな改善は得られず、テーブル固有のモデル設計がテーブル検索に不要である可能性が示唆された。
論文参考訳（メタデータ） (2022-05-19T20:35:23Z)
Table Pre-training: A Survey on Model Architectures, Pretraining Objectives, and Downstream Tasks [37.35651138851127]
テキストや画像の成功を受けて、テーブル事前学習フレームワークの急激な普及が提案されている。テーブル事前トレーニングは通常、テーブル-テキスト共同トレーニングの形式を取る。この調査は、さまざまなモデル設計、事前学習目標、およびテーブル事前学習のための下流タスクの包括的なレビューを提供することを目的としている。
論文参考訳（メタデータ） (2022-01-24T15:22:24Z)
TURL: Table Understanding through Representation Learning [29.6016859927782]
TURLは、リレーショナルWebテーブルに事前トレーニング/ファインタニングパラダイムを導入する新しいフレームワークである。事前学習中、我々のフレームワークは教師なしの方法で関係表上の深い文脈化された表現を学習する。我々は,TURLがすべてのタスクを一般化し,既存のメソッドをほぼすべてのインスタンスで大幅に上回っていることを示す。
論文参考訳（メタデータ） (2020-06-26T05:44:54Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。