論文の概要: Improving Table Understanding with LLMs and Entity-Oriented Search
- arxiv url: http://arxiv.org/abs/2508.17028v1
- Date: Sat, 23 Aug 2025 14:02:45 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-08-26 18:43:45.303699
- Title: Improving Table Understanding with LLMs and Entity-Oriented Search
- Title(参考訳): LLMとエンティティ指向検索によるテーブル理解の改善
- Authors: Thi-Nhung Nguyen, Hoang Ngo, Dinh Phung, Thuy-Trang Vu, Dat Quoc Nguyen,
- Abstract要約: 大規模言語モデル(LLM)を用いたテーブル理解向上のためのエンティティ指向検索手法を提案する。
このアプローチは、質問とテーブルデータ間の意味的類似性、およびテーブルセル間の暗黙的な関係を効果的に活用する。
テーブルエンティティにフォーカスし、テーブルセルがセマンティックにタイトに束縛されていることを保証する。
- 参考スコア(独自算出の注目度): 24.3302301035859
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Our work addresses the challenges of understanding tables. Existing methods often struggle with the unpredictable nature of table content, leading to a reliance on preprocessing and keyword matching. They also face limitations due to the lack of contextual information, which complicates the reasoning processes of large language models (LLMs). To overcome these challenges, we introduce an entity-oriented search method to improve table understanding with LLMs. This approach effectively leverages the semantic similarities between questions and table data, as well as the implicit relationships between table cells, minimizing the need for data preprocessing and keyword matching. Additionally, it focuses on table entities, ensuring that table cells are semantically tightly bound, thereby enhancing contextual clarity. Furthermore, we pioneer the use of a graph query language for table understanding, establishing a new research direction. Experiments show that our approach achieves new state-of-the-art performances on standard benchmarks WikiTableQuestions and TabFact.
- Abstract(参考訳): 我々の仕事は表を理解するという課題に対処する。
既存の手法は予測不可能なテーブル内容の性質に苦しむことが多く、前処理やキーワードマッチングに依存している。
また、文脈情報がないため、大きな言語モデル(LLM)の推論プロセスが複雑になるため、制約に直面している。
これらの課題を克服するために,LLMを用いたテーブル理解を改善するエンティティ指向検索手法を提案する。
このアプローチは、質問とテーブルデータ間のセマンティックな類似性、およびテーブルセル間の暗黙の関係を効果的に活用し、データ前処理とキーワードマッチングの必要性を最小限にする。
さらに、テーブルエンティティに焦点を当て、テーブルセルがセマンティックにタイトにバインドされていることを保証する。
さらに、テーブル理解のためのグラフクエリ言語の利用を開拓し、新たな研究方向性を確立した。
実験の結果, WikiTableQuestions や TabFact といった標準ベンチマークを用いて, 最新の性能を実現することができた。
関連論文リスト
- An LLM Agent-Based Complex Semantic Table Annotation Approach [13.427066390210538]
本稿では,LLMを用いたカラム型エージェント手法を提案する。
CTAとCell Entity。
CEA。
ReActフレームワークに基づいて、調整されたプロンプトで5つの外部メトリクスを設計、実装します。
冗長アノテーションを減らすためにLevenshtein距離を利用することで、時間コストの70%削減とLLMトークンの使用率の60%削減を実現した。
論文 参考訳(メタデータ) (2025-08-18T12:09:20Z) - TableMaster: A Recipe to Advance Table Understanding with Language Models [2.506624215459612]
TableMasterはレシピと包括的なフレームワークで、これらの障害を克服するために複数のソリューションを統合する。
WikiTQデータセットでは、GPT-4o-miniを使用して78.13%の精度を達成し、既存のベースラインを上回っている。
論文 参考訳(メタデータ) (2025-01-31T18:31:31Z) - Chain-of-Table: Evolving Tables in the Reasoning Chain for Table
Understanding [79.9461269253121]
そこで我々は、中間思考のプロキシとして、図表データを推論チェーンで明示的に使用するChain-of-Tableフレームワークを提案する。
Chain-of-TableはWikiTQ、FeTaQA、TabFactベンチマークで最新のパフォーマンスを実現している。
論文 参考訳(メタデータ) (2024-01-09T07:46:26Z) - TAP4LLM: Table Provider on Sampling, Augmenting, and Packing Semi-structured Data for Large Language Model Reasoning [55.33939289989238]
テーブルベースタスクにおいて,大規模言語モデル(LLM)を効果的に活用するための汎用プリプロセッサスイートとして,TAP4LLMを提案する。
1)大きなテーブルをクエリセマンティクスに基づいて管理可能なサブテーブルに分解するテーブルサンプリング、(2)外部ソースやモデルから追加の知識でテーブルを拡張するテーブル拡張、(3)テーブルパッキングとシリアライゼーションによりテーブルをLLMの理解に適したさまざまなフォーマットに変換する。
論文 参考訳(メタデータ) (2023-12-14T15:37:04Z) - GraPPa: Grammar-Augmented Pre-Training for Table Semantic Parsing [117.98107557103877]
テーブルセマンティック解析のための効果的な事前学習手法GraPPaを提案する。
我々は、同期文脈自由文法を用いて、高自由度テーブル上に合成質問ペアを構築する。
実世界のデータを表現できるモデルの能力を維持するため、マスキング言語モデリングも含んでいる。
論文 参考訳(メタデータ) (2020-09-29T08:17:58Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。