論文の概要: Improving Table Understanding with LLMs and Entity-Oriented Search
- arxiv url: http://arxiv.org/abs/2508.17028v1
- Date: Sat, 23 Aug 2025 14:02:45 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-08-26 18:43:45.303699
- Title: Improving Table Understanding with LLMs and Entity-Oriented Search
- Title(参考訳): LLMとエンティティ指向検索によるテーブル理解の改善
- Authors: Thi-Nhung Nguyen, Hoang Ngo, Dinh Phung, Thuy-Trang Vu, Dat Quoc Nguyen,
- Abstract要約: 大規模言語モデル(LLM)を用いたテーブル理解向上のためのエンティティ指向検索手法を提案する。
このアプローチは、質問とテーブルデータ間の意味的類似性、およびテーブルセル間の暗黙的な関係を効果的に活用する。
テーブルエンティティにフォーカスし、テーブルセルがセマンティックにタイトに束縛されていることを保証する。
- 参考スコア(独自算出の注目度): 24.3302301035859
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Our work addresses the challenges of understanding tables. Existing methods often struggle with the unpredictable nature of table content, leading to a reliance on preprocessing and keyword matching. They also face limitations due to the lack of contextual information, which complicates the reasoning processes of large language models (LLMs). To overcome these challenges, we introduce an entity-oriented search method to improve table understanding with LLMs. This approach effectively leverages the semantic similarities between questions and table data, as well as the implicit relationships between table cells, minimizing the need for data preprocessing and keyword matching. Additionally, it focuses on table entities, ensuring that table cells are semantically tightly bound, thereby enhancing contextual clarity. Furthermore, we pioneer the use of a graph query language for table understanding, establishing a new research direction. Experiments show that our approach achieves new state-of-the-art performances on standard benchmarks WikiTableQuestions and TabFact.
- Abstract(参考訳): 我々の仕事は表を理解するという課題に対処する。
既存の手法は予測不可能なテーブル内容の性質に苦しむことが多く、前処理やキーワードマッチングに依存している。
また、文脈情報がないため、大きな言語モデル(LLM)の推論プロセスが複雑になるため、制約に直面している。
これらの課題を克服するために,LLMを用いたテーブル理解を改善するエンティティ指向検索手法を提案する。
このアプローチは、質問とテーブルデータ間のセマンティックな類似性、およびテーブルセル間の暗黙の関係を効果的に活用し、データ前処理とキーワードマッチングの必要性を最小限にする。
さらに、テーブルエンティティに焦点を当て、テーブルセルがセマンティックにタイトにバインドされていることを保証する。
さらに、テーブル理解のためのグラフクエリ言語の利用を開拓し、新たな研究方向性を確立した。
実験の結果, WikiTableQuestions や TabFact といった標準ベンチマークを用いて, 最新の性能を実現することができた。
関連論文リスト
- STAR: Semantic Table Representation with Header-Aware Clustering and Adaptive Weighted Fusion [1.483000637348699]
STAR(Semantic Table Representation)はセマンティッククラスタリングと重み付き融合によってセマンティックテーブル表現を改善する軽量フレームワークである。
全てのデータセットにおいて,STARはQGpTよりも連続的に高いリコールを実現していることを示す。
論文 参考訳(メタデータ) (2026-01-22T11:08:46Z) - TableDART: Dynamic Adaptive Multi-Modal Routing for Table Understanding [52.59372043981724]
TableDARTはトレーニング効率のよいフレームワークで、事前トレーニングされた単一モダリティモデルを再利用することでマルチモーダルビューを統合する。
さらに,テキストモデルと画像モデルからの出力を解析し,モーダル間知識統合のための新しいエージェントを提案する。
論文 参考訳(メタデータ) (2025-09-18T07:00:13Z) - An LLM Agent-Based Complex Semantic Table Annotation Approach [13.427066390210538]
本稿では,LLMを用いたカラム型エージェント手法を提案する。
CTAとCell Entity。
CEA。
ReActフレームワークに基づいて、調整されたプロンプトで5つの外部メトリクスを設計、実装します。
冗長アノテーションを減らすためにLevenshtein距離を利用することで、時間コストの70%削減とLLMトークンの使用率の60%削減を実現した。
論文 参考訳(メタデータ) (2025-08-18T12:09:20Z) - Improving Table Retrieval with Question Generation from Partial Tables [2.2169618382995764]
本稿では,LLMを用いてテーブルの小さな部分に基づいて合成質問を生成する簡易かつ効果的な方法であるQGpTを提案する。
生成された質問は、生成に使用される部分テーブルセグメントに結合され、ユーザクエリとのセマンティックアライメントが強化される。
論文 参考訳(メタデータ) (2025-08-08T09:35:56Z) - LLM-Symbolic Integration for Robust Temporal Tabular Reasoning [69.27153114778748]
本研究では,システムおよび制御された評価のための合成データセットであるTempTabQA-Cを紹介する。
この構造化アプローチにより、LLM(Large Language Models)はsqlクエリの生成と実行を可能にし、一般化とバイアス軽減の強化を行う。
論文 参考訳(メタデータ) (2025-06-06T05:14:04Z) - TableMaster: A Recipe to Advance Table Understanding with Language Models [2.506624215459612]
TableMasterはレシピと包括的なフレームワークで、これらの障害を克服するために複数のソリューションを統合する。
WikiTQデータセットでは、GPT-4o-miniを使用して78.13%の精度を達成し、既存のベースラインを上回っている。
論文 参考訳(メタデータ) (2025-01-31T18:31:31Z) - TableRAG: Million-Token Table Understanding with Language Models [53.039560091592215]
TableRAG(TableRAG)は、LMベースのテーブル理解用に特別に設計された検索拡張生成(RAG)フレームワークである。
TableRAGは、スキーマとセル検索を組み合わせたクエリ拡張を活用して、LMにそれを提供する前に重要な情報をピンポイントする。
以上の結果から,TableRAGは検索精度が向上し,大規模テーブル理解における最先端性能が向上することが示唆された。
論文 参考訳(メタデータ) (2024-10-07T04:15:02Z) - HiddenTables & PyQTax: A Cooperative Game and Dataset For TableQA to Ensure Scale and Data Privacy Across a Myriad of Taxonomies [9.09415727445941]
本稿では,この課題に対する潜在的な解決法として,HiddenTablesと呼ばれる協調ゲームを提案する。
エージェントがテーブルQAタスクを解く能力を評価するコード生成「r」と「Oracleウィンドウ」の間で「HiddenTables」が再生される。
複雑なクエリを一般化および実行できないLCMの集合性を実証する多種多様なテーブルの集合について明らかな実験を行う。
論文 参考訳(メタデータ) (2024-06-16T04:53:29Z) - Chain-of-Table: Evolving Tables in the Reasoning Chain for Table
Understanding [79.9461269253121]
そこで我々は、中間思考のプロキシとして、図表データを推論チェーンで明示的に使用するChain-of-Tableフレームワークを提案する。
Chain-of-TableはWikiTQ、FeTaQA、TabFactベンチマークで最新のパフォーマンスを実現している。
論文 参考訳(メタデータ) (2024-01-09T07:46:26Z) - TAP4LLM: Table Provider on Sampling, Augmenting, and Packing Semi-structured Data for Large Language Model Reasoning [55.33939289989238]
テーブルベースタスクにおいて,大規模言語モデル(LLM)を効果的に活用するための汎用プリプロセッサスイートとして,TAP4LLMを提案する。
1)大きなテーブルをクエリセマンティクスに基づいて管理可能なサブテーブルに分解するテーブルサンプリング、(2)外部ソースやモデルから追加の知識でテーブルを拡張するテーブル拡張、(3)テーブルパッキングとシリアライゼーションによりテーブルをLLMの理解に適したさまざまなフォーマットに変換する。
論文 参考訳(メタデータ) (2023-12-14T15:37:04Z) - GraPPa: Grammar-Augmented Pre-Training for Table Semantic Parsing [117.98107557103877]
テーブルセマンティック解析のための効果的な事前学習手法GraPPaを提案する。
我々は、同期文脈自由文法を用いて、高自由度テーブル上に合成質問ペアを構築する。
実世界のデータを表現できるモデルの能力を維持するため、マスキング言語モデリングも含んでいる。
論文 参考訳(メタデータ) (2020-09-29T08:17:58Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。