論文の概要: Tailoring Table Retrieval from a Field-aware Hybrid Matching Perspective
- arxiv url: http://arxiv.org/abs/2503.02251v1
- Date: Tue, 04 Mar 2025 03:57:10 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-03-05 19:12:59.683146
- Title: Tailoring Table Retrieval from a Field-aware Hybrid Matching Perspective
- Title(参考訳): フィールド対応ハイブリッドマッチングの観点からのテーブル検索
- Authors: Da Li, Keping Bi, Jiafeng Guo, Xueqi Cheng,
- Abstract要約: 表検索はテキスト検索に比べて少ない。
異なるテーブルフィールドは、異なるマッチングの好みを持つ。
テーブル調整ハイブリドマッチングrEtriever(THYME)について紹介する。
- 参考スコア(独自算出の注目度): 70.13748256886288
- License:
- Abstract: Table retrieval, essential for accessing information through tabular data, is less explored compared to text retrieval. The row/column structure and distinct fields of tables (including titles, headers, and cells) present unique challenges. For example, different table fields have varying matching preferences: cells may favor finer-grained (word/phrase level) matching over broader (sentence/passage level) matching due to their fragmented and detailed nature, unlike titles. This necessitates a table-specific retriever to accommodate the various matching needs of each table field. Therefore, we introduce a Table-tailored HYbrid Matching rEtriever (THYME), which approaches table retrieval from a field-aware hybrid matching perspective. Empirical results on two table retrieval benchmarks, NQ-TABLES and OTT-QA, show that THYME significantly outperforms state-of-the-art baselines. Comprehensive analyses confirm the differing matching preferences across table fields and validate the design of THYME.
- Abstract(参考訳): 表データを通して情報にアクセスするのに不可欠なテーブル検索は、テキスト検索に比べて検討されていない。
行/列構造とテーブルの異なるフィールド(タイトル、ヘッダ、セルを含む)は、固有の課題を提示する。
例えば、異なるテーブルフィールドは、異なるマッチングの好みを持つ: 細胞は、タイトルとは異なり、断片化され、詳細化された性質のため、より広い(センテンス/パッセージレベル)マッチングよりも、よりきめ細かい(単語/フレーズレベル)マッチングを好む。
これにより、テーブル固有のレトリバーが、各テーブルフィールドの様々なマッチングニーズを満たす必要がある。
そこで、フィールド対応ハイブリッドマッチングの観点から、テーブル検索にアプローチするテーブル調整ハイブリドマッチングrEtriever(THYME)を提案する。
NQ-TABLES と OTT-QA の2つのテーブル検索ベンチマークによる実験結果から,THYME が最先端のベースラインを著しく上回ることが示された。
総合的な分析により、テーブルフィールド間で異なるマッチング嗜好を確認し、THYMEの設計を検証する。
関連論文リスト
- Evaluation of Table Representations to Answer Questions from Tables in Documents : A Case Study using 3GPP Specifications [0.650923326742559]
関連するチャンクの点におけるテーブルの表現は明確ではない。
各セルに対応するテーブルヘッダ情報を含むローレベル表現は、検索性能を向上させる。
論文 参考訳(メタデータ) (2024-08-30T04:40:35Z) - Is Table Retrieval a Solved Problem? Exploring Join-Aware Multi-Table Retrieval [52.592071689901196]
本稿では,テーブル検索において,任意のクエリやデータベースに対して有用な結合関係を明らかにする手法を提案する。
提案手法は,F1スコアの最大9.3%,エンドツーエンドQAの最大5.4%の精度で,テーブル検索の最先端手法よりも優れている。
論文 参考訳(メタデータ) (2024-04-15T15:55:01Z) - HYTREL: Hypergraph-enhanced Tabular Data Representation Learning [36.731257438472035]
HYTRELは、行/列の置換不変性と、表データの3つのより構造的な特性をキャプチャする言語モデルである。
HYTRELは、最小限の事前学習を伴う4つの下流タスクにおいて、他の競争ベースラインを一貫して上回ることを示す。
我々の定性的分析は、HYTRELがテーブル構造を同化して、セル、行、列、テーブル全体の堅牢な表現を生成することができることを示した。
論文 参考訳(メタデータ) (2023-07-14T05:41:22Z) - A large-scale dataset for end-to-end table recognition in the wild [13.717478398235055]
テーブル認識(Table Recognition, TR)は、パターン認識におけるホットスポットの一つ。
現在、実際のシナリオにおけるエンドツーエンドのTRは、3つのサブタスクを同時に達成しているが、まだ探索されていない研究領域である。
そこで本研究では,様々なテーブル形式を持つテーブル認識セット(TabRecSet)という大規模データセットを提案する。
論文 参考訳(メタデータ) (2023-03-27T02:48:51Z) - SEMv2: Table Separation Line Detection Based on Instance Segmentation [96.36188168694781]
SEMv2(SEM: Split, Embed, Merge)と呼ばれるテーブル構造認識器を提案する。
本稿では,テーブル分離ラインのインスタンスレベルの識別問題に対処し,条件付き畳み込みに基づくテーブル分離ライン検出戦略を提案する。
SEMv2を包括的に評価するために、iFLYTABと呼ばれるテーブル構造認識のためのより困難なデータセットも提示する。
論文 参考訳(メタデータ) (2023-03-08T05:15:01Z) - Table Retrieval May Not Necessitate Table-specific Model Design [83.27735758203089]
テーブル検索のタスクに焦点をあてて、"テーブル固有のモデル設計はテーブル検索に必要か?
自然質問データセット (NQ-table) の表に基づく分析の結果, 70%以上の症例では構造が無視できる役割を担っていることがわかった。
次に、テーブル構造、すなわち補助列/カラム埋め込み、ハードアテンションマスク、ソフトリレーションに基づくアテンションバイアスを明示的にエンコードする3つのモジュールを実験する。
いずれも大きな改善は得られず、テーブル固有のモデル設計がテーブル検索に不要である可能性が示唆された。
論文 参考訳(メタデータ) (2022-05-19T20:35:23Z) - UniRE: A Unified Label Space for Entity Relation Extraction [67.53850477281058]
合同エンティティ関係抽出モデルでは、2つのサブタスクに対して2つの分離ラベル空間を設定する。
この設定は、エンティティとリレーション間の情報相互作用を妨げる可能性があると我々は主張する。
本研究では,2つのサブタスクのラベル空間における異なる処理を除去することを提案する。
論文 参考訳(メタデータ) (2021-07-09T08:09:37Z) - Retrieving Complex Tables with Multi-Granular Graph Representation
Learning [20.72341939868327]
自然言語テーブル検索の課題は,自然言語クエリに基づいて意味的に関連するテーブルを検索することである。
既存の学習システムは、テーブルがデータフレームとして構成されているという仮定に基づいて、テーブルをプレーンテキストとして扱う。
多粒グラフ表現学習を用いた一般化可能なNLTRフレームワークであるグラフベーステーブル検索(GTR)を提案する。
論文 参考訳(メタデータ) (2021-05-04T20:19:03Z) - GraPPa: Grammar-Augmented Pre-Training for Table Semantic Parsing [117.98107557103877]
テーブルセマンティック解析のための効果的な事前学習手法GraPPaを提案する。
我々は、同期文脈自由文法を用いて、高自由度テーブル上に合成質問ペアを構築する。
実世界のデータを表現できるモデルの能力を維持するため、マスキング言語モデリングも含んでいる。
論文 参考訳(メタデータ) (2020-09-29T08:17:58Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。