論文の概要: Summarizing and Exploring Tabular Data in Conversational Search
- arxiv url: http://arxiv.org/abs/2005.11490v3
- Date: Fri, 10 Jul 2020 15:56:31 GMT
- ステータス: 処理完了
- システム内更新日: 2022-11-30 03:45:01.356199
- Title: Summarizing and Exploring Tabular Data in Conversational Search
- Title(参考訳): 会話検索における表データの要約と探索
- Authors: Shuo Zhang and Zhuyun Dai and Krisztian Balog and Jamie Callan
- Abstract要約: 会話指向のオープンドメインテーブル要約データセットを新たに構築する。
注釈付きテーブルサマリーが含まれており、質問に答えるだけでなく、テーブル内の他の情報を探索するのに役立つ。
本データセットを用いて,SOTAベースラインとして自動テーブル要約システムの開発を行う。
- 参考スコア(独自算出の注目度): 36.14882974814593
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Tabular data provide answers to a significant portion of search queries.
However, reciting an entire result table is impractical in conversational
search systems. We propose to generate natural language summaries as answers to
describe the complex information contained in a table. Through crowdsourcing
experiments, we build a new conversation-oriented, open-domain table
summarization dataset. It includes annotated table summaries, which not only
answer questions but also help people explore other information in the table.
We utilize this dataset to develop automatic table summarization systems as
SOTA baselines. Based on the experimental results, we identify challenges and
point out future research directions that this resource will support.
- Abstract(参考訳): タブラリデータは、検索クエリのかなりの部分に対する回答を提供する。
しかし,対話型検索システムでは,結果表全体を暗唱することは不可能である。
本稿では,テーブルに含まれる複雑な情報を記述するための回答として,自然言語要約を生成することを提案する。
クラウドソーシング実験を通じて,対話指向のオープンドメインテーブル要約データセットを新たに構築する。
注釈付きテーブルサマリーは、質問に答えるだけでなく、テーブル内の他の情報を探索するのに役立つ。
本データセットを用いて,SOTAベースラインとして自動テーブル要約システムの開発を行う。
実験結果に基づいて,課題を特定し,このリソースがサポートする今後の研究方向性を指摘する。
関連論文リスト
- TACT: Advancing Complex Aggregative Reasoning with Information Extraction Tools [51.576974932743596]
大規模言語モデル(LLM)は、テキスト間の情報の集約を必要とするクエリではよく機能しないことが多い。
TACTには、1つ以上のテキストに散らばる縫合情報を要求する難しい命令が含まれている。
既存のテキストと関連するテーブルのデータセットを活用することで、このデータセットを構築します。
現代のLLMはいずれも,このデータセットでは性能が悪く,精度が38%以下であることが実証された。
論文 参考訳(メタデータ) (2024-06-05T20:32:56Z) - TANQ: An open domain dataset of table answered questions [15.323690523538572]
TANQは、複数のソースにまたがる情報からテーブルを構築する必要がある、最初のオープンドメイン質問応答データセットである。
結果の表にあるすべてのセルに対する完全なソース属性を公開し、オープン、オラクル、クローズドブックのセットアップで最先端の言語モデルをベンチマークします。
最も優れたベースラインであるGPT4は、全体的なF1スコア29.1に達し、人間のパフォーマンスを19.7ポイント遅れています。
論文 参考訳(メタデータ) (2024-05-13T14:07:20Z) - QFMTS: Generating Query-Focused Summaries over Multi-Table Inputs [63.98556480088152]
表要約は、情報を簡潔で分かりやすいテキスト要約に凝縮するための重要な課題である。
本稿では,クエリ中心のマルチテーブル要約を導入することで,これらの制約に対処する新しい手法を提案する。
提案手法は,テーブルシリアライズモジュール,要約コントローラ,および大規模言語モデルからなり,ユーザの情報要求に合わせたクエリ依存のテーブル要約を生成する。
論文 参考訳(メタデータ) (2024-05-08T15:05:55Z) - Augment before You Try: Knowledge-Enhanced Table Question Answering via
Table Expansion [57.53174887650989]
テーブル質問応答は、構造化されたデータを理解し、相互作用するモデルの能力を評価する一般的なタスクである。
既存の方法は表と外部の知識の両方をテキストに変換し、表の構造的な性質を無視する。
そこで本稿では,表に外部情報を統合するための簡易で効果的な手法を提案する。
論文 参考訳(メタデータ) (2024-01-28T03:37:11Z) - Beyond Extraction: Contextualising Tabular Data for Efficient
Summarisation by Language Models [0.0]
Retrieval-Augmented Generation アーキテクチャの従来の利用は、様々な文書から情報を取得するのに有効であることが証明されている。
本研究では,RAGに基づくシステムにおいて,複雑なテーブルクエリの精度を高めるための革新的なアプローチを提案する。
論文 参考訳(メタデータ) (2024-01-04T16:16:14Z) - QTSumm: Query-Focused Summarization over Tabular Data [58.62152746690958]
人々は主に、データ分析を行うか、特定の質問に答えるためにテーブルをコンサルティングします。
そこで本研究では,テキスト生成モデルに人間的な推論を行なわなければならない,クエリ中心のテーブル要約タスクを新たに定義する。
このタスクには,2,934テーブル上の7,111の人間注釈付きクエリ-サマリーペアを含む,QTSummという新しいベンチマークを導入する。
論文 参考訳(メタデータ) (2023-05-23T17:43:51Z) - Representations for Question Answering from Documents with Tables and
Text [22.522986299412807]
周囲のテキストからの情報をもとに表表現を精緻化することで、表からの質問応答の向上を目指します。
また,全文からの質問応答のためのテキストと表に基づく予測を組み合わせるための有効な方法を提案する。
論文 参考訳(メタデータ) (2021-01-26T05:52:20Z) - ToTTo: A Controlled Table-To-Text Generation Dataset [61.83159452483026]
ToTToはオープンドメインの英語のテーブル・トゥ・テキストのデータセットで、12万以上のトレーニングサンプルがある。
本稿では、ウィキペディアから既存の候補文を直接修正するデータセット構築プロセスを紹介する。
通常流動的であるが、既存の方法は多くの場合、表がサポートしていないフレーズを幻覚させる。
論文 参考訳(メタデータ) (2020-04-29T17:53:45Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。