論文の概要: Map&Make: Schema Guided Text to Table Generation
- arxiv url: http://arxiv.org/abs/2505.23174v1
- Date: Thu, 29 May 2025 07:12:46 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-05-30 18:14:07.727371
- Title: Map&Make: Schema Guided Text to Table Generation
- Title(参考訳): Map&Make: テーブル生成のためのスキーマガイドテキスト
- Authors: Naman Ahuja, Fenil Bardoliya, Chitta Baral, Vivek Gupta,
- Abstract要約: テキスト・ツー・テイブル・ジェネレーションは情報検索に欠かせない課題である。
テキストを命題のアトミックステートメントに"識別"する汎用的なアプローチであるMap&Makeを導入する。
このアプローチは、RotowireとLivesumという2つの挑戦的なデータセットに対してテストされています。
- 参考スコア(独自算出の注目度): 41.52038779169547
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Transforming dense, detailed, unstructured text into an interpretable and summarised table, also colloquially known as Text-to-Table generation, is an essential task for information retrieval. Current methods, however, miss out on how and what complex information to extract; they also lack the ability to infer data from the text. In this paper, we introduce a versatile approach, Map&Make, which "dissects" text into propositional atomic statements. This facilitates granular decomposition to extract the latent schema. The schema is then used to populate the tables that capture the qualitative nuances and the quantitative facts in the original text. Our approach is tested against two challenging datasets, Rotowire, renowned for its complex and multi-table schema, and Livesum, which demands numerical aggregation. By carefully identifying and correcting hallucination errors in Rotowire, we aim to achieve a cleaner and more reliable benchmark. We evaluate our method rigorously on a comprehensive suite of comparative and referenceless metrics. Our findings demonstrate significant improvement results across both datasets with better interpretability in Text-to-Table generation. Moreover, through detailed ablation studies and analyses, we investigate the factors contributing to superior performance and validate the practicality of our framework in structured summarization tasks.
- Abstract(参考訳): テキスト・トゥ・テイブル・ジェネレーション (Text-to-Table generation) とも呼ばれる、高密度で詳細で非構造化のテキストを解釈可能で要約されたテーブルに変換することは、情報検索に不可欠なタスクである。
しかし、現在の手法では、どのように、どのような複雑な情報を抽出するかを見逃し、テキストからデータを推測する能力も欠如している。
本稿では,テキストを命題の原子文に"識別"する多元的アプローチであるMap&Makeを紹介する。
これにより粒度の分解が容易になり、潜在スキーマを抽出する。
次に、スキーマを使用して、定性的なニュアンスと元のテキストの量的事実をキャプチャするテーブルをポップアップさせる。
我々のアプローチは、複雑なマルチテーブルスキーマで有名なRotowireと、数値集計を必要とするLivesumの2つの挑戦的なデータセットに対してテストされている。
Rotowireの幻覚エラーを慎重に識別し,修正することにより,よりクリーンで信頼性の高いベンチマークを実現することを目指している。
比較および参照なしメトリクスの包括的スイートに基づいて,本手法を厳格に評価する。
本研究は,テキスト・ツー・テイブル・ジェネレーションにおいて,より優れた解釈可能性を有するデータセット間の大幅な改善効果を示した。
さらに、詳細なアブレーション研究と分析を通じて、優れた性能に寄与する要因を調査し、構造化要約タスクにおけるフレームワークの実用性を検証する。
関連論文リスト
- ChartifyText: Automated Chart Generation from Data-Involved Texts via LLM [16.87320295911898]
科学研究、経済、公衆衛生、ジャーナリズムなどの様々な応用において、関連する数値を持つ文書が広く使われている。
この研究のギャップを埋めるために、この研究はグラフを自動的に生成し、基礎となるデータとアイデアを読者に正確に伝えることを目的としている。
本稿では,Large Language Models (LLMs) を利用して複雑なデータ関連テキストを表現型チャートに変換する,新しい完全自動化アプローチであるChartifyTextを提案する。
論文 参考訳(メタデータ) (2024-10-18T09:43:30Z) - Text-Tuple-Table: Towards Information Integration in Text-to-Table Generation via Global Tuple Extraction [36.915250638481986]
リアルタイムのコメンタリーテキストに基づいたコンペの要約表を生成するためのベンチマークデータセットであるLiveSumを紹介する。
我々は,このタスクにおける最先端の大規模言語モデルの性能を,微調整とゼロショットの両方で評価する。
さらに、パフォーマンスを改善するために、$T3$(Text-Tuple-Table)と呼ばれる新しいパイプラインを提案する。
論文 参考訳(メタデータ) (2024-04-22T14:31:28Z) - QTSumm: Query-Focused Summarization over Tabular Data [58.62152746690958]
人々は主に、データ分析を行うか、特定の質問に答えるためにテーブルをコンサルティングします。
そこで本研究では,テキスト生成モデルに人間的な推論を行なわなければならない,クエリ中心のテーブル要約タスクを新たに定義する。
このタスクには,2,934テーブル上の7,111の人間注釈付きクエリ-サマリーペアを含む,QTSummという新しいベンチマークを導入する。
論文 参考訳(メタデータ) (2023-05-23T17:43:51Z) - Data-to-text Generation with Variational Sequential Planning [74.3955521225497]
非言語的な入力からテキスト出力を生成することを目的としたデータ・ツー・テキスト生成の課題について考察する。
協調的かつ有意義な方法で高レベルの情報を整理する責任を負う計画要素を付加したニューラルモデルを提案する。
我々は、計画と生成のステップをインターリーブしながら、構造化された変動モデルで逐次、潜在計画を推測する。
論文 参考訳(メタデータ) (2022-02-28T13:17:59Z) - Towards Faithful Neural Table-to-Text Generation with Content-Matching
Constraints [63.84063384518667]
そこで本研究では,トランスフォーマーをベースとした新たな生成フレームワークを提案する。
忠実度を強制する手法の中核となる技術は、テーブル-テキストの最適トランスポート・マッチング・ロスである。
忠実度を評価するため,テーブル・ツー・テキスト生成問題に特化した新しい自動尺度を提案する。
論文 参考訳(メタデータ) (2020-05-03T02:54:26Z) - ToTTo: A Controlled Table-To-Text Generation Dataset [61.83159452483026]
ToTToはオープンドメインの英語のテーブル・トゥ・テキストのデータセットで、12万以上のトレーニングサンプルがある。
本稿では、ウィキペディアから既存の候補文を直接修正するデータセット構築プロセスを紹介する。
通常流動的であるが、既存の方法は多くの場合、表がサポートしていないフレーズを幻覚させる。
論文 参考訳(メタデータ) (2020-04-29T17:53:45Z) - Extractive Summarization as Text Matching [123.09816729675838]
本稿では,ニューラル抽出要約システムの構築方法に関するパラダイムシフトを作成する。
抽出した要約タスクを意味テキストマッチング問題として定式化する。
我々はCNN/DailyMailの最先端抽出結果を新しいレベル(ROUGE-1の44.41)に推し進めた。
論文 参考訳(メタデータ) (2020-04-19T08:27:57Z) - Selective Attention Encoders by Syntactic Graph Convolutional Networks
for Document Summarization [21.351111598564987]
本稿では,文書中の文から解析木を接続するグラフを提案し,文書の構文表現を学習するために重ねられたグラフ畳み込みネットワーク(GCN)を利用する。
提案したGCNによる選択的アテンションアプローチは,ベースラインよりも優れ,データセット上での最先端のパフォーマンスを実現する。
論文 参考訳(メタデータ) (2020-03-18T01:30:02Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。