論文の概要: PixT3: Pixel-based Table To Text generation
- arxiv url: http://arxiv.org/abs/2311.09808v1
- Date: Thu, 16 Nov 2023 11:32:47 GMT
- ステータス: 処理完了
- システム内更新日: 2023-11-17 14:47:26.703862
- Title: PixT3: Pixel-based Table To Text generation
- Title(参考訳): PixT3:Pixelベースのタブレットからテキスト生成
- Authors: I\~nigo Alonso, Eneko Agirre, Mirella Lapata
- Abstract要約: ToTToベンチマークの最先端(SotA)よりも優れたマルチモーダルテーブル・トゥ・テキストモデルであるPixT3を提案する。
また、テーブル構造意識を強化するための新たな中間教育カリキュラムを導入し、モデルの生成と全体的な忠実度を向上させる。
- 参考スコア(独自算出の注目度): 72.59315577559734
- License: http://creativecommons.org/licenses/by-sa/4.0/
- Abstract: Table-to-Text has been traditionally approached as a linear language to text
problem. However, visually represented tables are rich in visual information
and serve as a concise, effective form of representing data and its
relationships. When using text-based approaches, after the linearization
process, this information is either lost or represented in a space inefficient
manner. This inefficiency has remained a constant challenge for text-based
approaches making them struggle with large tables. In this paper, we
demonstrate that image representation of tables are more space-efficient than
the typical textual linearizations, and multi-modal approaches are competitive
in Table-to-Text tasks. We present PixT3, a multimodal table-to-text model that
outperforms the state-of-the-art (SotA) in the ToTTo benchmark in a pure
Table-to-Text setting while remaining competitive in controlled Table-to-Text
scenarios. It also generalizes better in unseen datasets, outperforming ToTTo
SotA in all generation settings. Additionally, we introduce a new intermediate
training curriculum to reinforce table structural awareness, leading to
improved generation and overall faithfulness of the models.
- Abstract(参考訳): Table-to-Textは伝統的に、テキスト問題に対する線形言語としてアプローチされてきた。
しかし、視覚的に表されるテーブルは視覚情報に富み、データとその関係を表現する簡潔で効果的な形式として機能する。
テキストベースのアプローチを使用する場合、線形化プロセスの後、この情報は失われるか、非効率な方法で表現される。
この非効率性は、テキストベースのアプローチが大きなテーブルで苦労する上で、常に課題となっている。
本稿では,従来のテキスト線形化よりも,表の画像表現の方が空間効率が良く,マルチモーダルな手法は表からテキストへのタスクにおいて競争力があることを示す。
PixT3は、制御されたTable-to-Textシナリオにおいて競争力を維持しながら、純粋なTable-to-Text設定でToTToベンチマークの最先端(SotA)より優れるマルチモーダルテーブル-テキストモデルである。
また、すべての世代設定でToTTo SotAよりも優れた、見当たらないデータセットを一般化する。
さらに, 表構造意識強化のための中間教育カリキュラムを新たに導入し, モデルの生成と全体としての忠実性の向上に繋がる。
関連論文リスト
- TDeLTA: A Light-weight and Robust Table Detection Method based on
Learning Text Arrangement [34.73880086005418]
本稿では,学習テキストアレンジメント(TDeLTA)に基づく新しい,軽量で堅牢なテーブル検出手法を提案する。
表を正確に特定するために,表内の意味的役割に応じてテキストブロックを4つのカテゴリに分類するテキスト分類タスクを設計する。
いくつかの最先端の手法と比較して、TDeLTAは大規模な公開データセットの3.1Mモデルパラメータで競合する結果を得る。
論文 参考訳(メタデータ) (2023-12-18T09:18:43Z) - Stylized Data-to-Text Generation: A Case Study in the E-Commerce Domain [53.22419717434372]
本稿では,特定のスタイルに従ってコヒーレントテキストを生成することを目的とした新しいタスク,すなわちスタイル化されたデータ・テキスト生成を提案する。
このタスクは、生成されたテキストのロジック、構造化されていないスタイル参照、バイアスのあるトレーニングサンプルという3つの課題のため、簡単ではない。
本稿では,論理計画型データ埋め込み,マスク型スタイル埋め込み,非バイアス型スタイリングテキスト生成の3つのコンポーネントからなる,新しいスタイル付きデータ・テキスト生成モデルであるStyleD2Tを提案する。
論文 参考訳(メタデータ) (2023-05-05T03:02:41Z) - Few-Shot Table-to-Text Generation with Prompt Planning and Knowledge
Memorization [41.20314472839442]
数ショット設定でテーブル・ツー・テキスト生成をターゲットとするPromptMizeという新しいフレームワークを提案する。
私たちのフレームワークの設計は、プロンプトプランナーと知識アダプタの2つの側面で構成されています。
本モデルは,人的・自動的な評価によって判断される品質を著しく向上させる。
論文 参考訳(メタデータ) (2023-02-09T03:04:11Z) - Towards Table-to-Text Generation with Pretrained Language Model: A Table
Structure Understanding and Text Deliberating Approach [60.03002572791552]
本稿では,テーブル構造理解とテキスト検討手法,すなわちTASDを提案する。
具体的には,表構造を考慮したテキスト生成モデルを実現するために,三層多層アテンションネットワークを考案する。
われわれのアプローチは、様々な種類のテーブルに対して忠実で流動的な記述テキストを生成することができる。
論文 参考訳(メタデータ) (2023-01-05T14:03:26Z) - Attend, Memorize and Generate: Towards Faithful Table-to-Text Generation
in Few Shots [58.404516361586325]
Few-shot table-to-text generation は、限られたデータを用いてテーブル内容を伝えるために、流動的で忠実な文を構成するタスクである。
本稿では,人間のテキスト生成プロセスに触発された新しい手法,覚醒と生成(AMG)を提案する。
論文 参考訳(メタデータ) (2022-03-01T20:37:20Z) - Facts2Story: Controlling Text Generation by Key Facts [0.0]
自然言語で表現された一連の事実を、より長い物語に展開し、制御された生成タスクを提案する。
我々は、GPT2のような自動回帰型一方向言語モデルは、より良い流動性を生み出すが、彼らは要求された事実に従うのに苦労することを示した。
本稿では,要求されるコンテンツに固執しながら,競争的フラッテンシーを生み出すプラン・アンド・クローズモデル(微調整xlnet)を提案する。
論文 参考訳(メタデータ) (2020-12-08T10:14:29Z) - Learning Better Representation for Tables by Self-Supervised Tasks [23.69766883380125]
本稿では,表表現の学習を支援するために,数値順序付けと有意順序付けという2つの自己教師型タスクを提案する。
本手法はNBAゲーム統計と関連ニュースからなるROTOWIREを用いて検証する。
論文 参考訳(メタデータ) (2020-10-15T09:03:38Z) - KGPT: Knowledge-Grounded Pre-Training for Data-to-Text Generation [100.79870384880333]
知識に富んだテキストを生成するための知識基盤事前学習(KGPT)を提案する。
我々は、その効果を評価するために、3つの設定、すなわち、完全教師付き、ゼロショット、少数ショットを採用します。
ゼロショット設定では、WebNLG上で30 ROUGE-L以上を達成するが、他の全てのベースラインは失敗する。
論文 参考訳(メタデータ) (2020-10-05T19:59:05Z) - Towards Faithful Neural Table-to-Text Generation with Content-Matching
Constraints [63.84063384518667]
そこで本研究では,トランスフォーマーをベースとした新たな生成フレームワークを提案する。
忠実度を強制する手法の中核となる技術は、テーブル-テキストの最適トランスポート・マッチング・ロスである。
忠実度を評価するため,テーブル・ツー・テキスト生成問題に特化した新しい自動尺度を提案する。
論文 参考訳(メタデータ) (2020-05-03T02:54:26Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。