論文の概要: D2S: Document-to-Slide Generation Via Query-Based Text Summarization
- arxiv url: http://arxiv.org/abs/2105.03664v1
- Date: Sat, 8 May 2021 10:29:41 GMT
- ステータス: 処理完了
- システム内更新日: 2021-05-12 13:35:22.491670
- Title: D2S: Document-to-Slide Generation Via Query-Based Text Summarization
- Title(参考訳): D2S:クエリベースのテキスト要約による文書からスライド生成
- Authors: Edward Sun, Yufang Hou, Dakuo Wang, Yunfeng Zhang, Nancy X.R. Wang
- Abstract要約: 我々は、最近のNLPおよびMLカンファレンスの論文とそれに対応するスライドデッキからなる新しいデータセット、SciDuetをコントリビュートする。
第2に,文書からスライドまでのタスクに2段階のアプローチで取り組む新しいシステムD2Sを提案する。
私たちの評価は、長期形式のQAは、自動化されたROUGEメトリクスと定性的な人間評価の両方の最先端の要約ベースラインを上回ることを示唆しています。
- 参考スコア(独自算出の注目度): 27.576875048631265
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Presentations are critical for communication in all areas of our lives, yet
the creation of slide decks is often tedious and time-consuming. There has been
limited research aiming to automate the document-to-slides generation process
and all face a critical challenge: no publicly available dataset for training
and benchmarking. In this work, we first contribute a new dataset, SciDuet,
consisting of pairs of papers and their corresponding slides decks from recent
years' NLP and ML conferences (e.g., ACL). Secondly, we present D2S, a novel
system that tackles the document-to-slides task with a two-step approach: 1)
Use slide titles to retrieve relevant and engaging text, figures, and tables;
2) Summarize the retrieved context into bullet points with long-form question
answering. Our evaluation suggests that long-form QA outperforms
state-of-the-art summarization baselines on both automated ROUGE metrics and
qualitative human evaluation.
- Abstract(参考訳): プレゼンテーションは、私たちの生活のあらゆる領域におけるコミュニケーションに不可欠ですが、スライドデッキの作成は、しばしば退屈で時間がかかります。
document-to-slides生成プロセスの自動化を目的とした限定的な研究が行われており、いずれも重大な課題に直面している。
本研究では,近年のNLPおよびMLカンファレンス(ACLなど)の論文とそれに対応するスライドデッキからなるデータセットSciDuetを,まず最初にコントリビュートする。
次に2段階のアプローチで文書からスライドへのタスクに取り組む新しいシステムであるd2sを提案する。1) スライドタイトルを使用して、関連するテキスト、図形、テーブルを検索する。2) 検索されたコンテキストを長い質問応答で弾丸ポイントにまとめる。
評価の結果,長期QAは自動ROUGE測定値と定性評価値の両方に基づいて,最先端の要約基準よりも優れていた。
関連論文リスト
- Integrating Planning into Single-Turn Long-Form Text Generation [66.08871753377055]
長文コンテンツを生成するための計画案を提案する。
私たちの主な新規性は、複数のプロンプトや計画のラウンドを必要としない単一の補助的なタスクにあります。
実験では,LLMを補助タスクで微調整し,高品質な文書を生成する,異なる領域からの2つのデータセットを実証した。
論文 参考訳(メタデータ) (2024-10-08T17:02:40Z) - Write Summary Step-by-Step: A Pilot Study of Stepwise Summarization [48.57273563299046]
本稿では,新たな文書が提案されるたびに追加の要約を生成するステップワイド要約の課題を提案する。
追加された要約は、新たに追加されたコンテンツを要約するだけでなく、以前の要約と一貫性を持たなければならない。
SSGは,自動計測と人的評価の両面から,最先端のパフォーマンスを実現していることを示す。
論文 参考訳(メタデータ) (2024-06-08T05:37:26Z) - The Power of Summary-Source Alignments [62.76959473193149]
多文書要約(MDS)は難しい課題であり、しばしばサリエンスと冗長性検出のサブタスクに分解される。
参照要約とそのソース文書間の対応する文のアライメントを利用して、トレーニングデータを生成する。
本稿では,よりきめ細かな提案スパンレベルで適用することで,要約ソースアライメントフレームワークを拡張することを提案する。
論文 参考訳(メタデータ) (2024-06-02T19:35:19Z) - Hybrid Long Document Summarization using C2F-FAR and ChatGPT: A
Practical Study [1.933681537640272]
ChatGPTは、大規模言語モデル(LLM)分野における最新のブレークスルーである。
本稿では,ビジネス記事や書籍などの長い文書のハイブリッド抽出と要約パイプラインを提案する。
以上の結果から,ChatGPTの使用は長文を要約するための非常に有望なアプローチであるが,まだ成熟していないことが示唆された。
論文 参考訳(メタデータ) (2023-06-01T21:58:33Z) - SQuALITY: Building a Long-Document Summarization Dataset the Hard Way [31.832673451018543]
高い資格を持つ請負業者を雇い、ストーリーを読み、オリジナルの要約をスクラッチから書きます。
読解時間を記憶するために,文書毎に5つの要約を収集し,まず概要とその後の4つの質問に対処する。
最先端の要約システムによる実験は、我々のデータセットが困難であり、既存の自動評価指標が品質の弱い指標であることを示している。
論文 参考訳(メタデータ) (2022-05-23T17:02:07Z) - Summarization with Graphical Elements [55.5913491389047]
本稿では,グラフィカル要素による要約という新しい課題を提案する。
タスクの研究を支援するために,高品質なラベル付きデータセットを収集する。
論文 参考訳(メタデータ) (2022-04-15T17:16:41Z) - Long Document Summarization with Top-down and Bottom-up Inference [113.29319668246407]
本稿では、2つの側面の要約モデルを改善するための原則的推論フレームワークを提案する。
我々のフレームワークは、トップレベルが長距離依存性をキャプチャするドキュメントの階層的な潜在構造を前提としています。
本稿では,様々な要約データセットに対して提案手法の有効性を示す。
論文 参考訳(メタデータ) (2022-03-15T01:24:51Z) - Summ^N: A Multi-Stage Summarization Framework for Long Input Dialogues
and Documents [13.755637074366813]
SummNは、典型的な事前訓練されたLMの最大文脈長よりも長いテキストを入力するための、シンプルで柔軟で効果的な多段階フレームワークである。
LMコンテキストサイズを固定したままステージ数を調整することで任意の長さの入力テキストを処理できる。
実験の結果,SummNは従来の最先端手法よりも有意に優れていた。
論文 参考訳(メタデータ) (2021-10-16T06:19:54Z) - Document Modeling with Graph Attention Networks for Multi-grained
Machine Reading Comprehension [127.3341842928421]
Natural Questionsは、新しい挑戦的な機械読解ベンチマークである。
解答は2つあり、長解(典型的には1段落)と短解(長解の内にある1つ以上の実体)である。
既存の方法は、これらの2つのサブタスクをトレーニング中に個別に扱い、依存関係を無視します。
本稿では,文書を階層的にモデル化する多層機械読解フレームワークを提案する。
論文 参考訳(メタデータ) (2020-05-12T14:20:09Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。