論文の概要: Extractive Research Slide Generation Using Windowed Labeling Ranking
- arxiv url: http://arxiv.org/abs/2106.03246v1
- Date: Sun, 6 Jun 2021 20:56:43 GMT
- ステータス: 処理完了
- システム内更新日: 2021-06-13 06:48:05.034706
- Title: Extractive Research Slide Generation Using Windowed Labeling Ranking
- Title(参考訳): ウィンドウラベルランキングを用いた抽出研究スライド生成
- Authors: Athar Sefid, Jian Wu, Prasenjit Mitra, Lee Giles
- Abstract要約: 本稿では,学術論文のスライドを自動的に生成する手法を提案する。
本手法の文ラベルモジュールは,抽出要約のためのニューラルネットワークモデルSummaRuNNerに基づいている。
- 参考スコア(独自算出の注目度): 8.187395293376667
- License: http://creativecommons.org/publicdomain/zero/1.0/
- Abstract: Presentation slides describing the content of scientific and technical papers
are an efficient and effective way to present that work. However, manually
generating presentation slides is labor intensive. We propose a method to
automatically generate slides for scientific papers based on a corpus of 5000
paper-slide pairs compiled from conference proceedings websites. The sentence
labeling module of our method is based on SummaRuNNer, a neural sequence model
for extractive summarization. Instead of ranking sentences based on semantic
similarities in the whole document, our algorithm measures importance and
novelty of sentences by combining semantic and lexical features within a
sentence window. Our method outperforms several baseline methods including
SummaRuNNer by a significant margin in terms of ROUGE score.
- Abstract(参考訳): 科学論文や技術論文の内容を説明するプレゼンテーションスライドは、その作品を提示するための効率的かつ効果的な方法です。
しかし、手動でプレゼンテーションスライドを生成するのは労力がかかります。
本研究では,会議報告サイトから編集された5,000組の紙スリッドペアのコーパスに基づいて,科学論文のスライドを自動生成する手法を提案する。
本手法の文ラベリングモジュールは,抽出要約のためのニューラルネットワークモデルであるsummarunnerに基づいている。
本アルゴリズムは,文書全体の意味的類似性に基づいて文をランク付けする代わりに,文ウィンドウ内の意味的特徴と語彙的特徴を組み合わせることにより,文の重要性と新しさを測定する。
提案手法は,ROUGEスコアにおいて有意差でSummaRuNNerを含むいくつかのベースライン手法より優れている。
関連論文リスト
- SLAck: Semantic, Location, and Appearance Aware Open-Vocabulary Tracking [89.43370214059955]
Open-vocabulary Multiple Object Tracking (MOT)は、トレーニングセットにはない新しいカテゴリにトラッカーを一般化することを目的としている。
我々は,連合の初期段階において,意味論,位置,出現の先行を共同で検討する統一的な枠組みを提案する。
提案手法は,異なるキューを融合するための複雑な後処理を排除し,大規模オープン語彙追跡のための関連性能を大幅に向上させる。
論文 参考訳(メタデータ) (2024-09-17T14:36:58Z) - RankSum An unsupervised extractive text summarization based on rank
fusion [0.0]
本稿では,単一文書の抽出テキスト要約手法であるRansumを提案する。
ランクサムは、各特徴に対応する文の給与ランクを教師なしの方法で取得する。
CNN/DailyMail と DUC 2002 で利用可能な要約データセットについて検討した。
論文 参考訳(メタデータ) (2024-02-07T22:24:09Z) - Text Summarization with Oracle Expectation [88.39032981994535]
抽出要約は、文書の中で最も重要な文を識別し、連結することによって要約を生成する。
ほとんどの要約データセットは、文書文が要約に値するかどうかを示す金のラベルを持っていない。
本稿では,ソフトな予測に基づく文ラベルを生成する,シンプルで効果的なラベル付けアルゴリズムを提案する。
論文 参考訳(メタデータ) (2022-09-26T14:10:08Z) - Text Revision by On-the-Fly Representation Optimization [76.11035270753757]
現在の最先端手法は、これらのタスクをシーケンスからシーケンスまでの学習問題として定式化している。
並列データを必要としないテキストリビジョンのための反復的なインプレース編集手法を提案する。
テキストの単純化に関する最先端の教師付き手法よりも、競争力があり、パフォーマンスも向上する。
論文 参考訳(メタデータ) (2022-04-15T07:38:08Z) - Reinforcing Semantic-Symmetry for Document Summarization [15.113768658584979]
文書要約は、長い文書を詳細な情報と正確な意味記述を備えた短いバージョンに凝縮する。
本稿では,文書要約のための新しいtextbfreinforcing stextbfemantic-textbfsymmetric Learning textbfmodelを提案する。
CNN/Daily MailとBigPatentの2つの大胆なベンチマークデータセットに対して、一連の実験が行われた。
論文 参考訳(メタデータ) (2021-12-14T17:41:37Z) - DOC2PPT: Automatic Presentation Slides Generation from Scientific
Documents [76.19748112897177]
文書・スライド生成のための新しい課題とアプローチを提案する。
エンドツーエンドでタスクに取り組むための階層的なシーケンス・ツー・シーケンスアプローチを提案する。
提案手法では,文書やスライド内の固有構造を利用して,パラフレーズとレイアウト予測モジュールを組み込んでスライドを生成する。
論文 参考訳(メタデータ) (2021-01-28T03:21:17Z) - Extractive Summarizer for Scholarly Articles [3.420774720158862]
本モデルは,論文の著者が提示したプレゼンテーションスライドをゴールド・サマリー・スタンダードとして使用し,文のラベル付けを行う。
ウィンドウベースの文抽出ラベリングにより,少なくとも4つのROUGE1-リコール点の改善が得られた。
論文 参考訳(メタデータ) (2020-08-25T22:08:34Z) - Extractive Summarization as Text Matching [123.09816729675838]
本稿では,ニューラル抽出要約システムの構築方法に関するパラダイムシフトを作成する。
抽出した要約タスクを意味テキストマッチング問題として定式化する。
我々はCNN/DailyMailの最先端抽出結果を新しいレベル(ROUGE-1の44.41)に推し進めた。
論文 参考訳(メタデータ) (2020-04-19T08:27:57Z) - Learning to Select Bi-Aspect Information for Document-Scale Text Content
Manipulation [50.01708049531156]
我々は、テキストスタイルの転送とは逆の文書スケールのテキストコンテンツ操作という、新しい実践的なタスクに焦点を当てる。
詳細は、入力は構造化されたレコードと、別のレコードセットを記述するための参照テキストのセットである。
出力は、ソースレコードセットの部分的内容と参照の書き込みスタイルを正確に記述した要約である。
論文 参考訳(メタデータ) (2020-02-24T12:52:10Z) - Keyphrase Extraction with Span-based Feature Representations [13.790461555410747]
キーフレーズは、文書を特徴付ける意味メタデータを提供することができる。
キーフレーズ抽出のための3つのアプローチ: (i) 従来の2段階ランキング法、 (ii) シーケンスラベリング、 (iii) ニューラルネットワークを用いた生成。
本稿では,すべてのコンテンツトークンから直接,キーフレーズのスパン的特徴表現を抽出する新規スパンキーフレーズ抽出モデルを提案する。
論文 参考訳(メタデータ) (2020-02-13T09:48:31Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。