論文の概要: Neural Content Extraction for Poster Generation of Scientific Papers
- arxiv url: http://arxiv.org/abs/2112.08550v1
- Date: Thu, 16 Dec 2021 01:19:37 GMT
- ステータス: 処理完了
- システム内更新日: 2021-12-17 15:11:52.352897
- Title: Neural Content Extraction for Poster Generation of Scientific Papers
- Title(参考訳): 科学論文のポスター生成のためのニューラルコンテンツ抽出
- Authors: Sheng Xu, Xiaojun Wan
- Abstract要約: 科学論文のポスター生成の問題は未解明である。
これまでの研究は主にポスターレイアウトとパネル構成に重点を置いていたが、コンテンツ抽出の重要性は無視された。
ポスターパネルのテキスト要素と視覚要素の両方を得るために,紙セクションのテキスト,図形,テーブルを同時に抽出するニューラル抽出モデルを提案する。
- 参考スコア(独自算出の注目度): 84.30128728027375
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: The problem of poster generation for scientific papers is under-investigated.
Posters often present the most important information of papers, and the task
can be considered as a special form of document summarization. Previous studies
focus mainly on poster layout and panel composition, while neglecting the
importance of content extraction. Besides, their datasets are not publicly
available, which hinders further research. In this paper, we construct a
benchmark dataset from scratch for this task. Then we propose a three-step
framework to tackle this task and focus on the content extraction step in this
study. To get both textual and visual elements of a poster panel, a neural
extractive model is proposed to extract text, figures and tables of a paper
section simultaneously. We conduct experiments on the dataset and also perform
ablation study. Results demonstrate the efficacy of our proposed model. The
dataset and code will be released.
- Abstract(参考訳): 科学論文のポスター生成の問題は未解明である。
投稿者は文書の最も重要な情報をしばしば提示し、そのタスクは文書要約の特別な形態と見なすことができる。
これまでの研究は主にポスターレイアウトとパネル構成に重点を置いていたが、コンテンツ抽出の重要性は無視された。
さらに、データセットは公開されておらず、さらなる研究を妨げる。
本稿では,この課題に対するベンチマークデータセットをスクラッチから構築する。
そこで本研究では,この課題に取り組むための3段階フレームワークを提案し,コンテンツ抽出ステップに着目した。
ポスターパネルのテキスト要素と視覚要素の両方を得るために,紙セクションのテキスト,図形,テーブルを同時に抽出するニューラル抽出モデルを提案する。
データセットの実験を行い、アブレーション研究も行います。
その結果,提案モデルの有効性が示された。
データセットとコードがリリースされる。
関連論文リスト
- Interactive Distillation of Large Single-Topic Corpora of Scientific
Papers [1.2954493726326113]
より堅牢だが時間を要するアプローチは、主題の専門家が文書を手書きするデータセットを構成的に構築することである。
ここでは,学術文献のターゲットデータセットを構築的に生成するための,機械学習に基づく新しいツールを紹介する。
論文 参考訳(メタデータ) (2023-09-19T17:18:36Z) - Automated Feedback Generation for a Chemistry Database and Abstracting
Exercise [0.0]
このデータセットには2年連続で207件の論文が含まれており、21の論文が一次文献からまとめられている。
モデルは利用可能なデータセット(約15,000のサンプル)を使用して事前トレーニングされ、送信されたデータセットの80%で微調整された。
学生が提出した文章は、背景、技法、観察の3つのクラスに特徴づけられる。
論文 参考訳(メタデータ) (2023-05-22T15:04:26Z) - Scientific Paper Extractive Summarization Enhanced by Citation Graphs [50.19266650000948]
我々は、引用グラフを活用して、異なる設定下での科学的論文の抽出要約を改善することに重点を置いている。
予備的な結果は、単純な教師なしフレームワークであっても、引用グラフが有用であることを示している。
そこで我々は,大規模ラベル付きデータが利用可能である場合のタスクにおいて,より正確な結果を得るために,グラフベースのスーパービジョン・サムライゼーション・モデル(GSS)を提案する。
論文 参考訳(メタデータ) (2022-12-08T11:53:12Z) - ReSel: N-ary Relation Extraction from Scientific Text and Tables by
Learning to Retrieve and Select [53.071352033539526]
学術論文からN-ary関係を抽出する問題について考察する。
提案手法であるReSelは,このタスクを2段階のプロシージャに分解する。
3つの科学的情報抽出データセットに対する実験により、ReSelは最先端のベースラインを大きく上回っていることがわかった。
論文 参考訳(メタデータ) (2022-10-26T02:28:02Z) - TRIE++: Towards End-to-End Information Extraction from Visually Rich
Documents [51.744527199305445]
本稿では,視覚的にリッチな文書からエンド・ツー・エンドの情報抽出フレームワークを提案する。
テキスト読み出しと情報抽出は、よく設計されたマルチモーダルコンテキストブロックを介して互いに強化することができる。
フレームワークはエンドツーエンドのトレーニング可能な方法でトレーニングでき、グローバルな最適化が達成できる。
論文 参考訳(メタデータ) (2022-07-14T08:52:07Z) - Topic Modeling Based Extractive Text Summarization [0.0]
本稿では,潜在トピックに基づいて内容をクラスタリングすることで,テキストを要約する新しい手法を提案する。
我々は、テキスト要約へのアプローチにおいて、より使用量が少なく挑戦的なWikiHowデータセットを活用している。
論文 参考訳(メタデータ) (2021-06-29T12:28:19Z) - DOC2PPT: Automatic Presentation Slides Generation from Scientific
Documents [76.19748112897177]
文書・スライド生成のための新しい課題とアプローチを提案する。
エンドツーエンドでタスクに取り組むための階層的なシーケンス・ツー・シーケンスアプローチを提案する。
提案手法では,文書やスライド内の固有構造を利用して,パラフレーズとレイアウト予測モジュールを組み込んでスライドを生成する。
論文 参考訳(メタデータ) (2021-01-28T03:21:17Z) - Learning to Emphasize: Dataset and Shared Task Models for Selecting
Emphasis in Presentation Slides [31.540208729354354]
プレゼンテーションスライドで強力なリードワードを強調することで、聴衆はスライド全体を読むのではなく、特定の焦点に目を向けることができる。
この要求に動機づけられて、プレゼンテーションスライドにおける強調選択(ES)の問題を研究します。
クラウドソーシングされた設定で強調語で注釈付けされた、さまざまなトピックを備えたプレゼンテーションスライドを含む新しいデータセットを紹介します。
論文 参考訳(メタデータ) (2021-01-02T06:54:55Z) - Enhancing Extractive Text Summarization with Topic-Aware Graph Neural
Networks [21.379555672973975]
本稿では,グラフニューラルネットワーク(GNN)に基づく抽出要約モデルを提案する。
本モデルでは,文章選択のための文書レベルの特徴を提供する潜在トピックを発見するために,共同ニューラルトピックモデル(NTM)を統合している。
実験結果から,CNN/DMおよびNYTデータセットにおいて,本モデルがほぼ最先端の結果が得られることが示された。
論文 参考訳(メタデータ) (2020-10-13T09:30:04Z) - From Standard Summarization to New Tasks and Beyond: Summarization with
Manifold Information [77.89755281215079]
テキスト要約は、原文書の短く凝縮した版を作成することを目的とした研究分野である。
現実世界のアプリケーションでは、ほとんどのデータは平易なテキスト形式ではない。
本稿では,現実のアプリケーションにおけるこれらの新しい要約タスクとアプローチについて調査する。
論文 参考訳(メタデータ) (2020-05-10T14:59:36Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。