論文の概要: SciPostLayout: A Dataset for Layout Analysis and Layout Generation of Scientific Posters
- arxiv url: http://arxiv.org/abs/2407.19787v1
- Date: Mon, 29 Jul 2024 08:32:27 GMT
- ステータス: 処理完了
- システム内更新日: 2024-07-30 14:35:40.337425
- Title: SciPostLayout: A Dataset for Layout Analysis and Layout Generation of Scientific Posters
- Title(参考訳): SciPostLayout:科学ポスターのレイアウト分析とレイアウト生成のためのデータセット
- Authors: Shohei Tanaka, Hao Wang, Yoshitaka Ushiku,
- Abstract要約: 科学論文からよく設計されたポスターを自動的に生成できるシステムは、著者の作業量を減らし、読者が論文の概要を視覚的に理解できるようにする。
我々はSciPostデータセットを構築した。これは7,855の科学的ポスターとレイアウト分析と生成のための手動レイアウトアノテーションで構成されている。
私たちのデータセットにあるポスターや論文はすべてCC-BYライセンスで公開されています。
- 参考スコア(独自算出の注目度): 13.149391061482895
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Scientific posters are used to present the contributions of scientific papers effectively in a graphical format. However, creating a well-designed poster that efficiently summarizes the core of a paper is both labor-intensive and time-consuming. A system that can automatically generate well-designed posters from scientific papers would reduce the workload of authors and help readers understand the outline of the paper visually. Despite the demand for poster generation systems, only a limited research has been conduced due to the lack of publicly available datasets. Thus, in this study, we built the SciPostLayout dataset, which consists of 7,855 scientific posters and manual layout annotations for layout analysis and generation. SciPostLayout also contains 100 scientific papers paired with the posters. All of the posters and papers in our dataset are under the CC-BY license and are publicly available. As benchmark tests for the collected dataset, we conducted experiments for layout analysis and generation utilizing existing computer vision models and found that both layout analysis and generation of posters using SciPostLayout are more challenging than with scientific papers. We also conducted experiments on generating layouts from scientific papers to demonstrate the potential of utilizing LLM as a scientific poster generation system. The dataset is publicly available at https://huggingface.co/datasets/omron-sinicx/scipostlayout_v2. The code is also publicly available at https://github.com/omron-sinicx/scipostlayout.
- Abstract(参考訳): 科学的ポスターは、科学論文の貢献をグラフィカルな形式で効果的に提示するために使用される。
しかし、紙のコアを効率的に要約するよく設計されたポスターを作ることは、労働集約的かつ時間を要する。
科学論文からよく設計されたポスターを自動的に生成できるシステムは、著者の作業量を減らし、読者が論文の概要を視覚的に理解できるようにする。
ポスター生成システムへの需要にもかかわらず、公開されているデータセットが不足しているため、限られた研究しか行われていない。
そこで本研究では,SciPostLayoutデータセットを構築した。SciPostLayoutデータセットは7,855の科学的ポスターと,レイアウト解析と生成のための手動レイアウトアノテーションで構成されている。
SciPostLayoutには、ポスターと組み合わせた100の科学論文も含まれている。
私たちのデータセットにあるポスターや論文はすべてCC-BYライセンスで公開されています。
収集したデータセットのベンチマークテストとして,既存のコンピュータビジョンモデルを用いたレイアウト解析と生成の実験を行い,SciPostLayoutを用いたレイアウト解析とポスター生成が科学論文よりも困難であることが判明した。
また,学術論文からレイアウトを生成する実験を行い,LLMを科学的ポスター生成システムとして活用する可能性を実証した。
データセットはhttps://huggingface.co/datasets/omron-sinicx/scipostlayout_v2で公開されている。
コードはhttps://github.com/omron-sinicx/scipostlayout.comで公開されている。
関連論文リスト
- SciRIFF: A Resource to Enhance Language Model Instruction-Following over Scientific Literature [80.49349719239584]
SciRIFF(Scientific Resource for Instruction-Following and Finetuning, SciRIFF)は、54のタスクに対して137Kの命令追従デモのデータセットである。
SciRIFFは、幅広い科学分野の研究文献から情報を抽出し、合成することに焦点を当てた最初のデータセットである。
論文 参考訳(メタデータ) (2024-06-10T21:22:08Z) - Mapping the Increasing Use of LLMs in Scientific Papers [99.67983375899719]
2020年1月から2024年2月にかけて、arXiv、bioRxiv、Natureのポートフォリオジャーナルで950,965の論文をまとめて、体系的で大規模な分析を行った。
計算機科学の論文では, LLMの使用が着実に増加し, 最大, 最速の成長が観察された。
論文 参考訳(メタデータ) (2024-04-01T17:45:15Z) - mPLUG-PaperOwl: Scientific Diagram Analysis with the Multimodal Large
Language Model [73.38800189095173]
本研究はマルチモーダルLLMのマルチモーダルダイアグラム解析機能を強化することに焦点を当てる。
高品質な論文のLatexソースファイルを解析することにより、マルチモーダルなダイアグラム理解データセットM-Paperを慎重に構築する。
M-Paperは、画像やラテックス符号のフォーマットの数字や表を含む、複数の科学的図の合同理解をサポートする最初のデータセットである。
論文 参考訳(メタデータ) (2023-11-30T04:43:26Z) - Interactive Distillation of Large Single-Topic Corpora of Scientific
Papers [1.2954493726326113]
より堅牢だが時間を要するアプローチは、主題の専門家が文書を手書きするデータセットを構成的に構築することである。
ここでは,学術文献のターゲットデータセットを構築的に生成するための,機械学習に基づく新しいツールを紹介する。
論文 参考訳(メタデータ) (2023-09-19T17:18:36Z) - Are Layout-Infused Language Models Robust to Layout Distribution Shifts?
A Case Study with Scientific Documents [54.744701806413204]
近年の研究では、レイアウト機能を言語モデル(LM)に注入することで、科学論文などの視覚に富んだ文書の処理が改善されている。
レイアウトを注入したLMがレイアウト分布シフトに対して堅牢であるかどうかを検証する。
論文 参考訳(メタデータ) (2023-06-01T18:01:33Z) - Contrastive Hierarchical Discourse Graph for Scientific Document
Summarization [14.930704950433324]
CHANGESは、抽出科学論文要約のための対照的な階層型グラフニューラルネットワークである。
また,グローバルなテーマ認識文表現を学習するためのグラフコントラスト学習モジュールを提案する。
論文 参考訳(メタデータ) (2023-05-31T20:54:43Z) - The Semantic Scholar Open Data Platform [79.4493235243312]
セマンティック・スカラー(Semantic Scholar、S2)は、学術文献の発見と理解を支援することを目的としたオープンデータプラットフォームおよびウェブサイトである。
我々は、学術的なPDFコンテンツ抽出と知識グラフの自動構築のための最先端技術を用いて、パブリックおよびプロプライエタリなデータソースを組み合わせる。
このグラフには、構造解析されたテキスト、自然言語要約、ベクトル埋め込みなどの高度な意味的特徴が含まれている。
論文 参考訳(メタデータ) (2023-01-24T17:13:08Z) - Quantifying hierarchy in scientific teams [42.444263246116485]
本稿では、最近のPNAS論文「Flat Teams Drive Scientific Innovation」で使われているデータ収集と機械学習モデルの詳細について述べる。
著者チームの暗黙的階層を推定するために,学術出版の特徴をどのように活用できるかを論じる。
論文 参考訳(メタデータ) (2022-10-12T01:28:25Z) - Neural Content Extraction for Poster Generation of Scientific Papers [84.30128728027375]
科学論文のポスター生成の問題は未解明である。
これまでの研究は主にポスターレイアウトとパネル構成に重点を置いていたが、コンテンツ抽出の重要性は無視された。
ポスターパネルのテキスト要素と視覚要素の両方を得るために,紙セクションのテキスト,図形,テーブルを同時に抽出するニューラル抽出モデルを提案する。
論文 参考訳(メタデータ) (2021-12-16T01:19:37Z) - SciCap: Generating Captions for Scientific Figures [20.696070723932866]
SCICAPは,2010年から2020年にかけて発行されたコンピュータサイエンスarXiv論文をベースとした大規模フィギュアキャプションデータセットである。
前処理後、SCICAPは290,000件以上の論文から200万件以上を抽出した。
グラフプロットをキャプションするベースラインモデルを構築した(19.2%)。
論文 参考訳(メタデータ) (2021-10-22T07:10:41Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。