論文の概要: LAME: Layout Aware Metadata Extraction Approach for Research Articles
- arxiv url: http://arxiv.org/abs/2112.12353v1
- Date: Thu, 23 Dec 2021 04:23:08 GMT
- ステータス: 処理完了
- システム内更新日: 2021-12-25 01:38:37.605104
- Title: LAME: Layout Aware Metadata Extraction Approach for Research Articles
- Title(参考訳): LAME:研究論文のためのレイアウト対応メタデータ抽出手法
- Authors: Jongyun Choi, Hyesoo Kong, Hwamook Yoon, Heung-Seon Oh, Yuchul Jung
- Abstract要約: 学術会議論文や雑誌などの学術文献の量は世界中で急速に増加している。
ジャーナルパブリッシャによると、多彩なレイアウトフォーマットのため、ハイパフォーマンスなメタデータ抽出は依然として困難である。
本稿では,これら3つの特徴を取り入れた新しいLayout-aware Metadata extractフレームワークを提案する。
- 参考スコア(独自算出の注目度): 1.8899300124593648
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: The volume of academic literature, such as academic conference papers and
journals, has increased rapidly worldwide, and research on metadata extraction
is ongoing. However, high-performing metadata extraction is still challenging
due to diverse layout formats according to journal publishers. To accommodate
the diversity of the layouts of academic journals, we propose a novel
LAyout-aware Metadata Extraction (LAME) framework equipped with the three
characteristics (e.g., design of an automatic layout analysis, construction of
a large meta-data training set, and construction of Layout-MetaBERT). We
designed an automatic layout analysis using PDFMiner. Based on the layout
analysis, a large volume of metadata-separated training data, including the
title, abstract, author name, author affiliated organization, and keywords,
were automatically extracted. Moreover, we constructed Layout-MetaBERT to
extract the metadata from academic journals with varying layout formats. The
experimental results with Layout-MetaBERT exhibited robust performance
(Macro-F1, 93.27%) in metadata extraction for unseen journals with different
layout formats.
- Abstract(参考訳): 学術会議論文や雑誌などの学術文献の量は世界中で急速に増加しており、メタデータ抽出の研究が進行中である。
しかし,ジャーナルパブリッシャによるレイアウトの多様さから,高パフォーマンスなメタデータ抽出はいまだに困難である。
学術誌のレイアウトの多様性に対応するため,3つの特徴(自動レイアウト解析の設計,大規模メタデータトレーニングセットの構築,レイアウト-メタデータ抽出(Layout-MetaBERT)の構築など)を備えた新しいLayout-aware Metadata extract(LAME)フレームワークを提案する。
我々はPDFMinerを用いた自動レイアウト解析を設計した。
レイアウト分析に基づいて、タイトル、要約、著者名、著者関連組織、キーワードを含むメタデータ分離トレーニングデータを大量に自動抽出した。
さらに,Layout-MetaBERTを構築し,学術誌から様々なレイアウト形式でメタデータを抽出した。
Layout-MetaBERTの実験結果は、レイアウトの異なる未確認ジャーナルのメタデータ抽出における堅牢なパフォーマンス(Macro-F1, 93.27%)を示した。
関連論文リスト
- Diachronic Document Dataset for Semantic Layout Analysis [9.145289299764991]
このデータセットは、デジタル化されたデジタル・デジタル・マテリアルの大きな時間範囲(1600-2024)にまたがる7,254ページの注釈付きページを含む。
異なる時代やジャンルのコンテンツを取り入れることで、様々なレイアウトの複雑さと文書構造の歴史的変化に対処する。
本データセットを用いてオブジェクト検出モデルの評価を行い,入力サイズとサブセットベーストレーニングの影響について検討した。
論文 参考訳(メタデータ) (2024-11-15T09:33:13Z) - Struc-Bench: Are Large Language Models Really Good at Generating Complex Structured Data? [49.688233418425995]
Struc-Benchは、大きな言語モデル(LLM)を特徴とする包括的なベンチマークである。
Pスコア(Prompting Score)とHスコア(Heuristical Score)の2つの革新的な指標を提案する。
実験の結果,LLaMA-7Bに構造認識の微調整を適用すると,性能が大幅に向上することがわかった。
論文 参考訳(メタデータ) (2023-09-16T11:31:58Z) - Enhancing Visually-Rich Document Understanding via Layout Structure
Modeling [91.07963806829237]
レイアウトの知識をモデルに注入する新しい文書理解モデルであるGraphLMを提案する。
我々は、FUNSD、XFUND、CORDなど様々なベンチマークでモデルを評価し、最先端の結果を得た。
論文 参考訳(メタデータ) (2023-08-15T13:53:52Z) - Are Layout-Infused Language Models Robust to Layout Distribution Shifts?
A Case Study with Scientific Documents [54.744701806413204]
近年の研究では、レイアウト機能を言語モデル(LM)に注入することで、科学論文などの視覚に富んだ文書の処理が改善されている。
レイアウトを注入したLMがレイアウト分布シフトに対して堅牢であるかどうかを検証する。
論文 参考訳(メタデータ) (2023-06-01T18:01:33Z) - The Semantic Scholar Open Data Platform [79.4493235243312]
セマンティック・スカラー(Semantic Scholar、S2)は、学術文献の発見と理解を支援することを目的としたオープンデータプラットフォームおよびウェブサイトである。
我々は、学術的なPDFコンテンツ抽出と知識グラフの自動構築のための最先端技術を用いて、パブリックおよびプロプライエタリなデータソースを組み合わせる。
このグラフには、構造解析されたテキスト、自然言語要約、ベクトル埋め込みなどの高度な意味的特徴が含まれている。
論文 参考訳(メタデータ) (2023-01-24T17:13:08Z) - ERNIE-Layout: Layout Knowledge Enhanced Pre-training for Visually-rich
Document Understanding [52.3895498789521]
レイアウト知識を向上した新しい文書事前学習ソリューションであるERNIEを提案する。
まず、直列化段階で入力シーケンスを並べ替え、相関的な事前学習タスクを示し、順序予測を行い、文書の適切な読み順序を学習する。
実験の結果、ERNIEは様々な下流タスクにおいて優れた性能を示し、キー情報に新たな最先端設定、文書質問応答を実現している。
論文 参考訳(メタデータ) (2022-10-12T12:59:24Z) - A Multi-Format Transfer Learning Model for Event Argument Extraction via
Variational Information Bottleneck [68.61583160269664]
イベント引数抽出(EAE)は、テキストから所定の役割を持つ引数を抽出することを目的としている。
変動情報のボトルネックを考慮したマルチフォーマット変換学習モデルを提案する。
3つのベンチマークデータセットに対して広範な実験を行い、EAE上での新たな最先端性能を得る。
論文 参考訳(メタデータ) (2022-08-27T13:52:01Z) - Multimodal Approach for Metadata Extraction from German Scientific
Publications [0.0]
ドイツ語の科学論文からメタデータを抽出するための多モーダル深層学習手法を提案する。
本稿では,自然言語処理と画像ビジョン処理を組み合わせることで,複数の入力データについて考察する。
提案手法は,約8800の文書からなるデータセットを用いて学習し,F1スコアの0.923を得ることができた。
論文 参考訳(メタデータ) (2021-11-10T15:19:04Z) - MexPub: Deep Transfer Learning for Metadata Extraction from German
Publications [1.1549572298362785]
本稿では,PDF文書を画像として見ることにより,異なるレイアウトやスタイルでメタデータを抽出する手法を提案する。
提案手法は, 各種PDF文書からメタデータを正確に抽出する能力を検証し, 平均90%の精度を達成した。
論文 参考訳(メタデータ) (2021-06-04T09:43:48Z) - Hierarchical Metadata-Aware Document Categorization under Weak
Supervision [32.80303008934164]
タスクのための埋め込みベースの生成フレームワークであるHiMeCatを開発した。
本稿では,カテゴリ依存の同時モデリングが可能な新しい共同表現学習モジュールを提案する。
トレーニング文書を階層的に合成して,当初の小規模トレーニングセットを補完するデータ拡張モジュールを提案する。
論文 参考訳(メタデータ) (2020-10-26T13:07:56Z) - A Large-Scale Multi-Document Summarization Dataset from the Wikipedia
Current Events Portal [10.553314461761968]
MDS(Multi-document summarization)は、大規模な文書コレクションの内容を短い要約に圧縮することを目的としている。
この研究は、文書クラスタの総数と個々のクラスタのサイズの両方で大きいMDS用の新しいデータセットを示す。
論文 参考訳(メタデータ) (2020-05-20T14:33:33Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。