Fugu-MT 論文翻訳(概要): Comparison of Feature Learning Methods for Metadata Extraction from PDF Scholarly Documents

論文の概要: Comparison of Feature Learning Methods for Metadata Extraction from PDF Scholarly Documents

arxiv url: http://arxiv.org/abs/2501.05082v1
Date: Thu, 09 Jan 2025 09:03:43 GMT
ステータス: 翻訳完了
システム内更新日: 2025-01-10 17:34:41.450335
Title: Comparison of Feature Learning Methods for Metadata Extraction from PDF Scholarly Documents
Title（参考訳）: PDF音声文書からのメタデータ抽出のための特徴学習法の比較
Authors: Zeyd Boukhers, Cong Yang,
Abstract要約: 本研究では,自然言語処理(NLP)やコンピュータビジョン(CV),マルチモーダルアプローチなど,さまざまな特徴学習と予測手法を評価し,テンプレートのばらつきが高い文書からメタデータを抽出する。我々は,学術文書のアクセシビリティの向上と,それらの広範な利用を促進することを目的としている。
参考スコア（独自算出の注目度）: 8.516310581591426
License: http://creativecommons.org/licenses/by-sa/4.0/
Abstract: The availability of metadata for scientific documents is pivotal in propelling scientific knowledge forward and for adhering to the FAIR principles (i.e. Findability, Accessibility, Interoperability, and Reusability) of research findings. However, the lack of sufficient metadata in published documents, particularly those from smaller and mid-sized publishers, hinders their accessibility. This issue is widespread in some disciplines, such as the German Social Sciences, where publications often employ diverse templates. To address this challenge, our study evaluates various feature learning and prediction methods, including natural language processing (NLP), computer vision (CV), and multimodal approaches, for extracting metadata from documents with high template variance. We aim to improve the accessibility of scientific documents and facilitate their wider use. To support our comparison of these methods, we provide comprehensive experimental results, analyzing their accuracy and efficiency in extracting metadata. Additionally, we provide valuable insights into the strengths and weaknesses of various feature learning and prediction methods, which can guide future research in this field.
Abstract（参考訳）: 科学文献のメタデータの入手は、科学的知識を前進させ、研究成果のFAIR原則(発見性、アクセシビリティ、相互運用性、再利用性)に固執するために重要である。しかし、出版文書に十分なメタデータが欠如していること、特に中小規模の出版社はアクセシビリティを妨げている。この問題は、出版物が多種多様なテンプレートを使用するドイツ社会科学(英語版)など、いくつかの分野に広まっている。そこで本研究では, 自然言語処理(NLP)やコンピュータビジョン(CV), マルチモーダルアプローチなど, 様々な特徴学習・予測手法の評価を行った。我々は,学術文書のアクセシビリティの向上と,それらの広範な利用を促進することを目的としている。これらの手法の比較を支援するため,メタデータ抽出の精度と効率を解析し,総合的な実験結果を提供する。さらに,様々な特徴学習と予測手法の長所と短所について貴重な知見を提供し,今後の研究を導くことができる。

関連論文リスト

Enhancing Multimodal Retrieval via Complementary Information Extraction and Alignment [51.96615529872665]
文書中のテキストと画像の両方を統一された潜在空間に変換する,新しいマルチモーダル検索手法であるCIEAを提案する。 2つの相補的コントラスト損失を用いてCIEAを最適化し、セマンティックな整合性を確保し、画像に含まれる相補的情報を効果的にキャプチャする。
論文参考訳（メタデータ） (2026-01-08T04:02:49Z)
MOLE: Metadata Extraction and Validation in Scientific Papers Using LLMs [54.5729817345543]
MOLEは、アラビア語以外の言語のデータセットをカバーする科学論文からメタデータ属性を自動的に抽出するフレームワークである。本手法では,複数の入力形式にまたがって文書全体を処理し,一貫した出力に対する堅牢な検証機構を組み込む。
論文参考訳（メタデータ） (2025-05-26T10:31:26Z)
Personalized Multimodal Large Language Models: A Survey [127.9521218125761]
マルチモーダル大言語モデル(MLLM)は、最先端の性能と複数のデータモダリティを統合する能力により、ますます重要になっている。本稿では,パーソナライズされたマルチモーダルな大規模言語モデルに関する包括的調査を行い,そのアーキテクチャ,トレーニング方法,アプリケーションに焦点をあてる。
論文参考訳（メタデータ） (2024-12-03T03:59:03Z)
A Survey of Small Language Models [104.80308007044634]
小言語モデル (SLM) は, 計算資源の最小化による言語タスクの効率化と性能の向上により, ますます重要になってきている。本稿では,SLMのアーキテクチャ,トレーニング技術,モデル圧縮技術に着目した総合的な調査を行う。
論文参考訳（メタデータ） (2024-10-25T23:52:28Z)
Multimodal Methods for Analyzing Learning and Training Environments: A Systematic Literature Review [3.0712840129998513]
本稿では,近年の方法論的進歩を包括する分類学と枠組みを提案する。我々は,新たなデータ融合カテゴリであるMid fusionを導入し,文献レビューを精査するグラフベースの手法を引用グラフプルーニングと呼ぶ。マルチモーダル学習とトレーニング研究と基礎的AI研究のギャップを埋めるために、さらなる研究が必要である。
論文参考訳（メタデータ） (2024-08-22T22:42:23Z)
MMSci: A Dataset for Graduate-Level Multi-Discipline Multimodal Scientific Understanding [59.41495657570397]
このデータセットには、スキーマ図、シミュレーション画像、マクロ/顕微鏡写真、実験的可視化などの図が含まれている。我々は,6つのプロプライエタリモデルと10以上のオープンソースモデルを評価し,科学的フィギュアキャプションと複数選択質問のベンチマークを開発した。データセットとベンチマークは、さらなる研究をサポートするためにリリースされる予定だ。
論文参考訳（メタデータ） (2024-07-06T00:40:53Z)
SyROCCo: Enhancing Systematic Reviews using Machine Learning [6.805429133535976]
本稿では,システムレビュープロセスのナビゲートを支援する機械学習技術について検討する。データ抽出やエビデンスマッピングといったレビューのその後の段階へのML技術の適用は、その初期段階にある。
論文参考訳（メタデータ） (2024-06-24T11:04:43Z)
A Survey on Data Selection for Language Models [148.300726396877]
データ選択方法は、トレーニングデータセットに含まれるデータポイントを決定することを目的としている。ディープラーニングは、主に実証的な証拠によって駆動され、大規模なデータに対する実験は高価である。広範なデータ選択研究のリソースを持つ組織はほとんどない。
論文参考訳（メタデータ） (2024-02-26T18:54:35Z)
Making Metadata More FAIR Using Large Language Models [2.61630828688114]
この作業では、メタデータを比較するFAIRMetaTextと呼ばれる自然言語処理(NLP)情報を提供する。特に、FAIRMetaTextはメタデータの自然言語記述を分析し、2項間の数学的類似度尺度を提供する。このソフトウェアは、同じトピックに関するいくつかの実験データセットを使用しながら、さまざまな自然言語メタデータを精査する際の人的労力を大幅に削減することができる。
論文参考訳（メタデータ） (2023-07-24T19:14:38Z)
Application of Transformers based methods in Electronic Medical Records: A Systematic Literature Review [77.34726150561087]
本研究は,異なるNLPタスクにおける電子カルテ(EMR)のトランスフォーマーに基づく手法を用いて,最先端技術に関する体系的な文献レビューを行う。
論文参考訳（メタデータ） (2023-04-05T22:19:42Z)
The Semantic Reader Project: Augmenting Scholarly Documents through AI-Powered Interactive Reading Interfaces [54.2590226904332]
本稿では,研究論文を対象とした動的読解インタフェースの自動作成を目的としたセマンティック・リーダー・プロジェクトについて述べる。 10のプロトタイプインターフェースが開発され、300人以上の参加者と現実世界のユーザが読書体験を改善している。本論文は,研究論文を読む際,学者と公衆の面を巡って構築する。
論文参考訳（メタデータ） (2023-03-25T02:47:09Z)
Multimodal Approach for Metadata Extraction from German Scientific Publications [0.0]
ドイツ語の科学論文からメタデータを抽出するための多モーダル深層学習手法を提案する。本稿では,自然言語処理と画像ビジョン処理を組み合わせることで,複数の入力データについて考察する。提案手法は,約8800の文書からなるデータセットを用いて学習し,F1スコアの0.923を得ることができた。
論文参考訳（メタデータ） (2021-11-10T15:19:04Z)
CitationIE: Leveraging the Citation Graph for Scientific Information Extraction [89.33938657493765]
引用論文と引用論文の参照リンクの引用グラフを使用する。最先端技術に対するエンド・ツー・エンドの情報抽出の大幅な改善を観察する。
論文参考訳（メタデータ） (2021-06-03T03:00:12Z)
Generating Knowledge Graphs by Employing Natural Language Processing and Machine Learning Techniques within the Scholarly Domain [1.9004296236396943]
本稿では、自然言語処理と機械学習を利用して研究論文から実体や関係を抽出する新しいアーキテクチャを提案する。本研究では,現在最先端の自然言語処理ツールとテキストマイニングツールを用いて,知識抽出の課題に取り組む。セマンティックWebドメイン内の論文26,827件から抽出した109,105件のトリプルを含む科学知識グラフを作成した。
論文参考訳（メタデータ） (2020-10-28T08:31:40Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。