論文の概要: Extracting Information from Scientific Literature via Visual Table Question Answering Models
- arxiv url: http://arxiv.org/abs/2508.18661v1
- Date: Tue, 26 Aug 2025 04:08:16 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-08-27 17:42:38.6728
- Title: Extracting Information from Scientific Literature via Visual Table Question Answering Models
- Title(参考訳): ビジュアルテーブル質問応答モデルによる科学文献からの情報抽出
- Authors: Dongyoun Kim, Hyung-do Choi, Youngsun Jang, John Kim,
- Abstract要約: 本研究は, 抽出質問応答を向上させるために, 学術論文における表データ処理の3つのアプローチについて検討する。
評価された方法は,(1)文書から情報を抽出する光学文字認識(OCR),(2)文書視覚質問応答のための事前訓練されたモデル,(3)表検出と構造認識により,テキスト内容の表からキー情報を抽出し,マージし,抽出された質問に回答する。
- 参考スコア(独自算出の注目度): 1.6411967992595455
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: This study explores three approaches to processing table data in scientific papers to enhance extractive question answering and develop a software tool for the systematic review process. The methods evaluated include: (1) Optical Character Recognition (OCR) for extracting information from documents, (2) Pre-trained models for document visual question answering, and (3) Table detection and structure recognition to extract and merge key information from tables with textual content to answer extractive questions. In exploratory experiments, we augmented ten sample test documents containing tables and relevant content against RF- EMF-related scientific papers with seven predefined extractive question-answer pairs. The results indicate that approaches preserving table structure outperform the others, particularly in representing and organizing table content. Accurately recognizing specific notations and symbols within the documents emerged as a critical factor for improved results. Our study concludes that preserving the structural integrity of tables is essential for enhancing the accuracy and reliability of extractive question answering in scientific documents.
- Abstract(参考訳): 本研究では,学術論文における表データ処理の3つのアプローチを探求し,抽出的質問応答を強化し,体系的レビュープロセスのためのソフトウェアツールを開発する。
評価された方法は,(1)文書から情報を抽出する光学文字認識(OCR),(2)文書視覚質問応答のための事前訓練されたモデル,(3)表検出と構造認識により,テキスト内容の表からキー情報を抽出し,マージし,抽出された質問に回答する。
探索実験では, RF-EMF関連科学論文に対して, 表と関連する内容を含む10のサンプル試験文書を, あらかじめ定義された7つの質問回答ペアを用いて拡張した。
その結果,テーブル構造保存のアプローチは,特に表の内容の表現や整理において,他よりも優れていたことが示唆された。
文書内の特定の表記や記号を正確に認識することが、結果を改善するための重要な要因として現れた。
本研究は, 学術文献における抽出質問応答の精度と信頼性を高めるために, 表の構造的整合性を維持することが重要であると結論付けた。
関連論文リスト
- TalentMine: LLM-Based Extraction and Question-Answering from Multimodal Talent Tables [5.365164774382722]
本稿では,抽出したテーブルを意味豊かな表現に変換する新しいフレームワークであるTalentMineを紹介する。
TalentMineは、標準のAWS Textract抽出の0%に対して、クエリ応答タスクの100%の精度を実現している。
比較分析の結果,Claude v3 Haikuモデルが人材管理アプリケーションに最適なパフォーマンスを実現することが明らかとなった。
論文 参考訳(メタデータ) (2025-06-22T22:17:42Z) - Evaluation of Table Representations to Answer Questions from Tables in Documents : A Case Study using 3GPP Specifications [0.650923326742559]
関連するチャンクの点におけるテーブルの表現は明確ではない。
各セルに対応するテーブルヘッダ情報を含むローレベル表現は、検索性能を向上させる。
論文 参考訳(メタデータ) (2024-08-30T04:40:35Z) - Large-Scale Knowledge Synthesis and Complex Information Retrieval from
Biomedical Documents [0.33249867230903685]
医療産業の最近の進歩は、構造化されていないデータが豊富に蓄積されている。
我々の研究は、大規模研究文書から複雑な情報を抽出し、探索するためのオールインワンのスケーラブルなソリューションを提供する。
論文 参考訳(メタデータ) (2023-02-14T06:03:43Z) - ReSel: N-ary Relation Extraction from Scientific Text and Tables by
Learning to Retrieve and Select [53.071352033539526]
学術論文からN-ary関係を抽出する問題について考察する。
提案手法であるReSelは,このタスクを2段階のプロシージャに分解する。
3つの科学的情報抽出データセットに対する実験により、ReSelは最先端のベースラインを大きく上回っていることがわかった。
論文 参考訳(メタデータ) (2022-10-26T02:28:02Z) - Mixed-modality Representation Learning and Pre-training for Joint
Table-and-Text Retrieval in OpenQA [85.17249272519626]
最適化された OpenQA Table-Text Retriever (OTTeR) を提案する。
検索中心の混合モード合成事前学習を行う。
OTTeRはOTT-QAデータセット上でのテーブル・アンド・テキスト検索の性能を大幅に改善する。
論文 参考訳(メタデータ) (2022-10-11T07:04:39Z) - Towards Complex Document Understanding By Discrete Reasoning [77.91722463958743]
VQA(Document Visual Question Answering)は、自然言語による質問に答えるために、視覚的に豊富なドキュメントを理解することを目的としている。
我々は3,067の文書ページと16,558の質問応答ペアからなる新しいドキュメントVQAデータセットTAT-DQAを紹介する。
我々は,テキスト,レイアウト,視覚画像など,多要素の情報を考慮に入れたMHSTという新しいモデルを開発し,異なるタイプの質問にインテリジェントに対処する。
論文 参考訳(メタデータ) (2022-07-25T01:43:19Z) - Layout-Aware Information Extraction for Document-Grounded Dialogue:
Dataset, Method and Demonstration [75.47708732473586]
視覚的にリッチな文書から構造的知識と意味的知識の両方を抽出するためのレイアウト対応文書レベル情報抽出データセット(LIE)を提案する。
LIEには製品および公式文書の4,061ページから3つの抽出タスクの62kアノテーションが含まれている。
実験の結果、レイアウトはVRDベースの抽出に不可欠であることが示され、システムデモでは、抽出された知識が、ユーザが関心を持っている答えを見つけるのに役立つことも確認されている。
論文 参考訳(メタデータ) (2022-07-14T07:59:45Z) - Neural Content Extraction for Poster Generation of Scientific Papers [84.30128728027375]
科学論文のポスター生成の問題は未解明である。
これまでの研究は主にポスターレイアウトとパネル構成に重点を置いていたが、コンテンツ抽出の重要性は無視された。
ポスターパネルのテキスト要素と視覚要素の両方を得るために,紙セクションのテキスト,図形,テーブルを同時に抽出するニューラル抽出モデルを提案する。
論文 参考訳(メタデータ) (2021-12-16T01:19:37Z) - Tab.IAIS: Flexible Table Recognition and Semantic Interpretation System [84.39812458417246]
完全テーブル認識処理を行い、最も頻繁なテーブル形式をサポートする2つのルールベースのアルゴリズムを開発する。
意味情報の抽出をテーブル認識プロセスに組み込むため,グラフに基づくテーブル解釈法を開発した。
我々のテーブル認識アプローチは、最先端のアプローチと競合する結果を得る。
論文 参考訳(メタデータ) (2021-05-25T12:31:02Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。