論文の概要: Vision-Based Layout Detection from Scientific Literature using Recurrent
Convolutional Neural Networks
- arxiv url: http://arxiv.org/abs/2010.11727v1
- Date: Sun, 18 Oct 2020 23:50:28 GMT
- ステータス: 処理完了
- システム内更新日: 2022-10-06 04:05:44.841517
- Title: Vision-Based Layout Detection from Scientific Literature using Recurrent
Convolutional Neural Networks
- Title(参考訳): リカレント畳み込みニューラルネットワークを用いた科学文献からの視覚に基づくレイアウト検出
- Authors: Huichen Yang, William H. Hsu
- Abstract要約: 本稿では,オブジェクト認識と分類のための畳み込みニューラルネットワークを科学的文献レイアウト検出(SLLD)に適用するためのアプローチを提案する。
SLLDは、いくつかの情報抽出問題の共有サブタスクである。
その結果,事前学習ベースネットワークの微調整による改善が得られた。
- 参考スコア(独自算出の注目度): 12.221478896815292
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: We present an approach for adapting convolutional neural networks for object
recognition and classification to scientific literature layout detection
(SLLD), a shared subtask of several information extraction problems. Scientific
publications contain multiple types of information sought by researchers in
various disciplines, organized into an abstract, bibliography, and sections
documenting related work, experimental methods, and results; however, there is
no effective way to extract this information due to their diverse layout. In
this paper, we present a novel approach to developing an end-to-end learning
framework to segment and classify major regions of a scientific document. We
consider scientific document layout analysis as an object detection task over
digital images, without any additional text features that need to be added into
the network during the training process. Our technical objective is to
implement transfer learning via fine-tuning of pre-trained networks and thereby
demonstrate that this deep learning architecture is suitable for tasks that
lack very large document corpora for training ab initio. As part of the
experimental test bed for empirical evaluation of this approach, we created a
merged multi-corpus data set for scientific publication layout detection tasks.
Our results show good improvement with fine-tuning of a pre-trained base
network using this merged data set, compared to the baseline convolutional
neural network architecture.
- Abstract(参考訳): 本稿では,複数の情報抽出問題の共有サブタスクである科学的文献レイアウト検出(SLLD)に,オブジェクト認識と分類のための畳み込みニューラルネットワークを適用するアプローチを提案する。
学術出版物には、様々な分野の研究者が求めている様々な種類の情報が含まれており、抽象的、文献学、関連する研究、実験方法、成果を文書化したセクションで構成されている。
本稿では,学術文書の主要な領域を分類・分類するエンドツーエンド学習フレームワークを開発するための新しいアプローチを提案する。
我々は,デジタル画像上のオブジェクト検出タスクとして,学習過程でネットワークに付加される必要のある追加のテキスト機能を持たずに,科学的文書レイアウト解析を考察する。
我々の技術的目的は、事前学習ネットワークの微調整によるトランスファーラーニングを実装し、このディープラーニングアーキテクチャが、非常に大きな文書コーパスを欠いたタスクに適していることを示すことである。
このアプローチを実証的に評価するための実験的なテストベッドの一部として,科学出版レイアウト検出タスクのための統合マルチコーパスデータセットを作成した。
本研究の結果は, ベースライン畳み込みニューラルネットワークアーキテクチャと比較して, この統合データセットを用いた事前学習ベースネットワークの微調整により良好な改善が得られた。
関連論文リスト
- A Sentiment Analysis of Medical Text Based on Deep Learning [1.8130068086063336]
本稿では,変換器(BERT)の双方向エンコーダ表現を基礎的事前学習モデルとして用いた医療領域に焦点を当てた。
METS-CoVデータセットを用いて実験と解析を行い、異なるディープラーニングネットワークの統合後のトレーニング性能について検討した。
CNNモデルは、BERTのような事前訓練されたモデルと組み合わせて、小さな医療用テキストデータセットでトレーニングされた場合、他のネットワークよりも優れています。
論文 参考訳(メタデータ) (2024-04-16T12:20:49Z) - Data Augmentations in Deep Weight Spaces [89.45272760013928]
そこで本研究では,Mixup法に基づく新しい拡張手法を提案する。
既存のベンチマークと新しいベンチマークでこれらのテクニックのパフォーマンスを評価する。
論文 参考訳(メタデータ) (2023-11-15T10:43:13Z) - Pre-training Multi-task Contrastive Learning Models for Scientific
Literature Understanding [52.723297744257536]
事前学習言語モデル(LM)は、科学文献理解タスクにおいて有効であることを示す。
文献理解タスク間の共通知識共有を容易にするために,マルチタスクのコントラスト学習フレームワークであるSciMultを提案する。
論文 参考訳(メタデータ) (2023-05-23T16:47:22Z) - Human-in-the-Loop Disinformation Detection: Stance, Sentiment, or
Something Else? [93.91375268580806]
政治とパンデミックは、機械学習対応の偽ニュース検出アルゴリズムの開発に十分な動機を与えている。
既存の文献は、主に完全自動化されたケースに焦点を当てているが、その結果得られた技術は、軍事応用に必要な様々なトピック、ソース、時間スケールに関する偽情報を確実に検出することはできない。
既に利用可能なアナリストを人間のループとして活用することにより、感情分析、アスペクトベースの感情分析、姿勢検出といった標準的な機械学習技術は、部分的に自動化された偽情報検出システムに使用するためのもっとも有効な方法となる。
論文 参考訳(メタデータ) (2021-11-09T13:30:34Z) - Exploiting the relationship between visual and textual features in
social networks for image classification with zero-shot deep learning [0.0]
本稿では,CLIPニューラルネットワークアーキテクチャの伝達可能な学習能力に基づく分類器アンサンブルを提案する。
本研究は,Placesデータセットのラベルによる画像分類タスクに基づいて,視覚的部分のみを考慮した実験である。
画像に関連付けられたテキストを考えることは、目標に応じて精度を向上させるのに役立つ。
論文 参考訳(メタデータ) (2021-07-08T10:54:59Z) - Anomaly Detection on Attributed Networks via Contrastive Self-Supervised
Learning [50.24174211654775]
本論文では,アトリビュートネットワーク上の異常検出のためのコントラスト型自己監視学習フレームワークを提案する。
このフレームワークは、新しいタイプのコントラストインスタンスペアをサンプリングすることで、ネットワークデータからのローカル情報を完全に活用します。
高次元特性と局所構造から情報埋め込みを学習するグラフニューラルネットワークに基づくコントラスト学習モデルを提案する。
論文 参考訳(メタデータ) (2021-02-27T03:17:20Z) - Learning to Segment Human Body Parts with Synthetically Trained Deep
Convolutional Networks [58.0240970093372]
本稿では,合成データのみを用いて学習した深部畳み込みニューラルネットワークに基づく人体部分分割のための新しい枠組みを提案する。
提案手法は,人体部品の実際の注釈付きデータを用いてモデルを訓練することなく,最先端の結果が得られる。
論文 参考訳(メタデータ) (2021-02-02T12:26:50Z) - NAS-Navigator: Visual Steering for Explainable One-Shot Deep Neural
Network Synthesis [53.106414896248246]
本稿では,分析者がドメイン知識を注入することで,解のサブグラフ空間を効果的に構築し,ネットワーク探索をガイドするフレームワークを提案する。
このテクニックを反復的に適用することで、アナリストは、与えられたアプリケーションに対して最高のパフォーマンスのニューラルネットワークアーキテクチャに収束することができる。
論文 参考訳(メタデータ) (2020-09-28T01:48:45Z) - Multi-Subspace Neural Network for Image Recognition [33.61205842747625]
画像分類タスクでは, 特徴抽出は常に大きな問題であり, クラス内変動により抽出器の設計が困難になる。
近年、ディープラーニングはデータから機能を自動的に学習することに多くの注意を払っている。
本研究では,畳み込みニューラルネットワーク(CNN)のキーコンポーネントをサブスペースの概念と組み合わせたマルチサブスペースニューラルネットワーク(MSNN)を提案する。
論文 参考訳(メタデータ) (2020-06-17T02:55:34Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。