論文の概要: LayoutXLM vs. GNN: An Empirical Evaluation of Relation Extraction for
Documents
- arxiv url: http://arxiv.org/abs/2206.10304v1
- Date: Mon, 9 May 2022 13:36:09 GMT
- ステータス: 処理完了
- システム内更新日: 2023-02-13 20:13:13.821984
- Title: LayoutXLM vs. GNN: An Empirical Evaluation of Relation Extraction for
Documents
- Title(参考訳): LayoutXLM vs. GNN:文書間の関係抽出の実証評価
- Authors: Herv\'e D\'ejean and St\'ephane Clinchant and Jean-Luc Meunier
- Abstract要約: 本稿では,文書中の抽出タスクを2つの異なるネットワークモデルのベンチマークにより検討する。
どちらのモデルも同様の結果を得るが、どちらも非常に異なる特性を示す。
- 参考スコア(独自算出の注目度): 2.817650240561539
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: This paper investigates the Relation Extraction task in documents by
benchmarking two different neural network models: a multi-modal language model
(LayoutXLM) and a Graph Neural Network: Edge Convolution Network (ECN). For
this benchmark, we use the XFUND dataset, released along with LayoutXLM. While
both models reach similar results, they both exhibit very different
characteristics. This raises the question on how to integrate various
modalities in a neural network: by merging all modalities thanks to additional
pretraining (LayoutXLM), or in a cascaded way (ECN). We conclude by discussing
some methodological issues that must be considered for new datasets and task
definition in the domain of Information Extraction with complex documents.
- Abstract(参考訳): 本稿では,マルチモーダル言語モデル (LayoutXLM) とグラフニューラルネットワーク:エッジ畳み込みネットワーク (ECN) の2つの異なるニューラルネットワークモデルのベンチマークにより,文書中の関係抽出タスクについて検討する。
このベンチマークでは、LayoutXLMとともにリリースされたXFUNDデータセットを使用します。
どちらのモデルも同様の結果を出すが、両者は全く異なる特徴を示す。
これは、ニューラルネットワークに様々なモダリティを統合する方法に関する疑問を提起する: 追加の事前トレーニング(layoutxlm)やカスケード方式(ecn)によって、すべてのモダリティをマージすることで。
我々は,複雑な文書を用いた情報抽出分野において,新たなデータセットやタスク定義に考慮すべき方法論的問題について論じる。
関連論文リスト
- Scalable Weibull Graph Attention Autoencoder for Modeling Document Networks [50.42343781348247]
解析条件後部を解析し,推論精度を向上させるグラフポアソン因子分析法(GPFA)を開発した。
また,GPFAを多層構造に拡張したグラフPoisson gamma belief Network (GPGBN) を用いて,階層的な文書関係を複数の意味レベルで捉える。
本モデルでは,高品質な階層型文書表現を抽出し,様々なグラフ解析タスクにおいて有望な性能を実現する。
論文 参考訳(メタデータ) (2024-10-13T02:22:14Z) - Relational Extraction on Wikipedia Tables using Convolutional and Memory
Networks [6.200672130699805]
関係抽出(Relation extract、RE)は、テキスト内のエンティティ間の関係を抽出するタスクである。
我々は、エンティティをエンコードするために、畳み込みニューラルネットワーク(CNN)とBidirectional-Long Short Term Memory(BiLSTM)ネットワークからなる新しいモデルを導入する。
論文 参考訳(メタデータ) (2023-07-11T22:36:47Z) - ReSel: N-ary Relation Extraction from Scientific Text and Tables by
Learning to Retrieve and Select [53.071352033539526]
学術論文からN-ary関係を抽出する問題について考察する。
提案手法であるReSelは,このタスクを2段階のプロシージャに分解する。
3つの科学的情報抽出データセットに対する実験により、ReSelは最先端のベースラインを大きく上回っていることがわかった。
論文 参考訳(メタデータ) (2022-10-26T02:28:02Z) - Batch-Ensemble Stochastic Neural Networks for Out-of-Distribution
Detection [55.028065567756066]
Out-of-Distribution(OOD)検出は、機械学習モデルを現実世界のアプリケーションにデプロイすることの重要性から、マシンラーニングコミュニティから注目を集めている。
本稿では,特徴量の分布をモデル化した不確実な定量化手法を提案する。
バッチアンサンブルニューラルネットワーク(BE-SNN)の構築と機能崩壊問題の克服を目的として,効率的なアンサンブル機構,すなわちバッチアンサンブルを組み込んだ。
We show that BE-SNNs yield superior performance on the Two-Moons dataset, the FashionMNIST vs MNIST dataset, FashionM。
論文 参考訳(メタデータ) (2022-06-26T16:00:22Z) - Decoupled Multi-task Learning with Cyclical Self-Regulation for Face
Parsing [71.19528222206088]
顔解析のための周期的自己統制型デカップリング型マルチタスク学習を提案する。
具体的には、DML-CSRは、顔解析、バイナリエッジ、カテゴリエッジ検出を含むマルチタスクモデルを設計する。
提案手法は,Helen,CelebA-HQ,LapaMaskのデータセット上での最先端性能を実現する。
論文 参考訳(メタデータ) (2022-03-28T02:12:30Z) - TabGNN: Multiplex Graph Neural Network for Tabular Data Prediction [43.35301059378836]
最近普及しているグラフニューラルネットワーク(GNN)に基づく新しいフレームワークTabGNNを提案する。
具体的には,まず,多面的サンプル関係をモデル化するための多重グラフを構築し,次に,各サンプルに対する拡張表現を学習するための多重グラフニューラルネットワークを設計する。
分類と回帰を含む11のTDPデータセットに対する実験は、TabGNNが一貫して性能を向上できることを示している。
論文 参考訳(メタデータ) (2021-08-20T11:51:32Z) - Multiplex Graph Networks for Multimodal Brain Network Analysis [30.195666008281915]
我々は,マルチモーダル脳ネットワーク解析のための簡易かつ効果的な多重グラフ畳み込みネットワーク(GCN)モデルMGNetを提案する。
現実の2つの挑戦的データセット(HIVと双極性障害)の分類タスクを行う。
論文 参考訳(メタデータ) (2021-07-31T06:01:29Z) - Data Augmentation for Abstractive Query-Focused Multi-Document
Summarization [129.96147867496205]
2つのQMDSトレーニングデータセットを提示し,2つのデータ拡張手法を用いて構築する。
これらの2つのデータセットは相補的な性質を持ち、すなわちQMDSCNNは実際のサマリを持つが、クエリはシミュレートされる。
組み合わせたデータセット上にエンドツーエンドのニューラルネットワークモデルを構築し、DUCデータセットに最新の転送結果をもたらします。
論文 参考訳(メタデータ) (2021-03-02T16:57:01Z) - ATRM: Attention-based Task-level Relation Module for GNN-based Few-shot
Learning [14.464964336101028]
注目に基づくタスクレベル関係モジュール(ATRM)という新しい関係測定法を提案する。
提案モジュールは,サンプルからサンプルへの埋め込み機能ではなく,サンプルからタスクまでを考慮し,ノード間の関係表現をキャプチャする。
実験結果から,提案モジュールはGNNによる少数ショット学習に有効であることが示された。
論文 参考訳(メタデータ) (2021-01-25T00:53:04Z) - CDEvalSumm: An Empirical Study of Cross-Dataset Evaluation for Neural
Summarization Systems [121.78477833009671]
データセット間設定下での様々な要約モデルの性能について検討する。
異なるドメインの5つのデータセットに対する11の代表的な要約システムに関する包括的な研究は、モデルアーキテクチャと生成方法の影響を明らかにしている。
論文 参考訳(メタデータ) (2020-10-11T02:19:15Z) - DWIE: an entity-centric dataset for multi-task document-level
information extraction [23.412500230644433]
DWIEは、4つの主要な情報抽出(IE)アノテーションサブタスクを組み合わせた、新しく作成されたマルチタスクデータセットである。
DWIEは、完全なドキュメントのレベルで概念的エンティティの相互作用と特性を記述するエンティティ中心のデータセットとして考えられている。
論文 参考訳(メタデータ) (2020-09-26T15:53:22Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。