論文の概要: ROPE: Reading Order Equivariant Positional Encoding for Graph-based
Document Information Extraction
- arxiv url: http://arxiv.org/abs/2106.10786v1
- Date: Mon, 21 Jun 2021 00:48:04 GMT
- ステータス: 処理完了
- システム内更新日: 2021-06-23 05:43:37.365415
- Title: ROPE: Reading Order Equivariant Positional Encoding for Graph-based
Document Information Extraction
- Title(参考訳): ROPE:グラフ情報抽出のための順序等変位置符号化
- Authors: Chen-Yu Lee, Chun-Liang Li, Chu Wang, Renshen Wang, Yasuhisa Fujii,
Siyang Qin, Ashok Popat and Tomas Pfister
- Abstract要約: Reading Order Equivariant Positional Graph (ROPE) は文書中の単語のシーケンシャルな表示を認証するために設計された新しい位置符号化技術である。
ROPEは、単語レベルの空間接続が与えられた対象単語に対して、隣接する単語に対して独自の読み順序コードを生成する。
ROPEは既存のGraph Convolutional Networksを最大8.4%のスコアで継続的に改善している。
- 参考スコア(独自算出の注目度): 30.228414878857162
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Natural reading orders of words are crucial for information extraction from
form-like documents. Despite recent advances in Graph Convolutional Networks
(GCNs) on modeling spatial layout patterns of documents, they have limited
ability to capture reading orders of given word-level node representations in a
graph. We propose Reading Order Equivariant Positional Encoding (ROPE), a new
positional encoding technique designed to apprehend the sequential presentation
of words in documents. ROPE generates unique reading order codes for
neighboring words relative to the target word given a word-level graph
connectivity. We study two fundamental document entity extraction tasks
including word labeling and word grouping on the public FUNSD dataset and a
large-scale payment dataset. We show that ROPE consistently improves existing
GCNs with a margin up to 8.4% F1-score.
- Abstract(参考訳): 単語の自然読解順序は形式的な文書からの情報抽出に不可欠である。
文書の空間レイアウトパターンをモデル化するグラフ畳み込みネットワーク(gcns)の最近の進歩にもかかわらず、与えられた単語レベルのノード表現の読み出し順序をグラフでキャプチャする能力は限られている。
本稿では,文書中の単語の逐次的提示を識別する新しい位置符号化手法である,読み順序等変位置符号化(ROPE)を提案する。
ROPEは、単語レベルのグラフ接続が与えられた対象単語に対して、隣接する単語に対して独自の読み順序コードを生成する。
公開FUNSDデータセットと大規模支払データセット上で,単語ラベリングと単語グループ化を含む2つの基本文書エンティティ抽出タスクについて検討した。
ROPEは既存のGCNを最大8.4%のスコアで継続的に改善することを示す。
関連論文リスト
- Contextual Document Embeddings [77.22328616983417]
本稿では,コンテキスト化された文書埋め込みのための2つの補完手法を提案する。
第一に、文書近傍を明示的にバッチ内コンテキスト損失に組み込む別のコントラスト学習目標である。
第二に、隣接する文書情報をエンコードされた表現に明示的にエンコードする新しいコンテキストアーキテクチャ。
論文 参考訳(メタデータ) (2024-10-03T14:33:34Z) - Learning-to-Rank Meets Language: Boosting Language-Driven Ordering
Alignment for Ordinal Classification [60.28913031192201]
順序分類のための新しい言語駆動順序付け手法を提案する。
事前学習された視覚言語モデルの最近の発展は、人間の言語におけるリッチな順序性を活用するきっかけとなった。
顔の年齢推定,ヒストリカルカラーイメージ(HCI)分類,美的評価を含む3つの日常的分類課題の実験は,その有望な性能を示す。
論文 参考訳(メタデータ) (2023-06-24T04:11:31Z) - Enhancing Keyphrase Extraction from Long Scientific Documents using
Graph Embeddings [9.884735234974967]
グラフ埋め込みによる言語モデルの強化は、単語のより包括的なセマンティック理解を提供することを示す。
グラフ埋め込みによるPLMの強化は、長い文書の最先端モデルよりも優れていることを示す。
論文 参考訳(メタデータ) (2023-05-16T09:44:38Z) - Word Grounded Graph Convolutional Network [24.6338889954789]
グラフ畳み込みネットワーク(GCN)は、テキスト分類などの様々なタスクにおけるテキスト表現の学習において、高いパフォーマンスを示している。
本稿では,文書非依存グラフを用いて,文書グラフをワードグラフに変換し,データサンプルとGCNモデルを分離することを提案する。
提案したWord-level Graph(WGraph)は、コーパスで一般的に使われている単語共起による単語表現を暗黙的に学習するだけでなく、さらにグローバルなセマンティック依存も含んでいる。
論文 参考訳(メタデータ) (2023-05-10T19:56:55Z) - Text Reading Order in Uncontrolled Conditions by Sparse Graph
Segmentation [71.40119152422295]
テキストの読み出し順序を識別するための軽量でスケーラブルで一般化可能なアプローチを提案する。
モデルは言語に依存しず、多言語データセットで効果的に実行される。
モバイルデバイスを含むあらゆるプラットフォームにデプロイできるほど小さい。
論文 参考訳(メタデータ) (2023-05-04T06:21:00Z) - ME-GCN: Multi-dimensional Edge-Embedded Graph Convolutional Networks for
Semi-supervised Text Classification [6.196387205547024]
本稿では,半教師付きテキスト分類のためのME-GCN (Multi-dimensional Edge-enhanced Graph Convolutional Networks)を提案する。
提案モデルでは,8つのベンチマークデータセット間で最先端の手法を著しく上回っている。
論文 参考訳(メタデータ) (2022-04-10T07:05:12Z) - Keyphrase Extraction Using Neighborhood Knowledge Based on Word
Embeddings [17.198907789163123]
我々は、単語埋め込みを背景知識として活用して、単語間グラフに意味情報を加えることにより、グラフベースのランキングモデルを強化する。
提案手法は,確立されたベンチマークデータセットを用いて評価し,単語の埋め込み近傍情報によりモデル性能が向上することを示す。
論文 参考訳(メタデータ) (2021-11-13T21:48:18Z) - Towards Document-Level Paraphrase Generation with Sentence Rewriting and
Reordering [88.08581016329398]
文書レベルのパラフレーズ生成のためのCoRPG(Coherence Relation Guided Paraphrase Generation)を提案する。
グラフGRUを用いて、コヒーレンス関係グラフを符号化し、各文のコヒーレンス対応表現を得る。
我々のモデルは、より多様性とセマンティックな保存を伴う文書パラフレーズを生成することができる。
論文 参考訳(メタデータ) (2021-09-15T05:53:40Z) - Deep Graph Matching and Searching for Semantic Code Retrieval [76.51445515611469]
本稿では,グラフニューラルネットワークに基づくエンドツーエンドのディープグラフマッチングと探索モデルを提案する。
まず、自然言語クエリテキストとプログラミング言語のコードスニペットをグラフ構造化データで表現する。
特に、DGMSは、個々のクエリテキストやコードスニペットのより構造的な情報をキャプチャするだけでなく、それらの微妙な類似性も学習する。
論文 参考訳(メタデータ) (2020-10-24T14:16:50Z) - Every Document Owns Its Structure: Inductive Text Classification via
Graph Neural Networks [22.91359631452695]
グラフニューラルネットワーク(GNN)を用いたインダクティブテキスト分類のためのテクスティングを提案する。
まず、各文書の個々のグラフを作成し、次にGNNを用いて局所構造に基づいて粒度の細かい単語表現を学習する。
本手法は,最先端のテキスト分類法より優れている。
論文 参考訳(メタデータ) (2020-04-22T07:23:47Z) - Learning to Select Bi-Aspect Information for Document-Scale Text Content
Manipulation [50.01708049531156]
我々は、テキストスタイルの転送とは逆の文書スケールのテキストコンテンツ操作という、新しい実践的なタスクに焦点を当てる。
詳細は、入力は構造化されたレコードと、別のレコードセットを記述するための参照テキストのセットである。
出力は、ソースレコードセットの部分的内容と参照の書き込みスタイルを正確に記述した要約である。
論文 参考訳(メタデータ) (2020-02-24T12:52:10Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。