論文の概要: Modelling the semantics of text in complex document layouts using graph
transformer networks
- arxiv url: http://arxiv.org/abs/2202.09144v1
- Date: Fri, 18 Feb 2022 11:49:06 GMT
- ステータス: 処理完了
- システム内更新日: 2022-02-21 12:42:29.708785
- Title: Modelling the semantics of text in complex document layouts using graph
transformer networks
- Title(参考訳): グラフトランスフォーマーネットワークを用いた複雑な文書レイアウトにおけるテキストの意味論のモデル化
- Authors: Thomas Roland Barillot (1), Jacob Saks (1), Polena Lilyanova (1),
Edward Torgas (1), Yachen Hu (1), Yuanqing Liu (1), Varun Balupuri (1) and
Paul Gaskell (1) ((1) BlackRock Inc.)
- Abstract要約: 本稿では,文書の読取パターンを近似したモデルを提案し,テキストスパン毎にユニークな意味表現を出力する。
アーキテクチャは構造化されたテキストのグラフ表現に基づいており、文書間で意味的に類似した情報を検索できるだけでなく、生成した埋め込み空間が有用な意味情報をキャプチャすることを示す。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by-nc-sa/4.0/
- Abstract: Representing structured text from complex documents typically calls for
different machine learning techniques, such as language models for paragraphs
and convolutional neural networks (CNNs) for table extraction, which prohibits
drawing links between text spans from different content types. In this article
we propose a model that approximates the human reading pattern of a document
and outputs a unique semantic representation for every text span irrespective
of the content type they are found in. We base our architecture on a graph
representation of the structured text, and we demonstrate that not only can we
retrieve semantically similar information across documents but also that the
embedding space we generate captures useful semantic information, similar to
language models that work only on text sequences.
- Abstract(参考訳): 複雑な文書から構造化されたテキストを表現することは、通常、段落の言語モデルやテーブル抽出のための畳み込みニューラルネットワーク(CNN)など、さまざまな機械学習技術を要求する。
本稿では,文書の人間の読取パターンを近似したモデルを提案し,その内容の種類に関係なく,各テキストに対して一意な意味表現を出力する。
アーキテクチャは構造化テキストのグラフ表現に基づいており、文書間で意味的に類似した情報を検索できるだけでなく、生成した埋め込み空間は、テキストシーケンスのみで動作する言語モデルと同様、有用な意味情報をキャプチャできることを示す。
関連論文リスト
- Learning Multiplex Embeddings on Text-rich Networks with One Text
Encoder [58.536112184212534]
本稿では,TExt-Rich ネットワーク上での多重埋め込み学習のための新しいフレームワーク METERN を提案する。
既存の手法とは対照的に、METERNは1つのテキストエンコーダを使用して関係性間の共有知識をモデル化する。
学術分野と電子商取引分野の5つのネットワークにおいて,9つの下流タスクについて実験を行った。
論文 参考訳(メタデータ) (2023-10-10T14:59:22Z) - Patton: Language Model Pretraining on Text-Rich Networks [33.914163727649466]
我々はテキストリッチネットワークのためのTexT-Rich NetwOrkフレームワークPattonのPretrAiningを提案する。
Pattonには2つの事前トレーニング戦略が含まれている。
学術分野と電子商取引分野の5つのデータセットで、下流4つのタスクを実験する。
論文 参考訳(メタデータ) (2023-05-20T19:17:10Z) - WordStylist: Styled Verbatim Handwritten Text Generation with Latent
Diffusion Models [8.334487584550185]
単語レベルに基づくテキスト・テキスト・コンテンツ・イメージ生成のための遅延拡散に基づく手法を提案する。
提案手法は,異なる書き手スタイルからリアルな単語画像のサンプルを生成することができる。
提案モデルでは,美的満足度の高いサンプルを作成し,テキスト認識性能の向上に寄与し,類似の文字検索スコアを実データとして得られることを示す。
論文 参考訳(メタデータ) (2023-03-29T10:19:26Z) - TravelBERT: Pre-training Language Model Incorporating Domain-specific
Heterogeneous Knowledge into A Unified Representation [27.12551176570223]
本研究では,非構造化テキスト,半構造化テキスト,よく構造化されたテキストを含むあらゆる形式のテキストを対象としたヘテロジニアス知識言語モデル(HKLM)を提案する。
提案手法では,単語知識の学習にマスク付き言語モデルの対象を用い,3つの分類対象とタイトルマッチング対象を用いてエンティティ知識とトピック知識を学習する。
その結果,本手法はデータの1/4のみを用いて,プレーンテキストの事前学習よりも優れていた。
論文 参考訳(メタデータ) (2021-09-02T16:05:24Z) - Full Page Handwriting Recognition via Image to Sequence Extraction [0.0]
このモデルは、IAMデータセットのフルページ認識で新しい最新技術を実現します。
商用Webアプリケーションの一部として本番環境にデプロイされる。
論文 参考訳(メタデータ) (2021-03-11T04:37:29Z) - Minimally-Supervised Structure-Rich Text Categorization via Learning on
Text-Rich Networks [61.23408995934415]
テキストリッチネットワークから学習することで,最小限に教師付き分類を行う新しいフレームワークを提案する。
具体的には、テキスト理解のためのテキスト解析モジュールと、クラス差別的でスケーラブルなネットワーク学習のためのネットワーク学習モジュールの2つのモジュールを共同でトレーニングします。
実験の結果,1つのカテゴリに3つのシード文書しか与えられず,その精度は約92%であった。
論文 参考訳(メタデータ) (2021-02-23T04:14:34Z) - Neural Deepfake Detection with Factual Structure of Text [78.30080218908849]
テキストのディープフェイク検出のためのグラフベースモデルを提案する。
我々のアプローチは、ある文書の事実構造をエンティティグラフとして表現する。
本モデルでは,機械生成テキストと人文テキストの事実構造の違いを識別することができる。
論文 参考訳(メタデータ) (2020-10-15T02:35:31Z) - A Graph Representation of Semi-structured Data for Web Question
Answering [96.46484690047491]
本稿では、半構造化データとそれらの関係の構成要素の体系的分類に基づいて、Webテーブルとリストのグラフ表現を提案する。
本手法は,最先端のベースラインに対してF1スコアを3.90ポイント向上させる。
論文 参考訳(メタデータ) (2020-10-14T04:01:54Z) - A Multi-Perspective Architecture for Semantic Code Search [58.73778219645548]
テキストマッチングのための新しい多言語間ニューラルネットワークを提案する。
CoNaLaデータセットを用いた実験により,提案したモデルでは,従来の手法よりも優れた性能が得られることが示された。
論文 参考訳(メタデータ) (2020-05-06T04:46:11Z) - Learning to Select Bi-Aspect Information for Document-Scale Text Content
Manipulation [50.01708049531156]
我々は、テキストスタイルの転送とは逆の文書スケールのテキストコンテンツ操作という、新しい実践的なタスクに焦点を当てる。
詳細は、入力は構造化されたレコードと、別のレコードセットを記述するための参照テキストのセットである。
出力は、ソースレコードセットの部分的内容と参照の書き込みスタイルを正確に記述した要約である。
論文 参考訳(メタデータ) (2020-02-24T12:52:10Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。