Fugu-MT 論文翻訳(概要): Modelling the semantics of text in complex document layouts using graph transformer networks

論文の概要: Modelling the semantics of text in complex document layouts using graph transformer networks

arxiv url: http://arxiv.org/abs/2202.09144v1
Date: Fri, 18 Feb 2022 11:49:06 GMT
ステータス: 翻訳完了
システム内更新日: 2022-02-21 12:42:29.708785
Title: Modelling the semantics of text in complex document layouts using graph transformer networks
Title（参考訳）: グラフトランスフォーマーネットワークを用いた複雑な文書レイアウトにおけるテキストの意味論のモデル化
Authors: Thomas Roland Barillot (1), Jacob Saks (1), Polena Lilyanova (1), Edward Torgas (1), Yachen Hu (1), Yuanqing Liu (1), Varun Balupuri (1) and Paul Gaskell (1) ((1) BlackRock Inc.)
Abstract要約: 本稿では,文書の読取パターンを近似したモデルを提案し,テキストスパン毎にユニークな意味表現を出力する。アーキテクチャは構造化されたテキストのグラフ表現に基づいており、文書間で意味的に類似した情報を検索できるだけでなく、生成した埋め込み空間が有用な意味情報をキャプチャすることを示す。
参考スコア（独自算出の注目度）: 0.0
License: http://creativecommons.org/licenses/by-nc-sa/4.0/
Abstract: Representing structured text from complex documents typically calls for different machine learning techniques, such as language models for paragraphs and convolutional neural networks (CNNs) for table extraction, which prohibits drawing links between text spans from different content types. In this article we propose a model that approximates the human reading pattern of a document and outputs a unique semantic representation for every text span irrespective of the content type they are found in. We base our architecture on a graph representation of the structured text, and we demonstrate that not only can we retrieve semantically similar information across documents but also that the embedding space we generate captures useful semantic information, similar to language models that work only on text sequences.
Abstract（参考訳）: 複雑な文書から構造化されたテキストを表現することは、通常、段落の言語モデルやテーブル抽出のための畳み込みニューラルネットワーク(CNN)など、さまざまな機械学習技術を要求する。本稿では,文書の人間の読取パターンを近似したモデルを提案し,その内容の種類に関係なく,各テキストに対して一意な意味表現を出力する。アーキテクチャは構造化テキストのグラフ表現に基づいており、文書間で意味的に類似した情報を検索できるだけでなく、生成した埋め込み空間は、テキストシーケンスのみで動作する言語モデルと同様、有用な意味情報をキャプチャできることを示す。

関連論文リスト

A Novel Graph-Sequence Learning Model for Inductive Text Classification [7.129773362505109]
テキスト分類は、感情分析、偽ニュース検出、世論分析など、下流のテキスト関連タスクにおいて重要な役割を果たしている。本稿では,先述の問題に対処する新しいグラフシーケンス学習モデル(TextGSL)を提案する。 TextGSLは、いくつかの強力なベースラインと包括的に比較されている。
論文参考訳（メタデータ） (2025-12-23T06:49:33Z)
Classifying the Unknown: In-Context Learning for Open-Vocabulary Text and Symbol Recognition [3.667678728817253]
文書中の新しいスクリプトパターンのシーケンスを分類するために,Multimodal In-Context Learning (MICL)を活用するマルチモーダルモデルであるRosettaを導入する。提案手法の重要な強みは,オープン語彙分類を可能にするコンテキスト認識トークンライザ(CAT)を使用することである。結果として、新しいアルファベットや言語の認識などのアプリケーションをアンロックする。
論文参考訳（メタデータ） (2025-04-09T12:58:25Z)
factgenie: A Framework for Span-based Evaluation of Generated Texts [1.6864244598342872]
sは意味的な不正確さや無関係なテキストなど、様々なスパンベースの現象をキャプチャできる。私たちのフレームワークは、データ可視化とテキストアノテーションの収集のためのWebインターフェースで構成されています。
論文参考訳（メタデータ） (2024-07-25T08:33:23Z)
Patton: Language Model Pretraining on Text-Rich Networks [33.914163727649466]
我々はテキストリッチネットワークのためのTexT-Rich NetwOrkフレームワークPattonのPretrAiningを提案する。 Pattonには2つの事前トレーニング戦略が含まれている。学術分野と電子商取引分野の5つのデータセットで、下流4つのタスクを実験する。
論文参考訳（メタデータ） (2023-05-20T19:17:10Z)
WordStylist: Styled Verbatim Handwritten Text Generation with Latent Diffusion Models [8.334487584550185]
単語レベルに基づくテキスト・テキスト・コンテンツ・イメージ生成のための遅延拡散に基づく手法を提案する。提案手法は,異なる書き手スタイルからリアルな単語画像のサンプルを生成することができる。提案モデルでは,美的満足度の高いサンプルを作成し,テキスト認識性能の向上に寄与し,類似の文字検索スコアを実データとして得られることを示す。
論文参考訳（メタデータ） (2023-03-29T10:19:26Z)
Pre-training Language Model Incorporating Domain-specific Heterogeneous Knowledge into A Unified Representation [49.89831914386982]
本研究では, 構造化されていないテキスト, 半構造化されたテキスト, 十分に構造化されたテキストを含む, あらゆる形式のテキストに対して, 統一された事前学習言語モデル (PLM) を提案する。提案手法は,データの1/4のみを用いて,プレーンテキストの事前学習に優れる。
論文参考訳（メタデータ） (2021-09-02T16:05:24Z)
Full Page Handwriting Recognition via Image to Sequence Extraction [0.0]
このモデルは、IAMデータセットのフルページ認識で新しい最新技術を実現します。商用Webアプリケーションの一部として本番環境にデプロイされる。
論文参考訳（メタデータ） (2021-03-11T04:37:29Z)
Minimally-Supervised Structure-Rich Text Categorization via Learning on Text-Rich Networks [61.23408995934415]
テキストリッチネットワークから学習することで,最小限に教師付き分類を行う新しいフレームワークを提案する。具体的には、テキスト理解のためのテキスト解析モジュールと、クラス差別的でスケーラブルなネットワーク学習のためのネットワーク学習モジュールの2つのモジュールを共同でトレーニングします。実験の結果,1つのカテゴリに3つのシード文書しか与えられず,その精度は約92%であった。
論文参考訳（メタデータ） (2021-02-23T04:14:34Z)
Neural Deepfake Detection with Factual Structure of Text [78.30080218908849]
テキストのディープフェイク検出のためのグラフベースモデルを提案する。我々のアプローチは、ある文書の事実構造をエンティティグラフとして表現する。本モデルでは,機械生成テキストと人文テキストの事実構造の違いを識別することができる。
論文参考訳（メタデータ） (2020-10-15T02:35:31Z)
A Graph Representation of Semi-structured Data for Web Question Answering [96.46484690047491]
本稿では、半構造化データとそれらの関係の構成要素の体系的分類に基づいて、Webテーブルとリストのグラフ表現を提案する。本手法は,最先端のベースラインに対してF1スコアを3.90ポイント向上させる。
論文参考訳（メタデータ） (2020-10-14T04:01:54Z)
A Multi-Perspective Architecture for Semantic Code Search [58.73778219645548]
テキストマッチングのための新しい多言語間ニューラルネットワークを提案する。 CoNaLaデータセットを用いた実験により,提案したモデルでは,従来の手法よりも優れた性能が得られることが示された。
論文参考訳（メタデータ） (2020-05-06T04:46:11Z)
Learning to Select Bi-Aspect Information for Document-Scale Text Content Manipulation [50.01708049531156]
我々は、テキストスタイルの転送とは逆の文書スケールのテキストコンテンツ操作という、新しい実践的なタスクに焦点を当てる。詳細は、入力は構造化されたレコードと、別のレコードセットを記述するための参照テキストのセットである。出力は、ソースレコードセットの部分的内容と参照の書き込みスタイルを正確に記述した要約である。
論文参考訳（メタデータ） (2020-02-24T12:52:10Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。