論文の概要: Handling tree-structured text: parsing directory pages
- arxiv url: http://arxiv.org/abs/2111.12317v1
- Date: Wed, 24 Nov 2021 07:58:47 GMT
- ステータス: 処理完了
- システム内更新日: 2021-11-25 14:58:49.142007
- Title: Handling tree-structured text: parsing directory pages
- Title(参考訳): 木構造テキストの処理:ディレクトリページのパース
- Authors: Sarang Shrivastava, Afreen Shaikh, Shivani Shrivastava, Chung Ming Ho,
Pradeep Reddy, Vijay Saraswat
- Abstract要約: テキストの読み取り順序の決定は、文書の理解に不可欠である。
本稿では、不規則で視覚的に整理された2次元の形式で、ページ上で情報を提示する状況を示す。
本稿では,ディレクトリページの識別と読影木構築の問題に対する解決策を提案する。
- 参考スコア(独自算出の注目度): 1.1241101313597563
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: The determination of the reading sequence of text is fundamental to document
understanding. This problem is easily solved in pages where the text is
organized into a sequence of lines and vertical alignment runs the height of
the page (producing multiple columns which can be read from left to right). We
present a situation -- the directory page parsing problem -- where information
is presented on the page in an irregular, visually-organized, two-dimensional
format. Directory pages are fairly common in financial prospectuses and carry
information about organizations, their addresses and relationships that is key
to business tasks in client onboarding. Interestingly, directory pages
sometimes have hierarchical structure, motivating the need to generalize the
reading sequence to a reading tree. We present solutions to the problem of
identifying directory pages and constructing the reading tree, using (learnt)
classifiers for text segments and a bottom-up (right to left, bottom-to-top)
traversal of segments. The solution is a key part of a production service
supporting automatic extraction of organization, address and relationship
information from client onboarding documents.
- Abstract(参考訳): テキストの読み取り順序の決定は、文書の理解に不可欠である。
この問題は、テキストが一連の行に編成され、垂直にアライメントされたページがページの高さ(左右に読み取れる複数の列を生成する)を実行するページで簡単に解決できる。
ディレクトリページ解析の問題として,不規則で視覚的に整理された2次元の形式でページ上に情報を提示する状況を示す。
ディレクトリページは、金融の見通しにおいてかなり一般的で、顧客オンボーディングにおけるビジネスタスクの鍵となる組織、その住所、関係に関する情報を運ぶ。
興味深いことに、ディレクトリページは階層構造を持つことがあるため、読み込みシーケンスを読み込みツリーに一般化する必要がある。
テキストセグメントの分類器と,セグメントのボトムアップ(右から左,ボトムツートップ)トラバーサルを用いて,ディレクトリページの識別と読み木構築の問題に対する解決策を提案する。
ソリューションは、クライアントオンボードドキュメントから組織、住所、関係情報の自動抽出をサポートする生産サービスの重要な部分である。
関連論文リスト
- PDF-MVQA: A Dataset for Multimodal Information Retrieval in PDF-based Visual Question Answering [13.625303311724757]
文書質問回答(QA)は、視覚に富む文書(VRD)を理解する上での課題を提示する
我々は,複数のページとマルチモーダル情報検索を含む研究雑誌記事に適したPDF-MVQAを提案する。
論文 参考訳(メタデータ) (2024-04-19T09:00:05Z) - Leveraging Collection-Wide Similarities for Unsupervised Document Structure Extraction [61.998789448260005]
本稿では,コレクション内の文書の典型的構造を特定することを提案する。
任意のヘッダのパラフレーズを抽象化し、各トピックを各ドキュメントのロケーションにグルーピングします。
文書間の類似性を利用した教師なしグラフベース手法を開発した。
論文 参考訳(メタデータ) (2024-02-21T16:22:21Z) - Walking Down the Memory Maze: Beyond Context Limit through Interactive
Reading [63.93888816206071]
我々は,長いコンテキストを要約ノードのツリーに処理する手法であるMemWalkerを紹介した。クエリを受信すると,モデルがこのツリーをナビゲートして関連する情報を検索し,十分な情報を収集すると応答する。
その結果,MemWalkerは,テキストを対話的に読み取る際の推論ステップを強調し,クエリに関連するテキストセグメントをピンポイントすることで,説明性の向上を図っている。
論文 参考訳(メタデータ) (2023-10-08T06:18:14Z) - PDFTriage: Question Answering over Long, Structured Documents [60.96667912964659]
構造化文書をプレーンテキストとして表現することは、これらの文書をリッチな構造でユーザ精神モデルと矛盾する。
本稿では,構造や内容に基づいて,モデルがコンテキストを検索できるPDFTriageを提案する。
ベンチマークデータセットは,80以上の構造化文書に900以上の人間が生成した質問からなる。
論文 参考訳(メタデータ) (2023-09-16T04:29:05Z) - Structured Dialogue Discourse Parsing [79.37200787463917]
談話解析は、多人数会話の内部構造を明らかにすることを目的としている。
本稿では,符号化と復号化という2つの観点から,従来の作業を改善する原理的手法を提案する。
実験の結果,本手法は,STACでは2.3,Mollweniでは1.5,先行モデルでは2.3を上回った。
論文 参考訳(メタデータ) (2023-06-26T22:51:01Z) - CED: Catalog Extraction from Documents [12.037861186708799]
本稿では,文書をカタログ木に解析するトランジションベースのフレームワークを提案する。
CEDタスクは、非常に長い文書の原文セグメントと情報抽出タスクのギャップを埋める可能性があると考えています。
論文 参考訳(メタデータ) (2023-04-28T07:32:00Z) - Combining Deep Learning and Reasoning for Address Detection in
Unstructured Text Documents [0.0]
本研究では,非構造化文書からアドレスを検索・抽出する手法として,ディープラーニングと推論を組み合わせたハイブリッド手法を提案する。
スキャンした文書画像上のアドレス領域の境界を検出するために,視覚的深層学習モデルを用いる。
論文 参考訳(メタデータ) (2022-02-07T12:32:00Z) - A Graph Representation of Semi-structured Data for Web Question
Answering [96.46484690047491]
本稿では、半構造化データとそれらの関係の構成要素の体系的分類に基づいて、Webテーブルとリストのグラフ表現を提案する。
本手法は,最先端のベースラインに対してF1スコアを3.90ポイント向上させる。
論文 参考訳(メタデータ) (2020-10-14T04:01:54Z) - Multilevel Text Alignment with Cross-Document Attention [59.76351805607481]
既存のアライメントメソッドは、1つの事前定義されたレベルで動作します。
本稿では,文書を文書間注目要素で表現するための階層的アテンションエンコーダを予め確立した新しい学習手法を提案する。
論文 参考訳(メタデータ) (2020-10-03T02:52:28Z) - Kleister: A novel task for Information Extraction involving Long
Documents with Complex Layout [5.8530995077744645]
2つの新しいデータセットを備えた新しいタスク(Kleisterという名前)を導入します。
NLPシステムは、長い形式文書において、様々な種類のエンティティについて最も重要な情報を見つけなければならない。
異なる名前付きエンティティ認識アーキテクチャを持つテキストのみのベースラインとしてパイプライン法を提案する。
論文 参考訳(メタデータ) (2020-03-04T22:45:22Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。