論文の概要: Unified Line and Paragraph Detection by Graph Convolutional Networks
- arxiv url: http://arxiv.org/abs/2203.09638v1
- Date: Thu, 17 Mar 2022 22:27:12 GMT
- ステータス: 処理完了
- システム内更新日: 2022-03-22 06:49:50.520173
- Title: Unified Line and Paragraph Detection by Graph Convolutional Networks
- Title(参考訳): グラフ畳み込みネットワークによる統一線とパラグラフ検出
- Authors: Shuang Liu, Renshen Wang, Michalis Raptis, Yasuhisa Fujii
- Abstract要約: 文書中の行や段落を検出するタスクを,統一された2段階クラスタリング問題に定式化する。
グラフ畳み込みネットワークを用いて、テキスト検出ボックス間の関係を予測し、これらの予測から両方のレベルのクラスタを構築する。
実験により,この統一手法は,公開ベンチマークや実世界の画像における段落検出の最先端性を保ちながら,高い効率で実現可能であることを示した。
- 参考スコア(独自算出の注目度): 5.298581058536571
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: We formulate the task of detecting lines and paragraphs in a document into a
unified two-level clustering problem. Given a set of text detection boxes that
roughly correspond to words, a text line is a cluster of boxes and a paragraph
is a cluster of lines. These clusters form a two-level tree that represents a
major part of the layout of a document. We use a graph convolutional network to
predict the relations between text detection boxes and then build both levels
of clusters from these predictions. Experimentally, we demonstrate that the
unified approach can be highly efficient while still achieving state-of-the-art
quality for detecting paragraphs in public benchmarks and real-world images.
- Abstract(参考訳): 文書中の行や段落を検出するタスクを,統一された2段階クラスタリング問題に定式化する。
単語とほぼ一致するテキスト検出ボックスのセットが与えられた場合、テキスト行はボックスの集合であり、段落はラインの集合である。
これらのクラスタは、ドキュメントのレイアウトの主要な部分を表す2レベルツリーを形成する。
グラフ畳み込みネットワークを用いて、テキスト検出ボックス間の関係を予測し、これらの予測から両方のレベルのクラスタを構築する。
実験により,この統一手法は,公開ベンチマークや実世界の画像における段落検出の最先端性を保ちながら,高効率であることを示す。
関連論文リスト
- Hierarchical Text Spotter for Joint Text Spotting and Layout Analysis [52.01356859448068]
HTSは画像中のテキストを認識し、文字、単語、行、段落の4段階の階層構造を識別することができる。
HTSは、複数の単語レベルのテキストスポッティングベンチマークデータセットと幾何学的レイアウト解析タスクの最先端結果を達成する。
論文 参考訳(メタデータ) (2023-10-25T22:23:54Z) - Text Reading Order in Uncontrolled Conditions by Sparse Graph
Segmentation [71.40119152422295]
テキストの読み出し順序を識別するための軽量でスケーラブルで一般化可能なアプローチを提案する。
モデルは言語に依存しず、多言語データセットで効果的に実行される。
モバイルデバイスを含むあらゆるプラットフォームにデプロイできるほど小さい。
論文 参考訳(メタデータ) (2023-05-04T06:21:00Z) - Towards End-to-End Unified Scene Text Detection and Layout Analysis [60.68100769639923]
本稿では,シーンテキストの検出とレイアウト解析を統合化するタスクについて紹介する。
この新たな研究課題を実現するために、最初の階層的なシーンテキストデータセットが導入された。
また,シーンテキストを同時に検出し,テキストクラスタを統一的に形成する手法を提案する。
論文 参考訳(メタデータ) (2022-03-28T23:35:45Z) - Controversy Detection: a Text and Graph Neural Network Based Approach [0.0]
論争の内容は、ポジティブとネガティブの両方のフィードバックを惹きつけるあらゆるコンテンツを指す。
既存のアプローチのほとんどは、トピックのディスカッションやメッセージの内容のグラフ構造に依存しています。
本稿では,議論のグラフ構造とテキストの特徴に基づく論争検出手法を提案する。
論文 参考訳(メタデータ) (2021-12-03T09:06:46Z) - StrokeNet: Stroke Assisted and Hierarchical Graph Reasoning Networks [31.76016966100244]
StrokeNetは、きめ細かいストロークをキャプチャすることで、テキストを効果的に検出する。
テキスト領域を一連のポイントや長方形のボックスで表現する既存のアプローチとは異なり、各テキストインスタンスのストロークを直接ローカライズする。
論文 参考訳(メタデータ) (2021-11-23T08:26:42Z) - Vec2GC -- A Graph Based Clustering Method for Text Representations [0.0]
Vec2GCは、任意のテキストコーパスの用語やドキュメントをクラスタ化するエンドツーエンドパイプラインである。
Vec2GCクラスタリングアルゴリズムは、階層的なクラスタリングもサポートする密度ベースのアプローチである。
論文 参考訳(メタデータ) (2021-04-15T12:52:30Z) - SOLD2: Self-supervised Occlusion-aware Line Description and Detection [95.8719432775724]
単一深層ネットワークにおける回線セグメントの最初の共同検出と記述について紹介します。
我々の手法は注釈付き行ラベルを必要としないため、任意のデータセットに一般化することができる。
複数のマルチビューデータセットにおいて,従来の行検出と記述方法に対するアプローチを評価した。
論文 参考訳(メタデータ) (2021-04-07T19:27:17Z) - Minimally-Supervised Structure-Rich Text Categorization via Learning on
Text-Rich Networks [61.23408995934415]
テキストリッチネットワークから学習することで,最小限に教師付き分類を行う新しいフレームワークを提案する。
具体的には、テキスト理解のためのテキスト解析モジュールと、クラス差別的でスケーラブルなネットワーク学習のためのネットワーク学習モジュールの2つのモジュールを共同でトレーニングします。
実験の結果,1つのカテゴリに3つのシード文書しか与えられず,その精度は約92%であった。
論文 参考訳(メタデータ) (2021-02-23T04:14:34Z) - Graph-based Topic Extraction from Vector Embeddings of Text Documents:
Application to a Corpus of News Articles [0.0]
自然言語処理の強力なベクトル埋め込みと,マルチスケールグラフ分割のツールを組み合わせた,教師なしのフレームワークを提案する。
グラフベースのクラスタリングの利点を,他の一般的なクラスタリングやトピックモデリング手法とエンドツーエンド比較によって示す。
この研究は2016年の大統領選挙の際、アメリカのニュース記事のコーパスを分析して紹介された。
論文 参考訳(メタデータ) (2020-10-28T16:20:05Z) - Heterogeneous Graph Neural Networks for Extractive Document
Summarization [101.17980994606836]
クロス文関係は、抽出文書要約における重要なステップである。
We present a graph-based neural network for extractive summarization (HeterSumGraph)
抽出文書要約のためのグラフベースニューラルネットワークに異なる種類のノードを導入する。
論文 参考訳(メタデータ) (2020-04-26T14:38:11Z) - ReLaText: Exploiting Visual Relationships for Arbitrary-Shaped Scene
Text Detection with Graph Convolutional Networks [6.533254660400229]
本稿では,ReLaTextという任意の字型テキスト検出手法を提案する。
この新定式化の有効性を示すために,まず「リンク」関係を用いてテキスト行グループ化の問題に対処する。
我々のGCNベースのテキストライングルーピングアプローチは、従来のテキストライングルーピング手法よりも優れたテキスト検出精度を実現することができる。
論文 参考訳(メタデータ) (2020-03-16T03:33:48Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。