論文の概要: Deep Relational Reasoning Graph Network for Arbitrary Shape Text
Detection
- arxiv url: http://arxiv.org/abs/2003.07493v2
- Date: Sun, 30 Aug 2020 07:36:56 GMT
- ステータス: 処理完了
- システム内更新日: 2022-12-22 21:23:17.521996
- Title: Deep Relational Reasoning Graph Network for Arbitrary Shape Text
Detection
- Title(参考訳): 任意形状テキスト検出のためのDeep Relational Reasoning Graph Network
- Authors: Shi-Xue Zhang, Xiaobin Zhu, Jie-Bo Hou, Chang Liu, Chun Yang, Hongfa
Wang, Xu-Cheng Yin
- Abstract要約: 任意の形状テキスト検出のための新しい統合型関係推論グラフネットワークを提案する。
革新的局所グラフは、CNNとグラフ畳み込みネットワーク(GCN)を介して、テキスト提案モデルと深い関係推論ネットワークを橋渡しする
公開データセットの実験により,本手法の最先端性能が実証された。
- 参考スコア(独自算出の注目度): 20.244378408779554
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Arbitrary shape text detection is a challenging task due to the high variety
and complexity of scenes texts. In this paper, we propose a novel unified
relational reasoning graph network for arbitrary shape text detection. In our
method, an innovative local graph bridges a text proposal model via
Convolutional Neural Network (CNN) and a deep relational reasoning network via
Graph Convolutional Network (GCN), making our network end-to-end trainable. To
be concrete, every text instance will be divided into a series of small
rectangular components, and the geometry attributes (e.g., height, width, and
orientation) of the small components will be estimated by our text proposal
model. Given the geometry attributes, the local graph construction model can
roughly establish linkages between different text components. For further
reasoning and deducing the likelihood of linkages between the component and its
neighbors, we adopt a graph-based network to perform deep relational reasoning
on local graphs. Experiments on public available datasets demonstrate the
state-of-the-art performance of our method.
- Abstract(参考訳): 任意形状のテキスト検出は、シーンテキストの多様さと複雑さのために難しい課題である。
本稿では,任意の形状テキスト検出のための新しい統合型関係推論グラフネットワークを提案する。
提案手法では,畳み込みニューラルネットワーク(CNN)によるテキスト提案モデルと,グラフ畳み込みネットワーク(GCN)によるディープリレーショナル推論ネットワークを橋渡しし,エンドツーエンドのトレーニングを可能にする。
具体的に言うと、すべてのテキストインスタンスは、一連の小さな矩形コンポーネントに分割され、小さなコンポーネントの幾何学的属性(高さ、幅、向きなど)は、テキストの提案モデルによって推定されます。
幾何学的属性を考えると、局所グラフ構築モデルは、異なるテキストコンポーネント間のリンクを概ね確立することができる。
コンポーネントとその隣接ノード間のリンクの可能性のさらなる推論と推定のために、我々はローカルグラフ上で深い関係推論を行うグラフベースのネットワークを採用する。
公開データセットを用いた実験により,本手法の最先端性能を示す。
関連論文リスト
- Bridging Local Details and Global Context in Text-Attributed Graphs [62.522550655068336]
GraphBridgeは、コンテキストテキスト情報を活用することで、ローカルおよびグローバルな視点をブリッジするフレームワークである。
提案手法は最先端性能を実現し,グラフ対応トークン削減モジュールは効率を大幅に向上し,スケーラビリティの問題を解消する。
論文 参考訳(メタデータ) (2024-06-18T13:35:25Z) - GNN-LoFI: a Novel Graph Neural Network through Localized Feature-based
Histogram Intersection [51.608147732998994]
グラフニューラルネットワークは、グラフベースの機械学習の選択フレームワークになりつつある。
本稿では,古典的メッセージパッシングに代えて,ノード特徴の局所分布を解析するグラフニューラルネットワークアーキテクチャを提案する。
論文 参考訳(メタデータ) (2024-01-17T13:04:23Z) - Pretraining Language Models with Text-Attributed Heterogeneous Graphs [28.579509154284448]
テキスト分散不均質グラフ(TAHG)におけるトポロジ的および異種情報を明確に考察する言語モデル(LM)のための新しい事前学習フレームワークを提案する。
本稿では、LMと補助異種グラフニューラルネットワークを協調最適化することにより、コンテキストグラフに関わるノードを予測するトポロジ対応事前学習タスクを提案する。
各種ドメインの3つのデータセット上でリンク予測とノード分類を行う。
論文 参考訳(メタデータ) (2023-10-19T08:41:21Z) - SynGraphy: Succinct Summarisation of Large Networks via Small Synthetic
Representative Graphs [4.550112751061436]
大規模ネットワークデータセットの構造を視覚的に要約するSynGraphyについて述べる。
入力グラフに類似した構造特性を持つために生成されたより小さなグラフを描画する。
論文 参考訳(メタデータ) (2023-02-15T16:00:15Z) - Improving Graph-Based Text Representations with Character and Word Level
N-grams [30.699644290131044]
単語と文字n-gramノードを文書ノードと組み合わせた新しい単語文字テキストグラフを提案する。
また、提案したテキストグラフをモデル化するための2つの新しいグラフベースニューラルモデルWCTextGCNとWCTextGATを提案する。
論文 参考訳(メタデータ) (2022-10-12T08:07:54Z) - TeKo: Text-Rich Graph Neural Networks with External Knowledge [75.91477450060808]
外部知識を用いた新しいテキストリッチグラフニューラルネットワーク(TeKo)を提案する。
まず、高品質なエンティティを組み込んだフレキシブルな異種セマンティックネットワークを提案する。
次に、構造化三重項と非構造化実体記述という2種類の外部知識を導入する。
論文 参考訳(メタデータ) (2022-06-15T02:33:10Z) - StrokeNet: Stroke Assisted and Hierarchical Graph Reasoning Networks [31.76016966100244]
StrokeNetは、きめ細かいストロークをキャプチャすることで、テキストを効果的に検出する。
テキスト領域を一連のポイントや長方形のボックスで表現する既存のアプローチとは異なり、各テキストインスタンスのストロークを直接ローカライズする。
論文 参考訳(メタデータ) (2021-11-23T08:26:42Z) - GraphFormers: GNN-nested Transformers for Representation Learning on
Textual Graph [53.70520466556453]
階層的にGNNコンポーネントを言語モデルのトランスフォーマーブロックと一緒にネストするGraphFormerを提案する。
提案したアーキテクチャでは、テキストエンコーディングとグラフ集約を反復的なワークフローに融合する。
さらに、プログレッシブ・ラーニング・ストラテジーを導入し、そのモデルが操作されたデータと元のデータに基づいて連続的に訓練され、グラフ上の情報を統合する能力を強化する。
論文 参考訳(メタデータ) (2021-05-06T12:20:41Z) - Towards Efficient Scene Understanding via Squeeze Reasoning [71.1139549949694]
我々はSqueeze Reasoningと呼ばれる新しいフレームワークを提案する。
空間地図上の情報を伝播するのではなく、まず入力特徴をチャネルワイドなグローバルベクトルに絞ることを学ぶ。
提案手法はエンドツーエンドのトレーニングブロックとしてモジュール化可能であり,既存のネットワークに簡単に接続可能であることを示す。
論文 参考訳(メタデータ) (2020-11-06T12:17:01Z) - Spectral Embedding of Graph Networks [76.27138343125985]
ローカルノードの類似性と接続性、グローバル構造をトレードオフする教師なしグラフ埋め込みを導入する。
埋め込みは一般化されたグラフ Laplacian に基づいており、固有ベクトルは1つの表現においてネットワーク構造と近傍近傍の両方をコンパクトにキャプチャする。
論文 参考訳(メタデータ) (2020-09-30T04:59:10Z) - PuzzleNet: Scene Text Detection by Segment Context Graph Learning [9.701699882807251]
そこで本研究では,Puzzle Networks (PuzzleNets) と呼ばれる新しい分解手法を提案する。
セグメントをコンテキストグラフとして構築することで、MSGCNはセグメントの組み合わせを予測するためにセグメントコンテキストを効果的に利用する。
提案手法は,セグメントコンテキストグラフの活用により,現在の最先端技術よりも優れた,あるいは同等の性能を実現することができる。
論文 参考訳(メタデータ) (2020-02-26T09:21:05Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。