論文の概要: Adaptive Boundary Proposal Network for Arbitrary Shape Text Detection
- arxiv url: http://arxiv.org/abs/2107.12664v1
- Date: Tue, 27 Jul 2021 08:25:24 GMT
- ステータス: 処理完了
- システム内更新日: 2021-07-28 22:51:50.008646
- Title: Adaptive Boundary Proposal Network for Arbitrary Shape Text Detection
- Title(参考訳): 任意形状テキスト検出のための適応境界提案ネットワーク
- Authors: Shi-Xue Zhang, Xiaobin Zhu, Chun Yang, Hongfa Wang, Xu-Cheng Yin
- Abstract要約: 任意の形状テキスト検出のための新しい適応境界提案ネットワークを提案する。
提案手法は, 任意の形状のテキストに対して, 後処理を伴わずに, 正確な境界を生成できることを学習する。
- 参考スコア(独自算出の注目度): 18.491440228386313
- License: http://creativecommons.org/licenses/by-sa/4.0/
- Abstract: Arbitrary shape text detection is a challenging task due to the high
complexity and variety of scene texts. In this work, we propose a novel
adaptive boundary proposal network for arbitrary shape text detection, which
can learn to directly produce accurate boundary for arbitrary shape text
without any post-processing. Our method mainly consists of a boundary proposal
model and an innovative adaptive boundary deformation model. The boundary
proposal model constructed by multi-layer dilated convolutions is adopted to
produce prior information (including classification map, distance field, and
direction field) and coarse boundary proposals. The adaptive boundary
deformation model is an encoder-decoder network, in which the encoder mainly
consists of a Graph Convolutional Network (GCN) and a Recurrent Neural Network
(RNN). It aims to perform boundary deformation in an iterative way for
obtaining text instance shape guided by prior information from the boundary
proposal model.In this way, our method can directly and efficiently generate
accurate text boundaries without complex post-processing. Extensive experiments
on publicly available datasets demonstrate the state-of-the-art performance of
our method.
- Abstract(参考訳): 任意形状テキストの検出は、複雑なシーンテキストの多様さのために難しい課題である。
本研究では,任意の形状テキストに対して,後処理をすることなく正確な境界を生成できる適応的境界提案ネットワークを提案する。
提案手法は主に境界モデルと革新的適応境界変形モデルから構成される。
多層拡張畳み込みによって構築された境界提案モデルを用いて、事前情報(分類地図、距離場、方向場を含む)と粗い境界提案を生成する。
適応的境界変形モデルはエンコーダ・デコーダネットワークであり、エンコーダは主にグラフ畳み込みネットワーク(GCN)とリカレントニューラルネットワーク(RNN)で構成されている。
境界提案モデルから先行情報に導かれたテキストインスタンス形状を反復的に取得する手法で境界変形を行うことを目標とし,複雑な後処理をすることなく,精度の高いテキスト境界を効率的に生成する手法を提案する。
公開データセットに関する広範囲な実験により,本手法の最先端性能が実証された。
関連論文リスト
- BPDO:Boundary Points Dynamic Optimization for Arbitrary Shape Scene Text
Detection [19.574306663095243]
境界点動的最適化(BPDO)を用いた任意形状シーンテキスト検出法を提案する。
モデルはテキスト認識モジュール (TAM) と境界点動的最適化モジュール (DOM) で設計されている。
本論文では,CTW-1500,Total-Text,MSRA-TD500データセットを用いた実験により,最先端アルゴリズムに匹敵する性能が得られた。
論文 参考訳(メタデータ) (2024-01-18T14:13:46Z) - RecRecNet: Rectangling Rectified Wide-Angle Images by Thin-Plate Spline
Model and DoF-based Curriculum Learning [62.86400614141706]
我々はRecRecNet(Rectangling Rectification Network)という新しい学習モデルを提案する。
我々のモデルは、ソース構造をターゲット領域に柔軟にワープし、エンドツーエンドの非教師なし変形を実現する。
実験により, 定量評価と定性評価の両面において, 比較法よりも解法の方が優れていることが示された。
論文 参考訳(メタデータ) (2023-01-04T15:12:57Z) - Reduced Representation of Deformation Fields for Effective Non-rigid
Shape Matching [26.77241999731105]
変形場の縮小表現を利用して,非剛体物体間の対応を計算するための新しい手法を提案する。
ネットワークは空間(ノード)における粗い位置の変形パラメータを学習させることにより、滑らかさを保証された閉形式の連続的な変形場を再構築する。
我々のモデルは高い表現力を持ち、複雑な変形を捉えることができる。
論文 参考訳(メタデータ) (2022-11-26T16:11:17Z) - SpaText: Spatio-Textual Representation for Controllable Image Generation [61.89548017729586]
SpaTextはオープン語彙シーン制御を用いたテキスト・ツー・イメージ生成の新しい手法である。
シーン全体を記述したグローバルテキストプロンプトに加えて、ユーザはセグメンテーションマップを提供する。
現状拡散モデルである画素ベースと潜在条件ベースでの有効性を示す。
論文 参考訳(メタデータ) (2022-11-25T18:59:10Z) - Arbitrary Shape Text Detection via Boundary Transformer [18.229219867056347]
任意の形状テキスト検出のための境界学習による粗粒度統一フレームワークを提案する。
我々は、イノベーティブな反復的境界変換器を通じて、粗い方法でテキスト境界を明示的にモデル化する。
提案手法は, テキスト境界を直接取得し, 複雑な後処理を放棄し, 効率を向上する。
論文 参考訳(メタデータ) (2022-05-11T07:59:13Z) - Real-Time Scene Text Detection with Differentiable Binarization and
Adaptive Scale Fusion [62.269219152425556]
セグメンテーションに基づくシーンテキスト検出手法はシーンテキスト検出分野において大きな注目を集めている。
本稿では,二項化処理をセグメンテーションネットワークに統合する分散二項化(DB)モジュールを提案する。
アダプティブ・スケール・フュージョン (ASF) モジュールは, 異なるスケールの特徴を適応的に融合させることにより, スケールのロバスト性を向上させる。
論文 参考訳(メタデータ) (2022-02-21T15:30:14Z) - Deep Magnification-Flexible Upsampling over 3D Point Clouds [103.09504572409449]
本稿では,高密度点雲を生成するためのエンドツーエンド学習ベースのフレームワークを提案する。
まずこの問題を明示的に定式化し、重みと高次近似誤差を判定する。
そこで我々は,高次改良とともに,統一重みとソート重みを適応的に学習する軽量ニューラルネットワークを設計する。
論文 参考訳(メタデータ) (2020-11-25T14:00:18Z) - Neural Subdivision [58.97214948753937]
本稿では,データ駆動型粗粒度モデリングの新しいフレームワークであるNeural Subdivisionを紹介する。
すべてのローカルメッシュパッチで同じネットワーク重みのセットを最適化するため、特定の入力メッシュや固定属、カテゴリに制約されないアーキテクチャを提供します。
単一の高分解能メッシュでトレーニングしても,本手法は新規な形状に対して合理的な区分を生成する。
論文 参考訳(メタデータ) (2020-05-04T20:03:21Z) - ContourNet: Taking a Further Step toward Accurate Arbitrary-shaped Scene
Text Detection [147.10751375922035]
本研究では,シーンテキストの偽陽性と大規模分散を効果的に処理するContourNetを提案する。
本手法は,両方向の応答値の高い予測を出力するだけで,これらの偽陽性を効果的に抑制する。
論文 参考訳(メタデータ) (2020-04-10T08:15:23Z) - Deep Relational Reasoning Graph Network for Arbitrary Shape Text
Detection [20.244378408779554]
任意の形状テキスト検出のための新しい統合型関係推論グラフネットワークを提案する。
革新的局所グラフは、CNNとグラフ畳み込みネットワーク(GCN)を介して、テキスト提案モデルと深い関係推論ネットワークを橋渡しする
公開データセットの実験により,本手法の最先端性能が実証された。
論文 参考訳(メタデータ) (2020-03-17T01:50:07Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。