Fugu-MT 論文翻訳(概要): Text Region Multiple Information Perception Network for Scene Text Detection

論文の概要: Text Region Multiple Information Perception Network for Scene Text Detection

arxiv url: http://arxiv.org/abs/2401.10017v1
Date: Thu, 18 Jan 2024 14:36:51 GMT
ステータス: 翻訳完了
システム内更新日: 2024-01-19 16:25:32.809752
Title: Text Region Multiple Information Perception Network for Scene Text Detection
Title（参考訳）: シーンテキスト検出のためのテキスト領域多重情報知覚ネットワーク
Authors: Jinzhi Zheng, Libo Zhang, Yanjun Wu, Chen Zhao
Abstract要約: 本稿では,セグメント化に基づくアルゴリズムの検出性能を高めるために,RMIPM (Regional Multiple Information Perception Module) と呼ばれるプラグアンドプレイモジュールを提案する。具体的には,テキストフォアグラウンド分類マップ,距離マップ,方向マップなど,シーンテキスト領域に関する様々な情報を知覚できる改良されたモジュールを設計する。
参考スコア（独自算出の注目度）: 19.574306663095243
License: http://creativecommons.org/licenses/by/4.0/
Abstract: Segmentation-based scene text detection algorithms can handle arbitrary shape scene texts and have strong robustness and adaptability, so it has attracted wide attention. Existing segmentation-based scene text detection algorithms usually only segment the pixels in the center region of the text, while ignoring other information of the text region, such as edge information, distance information, etc., thus limiting the detection accuracy of the algorithm for scene text. This paper proposes a plug-and-play module called the Region Multiple Information Perception Module (RMIPM) to enhance the detection performance of segmentation-based algorithms. Specifically, we design an improved module that can perceive various types of information about scene text regions, such as text foreground classification maps, distance maps, direction maps, etc. Experiments on MSRA-TD500 and TotalText datasets show that our method achieves comparable performance with current state-of-the-art algorithms.
Abstract（参考訳）: セグメンテーションに基づくシーンテキスト検出アルゴリズムは任意の形状のシーンテキストを処理でき、堅牢性と適応性が強く、注目されている。既存のセグメンテーションに基づくシーンテキスト検出アルゴリズムは通常、テキストの中心領域のピクセルのみを分割するが、エッジ情報や距離情報などのテキスト領域の他の情報を無視して、シーンテキストのアルゴリズムの検出精度を制限する。本稿では,セグメント化アルゴリズムの検出性能を高めるために,RMIPM (Regional Multiple Information Perception Module) と呼ばれるプラグアンドプレイモジュールを提案する。具体的には,テキストフォアグラウンド分類マップ,距離マップ,方向マップなど,シーンテキスト領域に関する様々な情報を知覚できる改良されたモジュールを設計する。 MSRA-TD500およびTotalTextデータセットを用いた実験により,本手法が現在最先端のアルゴリズムと同等の性能を発揮することが示された。

関連論文リスト

Spotlight Text Detector: Spotlight on Candidate Regions Like a Camera [31.180352896153682]
シーンテキストに有効なスポットライトテキスト検出器(STD)を提案する。スポットライト校正モジュール(SCM)と多変量情報抽出モジュール(MIEM)で構成される。我々のSTDは、様々なデータセットの既存の最先端手法よりも優れている。
論文参考訳（メタデータ） (2024-09-25T11:19:09Z)
Towards Unified Multi-granularity Text Detection with Interactive Attention [56.79437272168507]
Detect Any Text"は、シーンテキストの検出、レイアウト分析、ドキュメントページの検出を結合的なエンドツーエンドモデルに統合する高度なパラダイムである。 DATにおける重要なイノベーションは、テキストインスタンスの表現学習を大幅に強化する、粒度横断型アテンションモジュールである。テストによると、DATは様々なテキスト関連ベンチマークで最先端のパフォーマンスを達成する。
論文参考訳（メタデータ） (2024-05-30T07:25:23Z)
BPDO:Boundary Points Dynamic Optimization for Arbitrary Shape Scene Text Detection [19.574306663095243]
境界点動的最適化(BPDO)を用いた任意形状シーンテキスト検出法を提案する。モデルはテキスト認識モジュール (TAM) と境界点動的最適化モジュール (DOM) で設計されている。本論文では,CTW-1500,Total-Text,MSRA-TD500データセットを用いた実験により,最先端アルゴリズムに匹敵する性能が得られた。
論文参考訳（メタデータ） (2024-01-18T14:13:46Z)
Adaptive Segmentation Network for Scene Text Detection [0.0]
セグメント化に基づくシーンテキスト検出のための背景画素とテキスト画素を区別する識別セグメンテーションしきい値を自動的に学習する。さらに、マクロサイズと極端アスペクト比でテキストインスタンスをキャプチャするGE-FPN(Global-information Enhanced Feature Pyramid Network)を設計する。最後に,提案したしきい値学習戦略とテキスト検出構造とともに,シーンテキスト検出のための適応ネットワーク(ASNet)を設計する。
論文参考訳（メタデータ） (2023-07-27T17:37:56Z)
Towards End-to-End Unified Scene Text Detection and Layout Analysis [60.68100769639923]
本稿では,シーンテキストの検出とレイアウト解析を統合化するタスクについて紹介する。この新たな研究課題を実現するために、最初の階層的なシーンテキストデータセットが導入された。また,シーンテキストを同時に検出し,テキストクラスタを統一的に形成する手法を提案する。
論文参考訳（メタデータ） (2022-03-28T23:35:45Z)
RSCA: Real-time Segmentation-based Context-Aware Scene Text Detection [14.125634725954848]
任意のシーンテキスト検出のためのリアルタイムコンテキスト認識モデル RSCA を提案する。これらの戦略に基づいて、RSCAは複雑なラベルの割り当てや繰り返しの機能集約なしに、スピードと精度の両方で最先端のパフォーマンスを達成する。
論文参考訳（メタデータ） (2021-05-26T18:43:17Z)
RayNet: Real-time Scene Arbitrary-shape Text Detection with Multiple Rays [84.15123599963239]
RayNetと呼ばれる任意の形状のテキスト検出のための新しい検出フレームワークを提案する。 RayNet はテキストに適合するために Center Point Set (CPS) と Ray Distance (RD) を使用し、テキストの一般的な位置を決定するために CPS を使用し、RD を CPS と組み合わせてRay Points (RP) を計算し、テキストの正確な形状をローカライズする。 RayNetは、既存の曲面テキストデータセット(CTW1500)と四角テキストデータセット(ICDAR2015)で素晴らしいパフォーマンスを達成する
論文参考訳（メタデータ） (2021-04-11T03:03:23Z)
Scene Text Retrieval via Joint Text Detection and Similarity Learning [68.24531728554892]
シーンテキスト検索は、与えられたクエリテキストと同じまたは類似している画像ギャラリーからすべてのテキストインスタンスをローカライズし、検索することを目的としています。自然画像からクエリテキストと各テキストインスタンスのクロスモーダルな類似性を直接学習することでこの問題に対処します。このように、検出されたテキストインスタンスを学習された類似度でランク付けすることで、シーンテキスト検索を簡単に実行できます。
論文参考訳（メタデータ） (2021-04-04T07:18:38Z)
MOST: A Multi-Oriented Scene Text Detector with Localization Refinement [67.35280008722255]
シーンテキスト検出のための新しいアルゴリズムを提案し、テキストローカリゼーションの品質を大幅に向上させる一連の戦略を提案する。具体的には,テキスト・フィーチャー・アライメント・モジュール (TFAM) を提案し,特徴の受容領域を動的に調整する。信頼できないものを排除するために、位置認識非最大抑制(PA-NMS)モジュールを考案する。
論文参考訳（メタデータ） (2021-04-02T14:34:41Z)
BOTD: Bold Outline Text Detector [85.33700624095181]
我々はBold Outline Text Detector(BOTD)と呼ばれる新しい1段テキスト検出器を提案する。 BOTDは、モデルの複雑さを低くして任意の形のテキストを処理できる。 3つの実世界のベンチマークによる実験結果から,BOTDの最先端性能が示された。
論文参考訳（メタデータ） (2020-11-30T11:54:14Z)
DGST : Discriminator Guided Scene Text detector [11.817428636084305]
本稿では,シーンテキスト検出のセグメンテーション効果を改善するために,条件付き生成逆数ネットワークに基づく検出フレームワークを提案する。標準データセットの実験では、提案されたDGSTが顕著なゲインをもたらし、最先端の手法より優れていることが示されている。
論文参考訳（メタデータ） (2020-02-28T01:47:36Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。