論文の概要: Progressive Evolution from Single-Point to Polygon for Scene Text
- arxiv url: http://arxiv.org/abs/2312.13778v3
- Date: Fri, 10 May 2024 14:01:07 GMT
- ステータス: 処理完了
- システム内更新日: 2024-05-13 20:17:21.505492
- Title: Progressive Evolution from Single-Point to Polygon for Scene Text
- Title(参考訳): シーンテキストのための単一点からポリゴンへの進化的進化
- Authors: Linger Deng, Mingxin Huang, Xudong Xie, Yuliang Liu, Lianwen Jin, Xiang Bai,
- Abstract要約: 単点をコンパクトな多角形に効率よく変換できるPoint2Polygonを導入する。
まず認識信頼度に基づいてアンカーポイントを作成し,ポリゴンを垂直に水平に精製する。
また,本手法により生成したポリゴンを用いた学習において,GTと比較して精度の86%を達成し,さらに,提案したPoint2Polygonをシームレスに統合することにより,単一点スポッターにポリゴンの生成を促進させることができた。
- 参考スコア(独自算出の注目度): 79.29097971932529
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: The advancement of text shape representations towards compactness has enhanced text detection and spotting performance, but at a high annotation cost. Current models use single-point annotations to reduce costs, yet they lack sufficient localization information for downstream applications. To overcome this limitation, we introduce Point2Polygon, which can efficiently transform single-points into compact polygons. Our method uses a coarse-to-fine process, starting with creating and selecting anchor points based on recognition confidence, then vertically and horizontally refining the polygon using recognition information to optimize its shape. We demonstrate the accuracy of the generated polygons through extensive experiments: 1) By creating polygons from ground truth points, we achieved an accuracy of 82.0% on ICDAR 2015; 2) In training detectors with polygons generated by our method, we attained 86% of the accuracy relative to training with ground truth (GT); 3) Additionally, the proposed Point2Polygon can be seamlessly integrated to empower single-point spotters to generate polygons. This integration led to an impressive 82.5% accuracy for the generated polygons. It is worth mentioning that our method relies solely on synthetic recognition information, eliminating the need for any manual annotation beyond single points.
- Abstract(参考訳): コンパクト化に向けたテキスト形状表現の進歩により、テキスト検出とスポッティング性能が向上したが、アノテーションコストが高い。
現在のモデルはコスト削減のために単一ポイントアノテーションを使用しているが、下流アプリケーションには十分なローカライズ情報がない。
この制限を克服するために、単一点をコンパクトなポリゴンに効率的に変換できるPoint2Polygonを導入する。
まず、認識信頼度に基づいてアンカーポイントを作成し、次に認識情報を用いてポリゴンを垂直に水平に精製し、その形状を最適化する。
我々は、広範囲な実験を通して生成されたポリゴンの精度を実証する。
1) 地上の真理点からポリゴンを作成することにより, ICDAR 2015において精度82.0%を達成した。
2)本法により生成したポリゴンを用いたトレーニング検出器では,グラウンド・真理(GT)によるトレーニングと比較して精度が86%に達した。
さらに、提案したPoint2Polygonをシームレスに統合することで、シングルポイントスポッターにポリゴンを生成することができる。
この統合により、生成されたポリゴンの精度は82.5%に向上した。
なお,本手法は合成認識情報にのみ依存しており,単一点以上の手動アノテーションは不要である。
関連論文リスト
- ConDaFormer: Disassembled Transformer with Local Structure Enhancement
for 3D Point Cloud Understanding [105.98609765389895]
トランスフォーマーは、最近3Dポイントクラウド理解のために研究されている。
0.1万を超える多数のポイントは、ポイントクラウドデータに対してグローバルな自己注意を可能にする。
本稿では,ConDaFormerという新しい変圧器ブロックを開発する。
論文 参考訳(メタデータ) (2023-12-18T11:19:45Z) - DPPD: Deformable Polar Polygon Object Detection [3.9236649268347765]
我々は,ポリゴン形状の物体を検出するための新しい変形可能な極ポリゴン物体検出法(DPPD)を開発した。
DPPDは、自律運転のための様々な物体検出タスクで成功している。
論文 参考訳(メタデータ) (2023-04-05T06:43:41Z) - PolyBuilding: Polygon Transformer for End-to-End Building Extraction [9.196604757138825]
PolyBuildingはリモートセンシング画像から建物のベクトル表現を予測する。
モデルはそれらの関係を学習し、画像からコンテキスト情報を符号化し、構築ポリゴンの最終セットを予測する。
また、ピクセルレベルのカバレッジ、インスタンスレベルの精度とリコール、幾何学レベルの特性など、新たな最先端性を実現している。
論文 参考訳(メタデータ) (2022-11-03T04:53:17Z) - Towards General-Purpose Representation Learning of Polygonal Geometries [62.34832826705641]
我々は,多角形形状を埋め込み空間に符号化できる汎用多角形符号化モデルを開発した。
1)MNISTに基づく形状分類,2)DBSR-46KとDBSR-cplx46Kという2つの新しいデータセットに基づく空間関係予測を行う。
以上の結果から,NUFTspec と ResNet1D は,既存のベースラインよりも有意なマージンで優れていた。
論文 参考訳(メタデータ) (2022-09-29T15:59:23Z) - PolyWorld: Polygonal Building Extraction with Graph Neural Networks in
Satellite Images [10.661430927191205]
本稿では、画像から直接建物頂点を抽出し、それらを正しく接続して正確なポリゴンを生成するニューラルネットワークであるPolyWorldを紹介する。
PolyWorldは、ポリゴン化の構築における最先端を著しく上回る。
論文 参考訳(メタデータ) (2021-11-30T15:23:17Z) - PolyNet: Polynomial Neural Network for 3D Shape Recognition with
PolyShape Representation [51.147664305955495]
3次元形状表現とその処理は3次元形状認識に大きな影響を及ぼす。
我々は、ディープニューラルネットワークに基づく手法(PolyNet)と特定のポリゴン表現(PolyShape)を提案する。
本研究では,3次元形状分類と検索作業におけるPolyNetの長所と長所を実証した。
論文 参考訳(メタデータ) (2021-10-15T06:45:59Z) - CenterPoly: real-time instance segmentation using bounding polygons [11.365829102707014]
有界多角形を用いたリアルタイムインスタンスセグメンテーションのための新しい手法であるCenterPolyを提案する。
都市部密集環境における道路利用者の検出に応用し,自動走行車などのインテリジェント交通システムへの適用に適している。
ネットワークパラメータのほとんどはネットワークヘッドによって共有され、高速かつ軽量でリアルタイムに実行することができる。
論文 参考訳(メタデータ) (2021-08-19T21:31:30Z) - Polygonal Point Set Tracking [50.445151155209246]
本稿では,学習に基づく多角形点集合追跡手法を提案する。
私たちのゴールは、ターゲットの輪郭上の対応する点を追跡することです。
本稿では,部分歪みとテキストマッピングに対する本手法の視覚効果について述べる。
論文 参考訳(メタデータ) (2021-05-30T17:12:36Z) - SPU-Net: Self-Supervised Point Cloud Upsampling by Coarse-to-Fine
Reconstruction with Self-Projection Optimization [52.20602782690776]
実際のスキャンされたスパースデータからトレーニング用の大規模なペアリングスパーススキャンポイントセットを得るのは高価で面倒です。
本研究では,SPU-Net と呼ばれる自己監視型点群アップサンプリングネットワークを提案する。
本研究では,合成データと実データの両方について様々な実験を行い,最先端の教師付き手法と同等の性能が得られることを示す。
論文 参考訳(メタデータ) (2020-12-08T14:14:09Z) - Polygon-free: Unconstrained Scene Text Detection with Box Annotations [39.74109294551322]
本研究では,ポリゴンフリー(PF)と呼ばれる制約のないテキスト検出システムを提案する。
PFはアップライトなバウンディングボックスアノテーションでのみトレーニングされる。
実験では、PFが一般的な検出器を組み合わせることで驚くほど高品質なピクセルレベルの結果が得られることを示した。
論文 参考訳(メタデータ) (2020-11-26T14:19:33Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。