論文の概要: Towards Instance Segmentation with Polygon Detection Transformers
- arxiv url: http://arxiv.org/abs/2603.09245v1
- Date: Tue, 10 Mar 2026 06:18:33 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-03-11 15:25:24.096921
- Title: Towards Instance Segmentation with Polygon Detection Transformers
- Title(参考訳): ポリゴン検出変換器を用いたインスタンス分割に向けて
- Authors: Jiacheng Sun, Jiaqi Lin, Wenlong Hu, Haoyang Li, Xinghong Zhou, Chenghai Mao, Yan Peng, Xiaomao Li,
- Abstract要約: 本稿では,ポリゴン検出変換器(Poly-DETR)を提案する。
検出変換器におけるボックス・トゥ・ポリゴン参照シフトを考慮し、極変形性注意と位置認識訓練方式を提案する。
最先端の極性法と比較すると、Poly-DETRはMS COCOテストデブで4.7mAPの改善を実現している。
- 参考スコア(独自算出の注目度): 22.568845137284978
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: One of the bottlenecks for instance segmentation today lies in the conflicting requirements of high-resolution inputs and lightweight, real-time inference. To address this bottleneck, we present a Polygon Detection Transformer (Poly-DETR) to reformulate instance segmentation as sparse vertex regression via Polar Representation, thereby eliminating the reliance on dense pixel-wise mask prediction. Considering the box-to-polygon reference shift in Detection Transformers, we propose Polar Deformable Attention and Position-Aware Training Scheme to dynamically update supervision and focus attention on boundary cues. Compared with state-of-the-art polar-based methods, Poly-DETR achieves a 4.7 mAP improvement on MS COCO test-dev. Moreover, we construct a parallel mask-based counterpart to support a systematic comparison between polar and mask representations. Experimental results show that Poly-DETR is more lightweight in high-resolution scenarios, reducing memory consumption by almost half on Cityscapes dataset. Notably, on PanNuke (cell segmentation) and SpaceNet (building footprints) datasets, Poly-DETR surpasses its mask-based counterpart on all metrics, which validates its advantage on regular-shaped instances in domain-specific settings.
- Abstract(参考訳): 今日の例のセグメンテーションのボトルネックの1つは、高解像度入力と軽量でリアルタイムな推論の相反する要件にある。
このボトルネックに対処するため,Polygon Detection Transformer (Poly-DETR) を提案する。
検出変圧器のボックス・ツー・ポリゴン基準シフトを考慮し, 監視を動的に更新し, 境界点に注意を集中する極変形性注意・位置認識訓練方式を提案する。
最先端の極性法と比較すると、Poly-DETRはMS COCOテストデブで4.7mAPの改善を実現している。
さらに、ポーラ表現とマスク表現の体系的な比較を支援するために、パラレルマスクベースのコンパニオンを構築した。
実験の結果,Poly-DETRは高解像度シナリオではより軽量であり,Cityscapesデータセットではメモリ消費量がほぼ半分削減されていることがわかった。
特に、PanNuke(セルセグメンテーション)とSpaceNet(ビルドフットプリント)データセットでは、Poly-DETRはすべてのメトリクスでマスクベースのデータセットを上回り、ドメイン固有の設定で通常の形のインスタンスに有利であることを検証している。
関連論文リスト
- Global Collinearity-aware Polygonizer for Polygonal Building Mapping in Remote Sensing [18.151134198549574]
本稿では,リモートセンシング画像から多角形建物をマッピングするという課題に対処する。
これは新しいアルゴリズム、Global Collinearity-aware Polygonizer (GCP)を導入した。
論文 参考訳(メタデータ) (2025-05-02T16:49:07Z) - Boosting Cross-Domain Point Classification via Distilling Relational Priors from 2D Transformers [59.0181939916084]
従来の3Dネットワークは主に局所幾何学的詳細に焦点を当て、局所幾何学間の位相構造を無視する。
そこで本稿では,大規模画像上においてよく訓練されたトランスフォーマーから前駆体を抽出する,新しい先駆体蒸留法を提案する。
PointDA-10とSim-to-Realデータセットの実験は、提案手法が点クラウド分類におけるUDAの最先端性能を一貫して達成していることを検証する。
論文 参考訳(メタデータ) (2024-07-26T06:29:09Z) - DPPD: Deformable Polar Polygon Object Detection [3.9236649268347765]
我々は,ポリゴン形状の物体を検出するための新しい変形可能な極ポリゴン物体検出法(DPPD)を開発した。
DPPDは、自律運転のための様々な物体検出タスクで成功している。
論文 参考訳(メタデータ) (2023-04-05T06:43:41Z) - PolyFormer: Referring Image Segmentation as Sequential Polygon
Generation [20.55281741205142]
画素レベルのセグメンテーションマスクを直接予測する代わりに、画像セグメンテーションを参照する問題はシーケンシャルポリゴン生成として定式化される。
これは新しいシーケンス・ツー・シーケンス・フレームワークであるPolygon Transformer(PolyFormer)によって実現されている。
より正確な幾何学的位置決めを行うために,正確な浮動小数点座標を直接予測する回帰型デコーダを提案する。
論文 参考訳(メタデータ) (2023-02-14T23:00:25Z) - Lesion-aware Dynamic Kernel for Polyp Segmentation [49.63274623103663]
ポリープセグメンテーションのための障害対応動的ネットワーク(LDNet)を提案する。
従来のU字型エンコーダ・デコーダ構造であり、動的カーネル生成と更新スキームが組み込まれている。
この単純だが効果的なスキームは、我々のモデルに強力なセグメンテーション性能と一般化能力を与える。
論文 参考訳(メタデータ) (2023-01-12T09:53:57Z) - Polyp-PVT: Polyp Segmentation with Pyramid Vision Transformers [124.01928050651466]
本稿では,Polyp-PVTと呼ばれる新しいタイプのPolypセグメンテーション手法を提案する。
提案モデルであるPolyp-PVTは,特徴の雑音を効果的に抑制し,その表現能力を大幅に向上させる。
論文 参考訳(メタデータ) (2021-08-16T07:09:06Z) - PolarMask++: Enhanced Polar Representation for Single-Shot Instance
Segmentation and Beyond [47.518550130850755]
PolarMaskは、極座標内のオブジェクトの輪郭を予測するものとしてインスタンス分割問題を再構成する。
2つのモジュールは慎重に設計されている。
サンプル良質の中心の例への柔らかい極の中心および極性IoUの損失)。
PolarMaskは完全に畳み込み型であり、ほとんどのオフザシェルフ検出方法に簡単に組み込むことができる。
論文 参考訳(メタデータ) (2021-05-05T16:55:53Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。