論文の概要: Panoramic Out-of-Distribution Segmentation
- arxiv url: http://arxiv.org/abs/2505.03539v1
- Date: Tue, 06 May 2025 13:51:26 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-05-07 18:50:11.406424
- Title: Panoramic Out-of-Distribution Segmentation
- Title(参考訳): パノラマ・アウト・オブ・ディストリビューション・セグメンテーション
- Authors: Mengfei Duan, Kailun Yang, Yuheng Zhang, Yihong Cao, Fei Teng, Kai Luo, Jiaming Zhang, Zhiyong Li, Shutao Li,
- Abstract要約: 我々は,パノラマのためのOoSを実現する新しいタスクであるパノラマアウト・オブ・ディストリビューション(PanOoS)を導入する。
POSはテキスト誘導の即時分布学習によりパノラマ画像の特徴に適応する。
AuPRCは34.25%向上し、FPR95は21.42%低下した。
- 参考スコア(独自算出の注目度): 28.962062029634584
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Panoramic imaging enables capturing 360{\deg} images with an ultra-wide Field-of-View (FoV) for dense omnidirectional perception. However, current panoramic semantic segmentation methods fail to identify outliers, and pinhole Out-of-distribution Segmentation (OoS) models perform unsatisfactorily in the panoramic domain due to background clutter and pixel distortions. To address these issues, we introduce a new task, Panoramic Out-of-distribution Segmentation (PanOoS), achieving OoS for panoramas. Furthermore, we propose the first solution, POS, which adapts to the characteristics of panoramic images through text-guided prompt distribution learning. Specifically, POS integrates a disentanglement strategy designed to materialize the cross-domain generalization capability of CLIP. The proposed Prompt-based Restoration Attention (PRA) optimizes semantic decoding by prompt guidance and self-adaptive correction, while Bilevel Prompt Distribution Learning (BPDL) refines the manifold of per-pixel mask embeddings via semantic prototype supervision. Besides, to compensate for the scarcity of PanOoS datasets, we establish two benchmarks: DenseOoS, which features diverse outliers in complex environments, and QuadOoS, captured by a quadruped robot with a panoramic annular lens system. Extensive experiments demonstrate superior performance of POS, with AuPRC improving by 34.25% and FPR95 decreasing by 21.42% on DenseOoS, outperforming state-of-the-art pinhole-OoS methods. Moreover, POS achieves leading closed-set segmentation capabilities. Code and datasets will be available at https://github.com/MengfeiD/PanOoS.
- Abstract(参考訳): パノラマイメージングは360{\deg}画像を超広視野(FoV)で捉え、全方位の高密度な知覚を可能にする。
しかし、現在のパノラマセマンティックセグメンテーション法ではアウトリーチを識別できず、背景のぼやけや画素歪みによりパノラマ領域ではピンホールのアウト・オブ・ディストリビューションセグメンテーション(OoS)モデルが不満足に機能する。
これらの課題に対処するため、我々はパノラマのためのOoSを実現するPanOoS(Panoramic Out-of-distriion Segmentation)という新しいタスクを導入する。
さらに,パノラマ画像の特徴に適応する第1のソリューションPOSを提案する。
具体的には、POSはCLIPのクロスドメインの一般化能力を実現するために設計された、絡み合った戦略を統合している。
提案した Prompt-based Restoration Attention (PRA) は,迅速なガイダンスと自己適応的修正によるセマンティックデコーディングを最適化する一方,Bilevel Prompt Distribution Learning (BPDL) は,セマンティックプロトタイプによる画素ごとのマスク埋め込みの多様体を改良する。
さらに、PanOoSデータセットの不足を補うために、複雑な環境でさまざまなアウトリーチを特徴とするDenseOoSと、パノラマ環状レンズシステムを備えた四脚ロボットによってキャプチャされたQuadOoSの2つのベンチマークを構築しました。
AuPRCは34.25%向上し、FPR95はDenseOoSでは21.42%低下し、最先端のPinhole-OoS法よりも優れた性能を示した。
さらにPOSは、主要なクローズドセットセグメンテーション機能を達成する。
コードとデータセットはhttps://github.com/MengfeiD/PanOoS.comで入手できる。
関連論文リスト
- Multi-source Domain Adaptation for Panoramic Semantic Segmentation [21.6293634368587]
パノラマセマンティックセグメンテーションの方法は、実際のパノラマ画像にセグメンテーションモデルを転送するために、実際のピンホール画像または低コストの合成パノラマ画像を利用する。
MSDA4PASSは、実際のピンホールと合成パノラマ画像の両方を用いて、ラベルのない実際のパノラマ画像のセグメンテーションを改善する。
MSDA4PASSは2つの主要コンポーネントから構成される: Unpaired Semantic Morphing (USM) と Distortion Gating Alignment (DGA) である。
論文 参考訳(メタデータ) (2024-08-29T12:00:11Z) - Towards Effective Image Manipulation Detection with Proposal Contrastive
Learning [61.5469708038966]
本稿では,効果的な画像操作検出のためのコントラスト学習(PCL)を提案する。
我々のPCLは、RGBとノイズビューから2種類のグローバル特徴を抽出し、2ストリームアーキテクチャで構成されている。
我々のPCLは、実際にラベル付けされていないデータに容易に適用でき、手作業によるラベル付けコストを削減し、より一般化可能な機能を促進することができる。
論文 参考訳(メタデータ) (2022-10-16T13:30:13Z) - Behind Every Domain There is a Shift: Adapting Distortion-aware Vision Transformers for Panoramic Semantic Segmentation [73.48323921632506]
パノラマ的セマンティックセマンティックセグメンテーションは2つの重要な課題により未探索である。
まず、変形性パッチ埋め込み(DPE)と変形性(DMLPv2)モジュールを備えたパノラマセマンティックトランス4PASS+を改良したトランスフォーマーを提案する。
第2に、教師なしドメイン適応パノラマセグメンテーションのための擬似ラベル修正により、Mutual Prototypeal Adaptation(MPA)戦略を強化する。
第3に、Pinhole-to-Panoramic(Pin2Pan)適応とは別に、9,080パノラマ画像を用いた新しいデータセット(SynPASS)を作成します。
論文 参考訳(メタデータ) (2022-07-25T00:42:38Z) - Panoramic Panoptic Segmentation: Insights Into Surrounding Parsing for
Mobile Agents via Unsupervised Contrastive Learning [93.6645991946674]
我々はパノラマパノラマパノプティクスのセグメンテーションを最も総合的なシーン理解として紹介する。
完全な周囲の理解は、移動エージェントに最大限の情報を提供する。
本稿では,標準的なピンホール画像のモデルトレーニングを可能にし,学習した特徴を別のドメインに転送するフレームワークを提案する。
論文 参考訳(メタデータ) (2022-06-21T20:07:15Z) - Bending Reality: Distortion-aware Transformers for Adapting to Panoramic
Semantic Segmentation [26.09267582056609]
大量の高価なピクセル単位のアノテーションは、堅牢なパノラマセグメンテーションモデルの成功に不可欠である。
360度パノラマにおける歪みと画像-特徴分布は、アノテーションに富んだピンホールドメインからの転写を阻害する。
変形性パッチ埋め込み(DPE)および変形性変形性(DMLP)コンポーネントにおける物体変形とパノラマ画像歪みを学習する。
最後に、マルチスケールのプロトタイプ機能を生成することにより、ピンホールとパノラマの特徴埋め込みで共有セマンティクスを結合する。
論文 参考訳(メタデータ) (2022-03-02T23:00:32Z) - Panoramic Panoptic Segmentation: Towards Complete Surrounding
Understanding via Unsupervised Contrastive Learning [97.37544023666833]
我々は,パノラマパオプティックセグメンテーションを最も総合的なシーン理解として導入する。
完全な周囲の理解は、エージェントに最大限の情報を提供する。
標準ピンホール画像のモデルトレーニングを可能にし、学習した機能を異なるドメインに転送するフレームワークを提案する。
論文 参考訳(メタデータ) (2021-03-01T09:37:27Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。