論文の概要: Denoise and Align: Towards Source-Free UDA for Robust Panoramic Semantic Segmentation
- arxiv url: http://arxiv.org/abs/2603.25131v1
- Date: Thu, 26 Mar 2026 07:54:43 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-03-27 20:52:48.165879
- Title: Denoise and Align: Towards Source-Free UDA for Robust Panoramic Semantic Segmentation
- Title(参考訳): Denoise and Align:ロバストパノラマセマンティックセマンティックセグメンテーションのためのソースフリーUDAを目指して
- Authors: Yaowen Chang, Zhen Cao, Xu Zheng, Xiaoxin Mi, Zhen Dong,
- Abstract要約: パノラマセマンティックセマンティックセグメンテーションは、自動運転やバーチャルリアリティーといった重要な応用における360度シーン理解の鍵となる。
2つの主要な課題は、パノラマ射影に固有の厳密な幾何学的歪みと、密接なアノテーションの禁止コストである。
DAPASSは、ソースデータなしで知識を堅牢に伝達するフレームワークである。
- 参考スコア(独自算出の注目度): 15.894184339483658
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Panoramic semantic segmentation is pivotal for comprehensive 360° scene understanding in critical applications like autonomous driving and virtual reality. However, progress in this domain is constrained by two key challenges: the severe geometric distortions inherent in panoramic projections and the prohibitive cost of dense annotation. While Unsupervised Domain Adaptation (UDA) from label-rich pinhole-camera datasets offers a viable alternative, many real-world tasks impose a stricter source-free (SFUDA) constraint where source data is inaccessible for privacy or proprietary reasons. This constraint significantly amplifies the core problems of domain shift, leading to unreliable pseudo-labels and dramatic performance degradation, particularly for minority classes. To overcome these limitations, we propose the DAPASS framework. DAPASS introduces two synergistic modules to robustly transfer knowledge without source data. First, our Panoramic Confidence-Guided Denoising (PCGD) module generates high-fidelity, class-balanced pseudo-labels by enforcing perturbation consistency and incorporating neighborhood-level confidence to filter noise. Second, a Contextual Resolution Adversarial Module (CRAM) explicitly addresses scale variance and distortion by adversarially aligning fine-grained details from high-resolution crops with global semantics from low-resolution contexts. DAPASS achieves state-of-the-art performances on outdoor (Cityscapes-to-DensePASS) and indoor (Stanford2D3D) benchmarks, yielding 55.04% (+2.05%) and 70.38% (+1.54%) mIoU, respectively.
- Abstract(参考訳): パノラマセマンティックセマンティックセグメンテーションは、自律運転やバーチャルリアリティーといった重要なアプリケーションにおいて、360度の総合的なシーン理解のために重要である。
しかし、この領域の進行は、パノラマ射影に固有の厳密な幾何学的歪みと、密接なアノテーションの禁止コストの2つの主要な課題によって制限されている。
ラベルに富んだピンホールカメラデータセットからのUnsupervised Domain Adaptation (UDA)は、実行可能な代替手段を提供するが、多くの現実世界のタスクは、プライバシやプロプライエタリな理由からソースデータがアクセスできないような、厳格なソースフリー(SFUDA)制約を課している。
この制約はドメインシフトのコア問題を大幅に増幅し、特にマイノリティクラスにおいて、信頼性の低い擬似ラベルと劇的なパフォーマンス低下をもたらす。
これらの制限を克服するため,DAPASSフレームワークを提案する。
DAPASSは2つの相乗的モジュールを導入し、ソースデータなしで知識を堅牢に伝達する。
第一に、我々のパノラマ信頼誘導デノイング(PCGD)モジュールは、摂動一貫性を強制し、近傍レベルの信頼度をフィルターノイズに組み込むことで、高忠実でクラスバランスの擬似ラベルを生成する。
第二に、CRAM(Contextual Resolution Adversarial Module)は、高解像度の作物の微細な詳細と低解像度の文脈からのグローバルな意味を逆向きに整合させることにより、スケールのばらつきと歪みに明示的に対処する。
DAPASSは、屋外(Cityscapes-to-DensePASS)と屋内(Stanford2D3D)のベンチマークで最先端のパフォーマンスを達成し、それぞれ55.04%(+2.05%)と70.38%(+1.54%)のmIoUを得た。
関連論文リスト
- Do We Need Perfect Data? Leveraging Noise for Domain Generalized Segmentation [20.89655949578527]
本稿では,この制限を頑健な学習機会に変換するフレームワークFLEX-Segを提案する。
5つの実世界のデータセットに対する実験は、最先端の手法よりも一貫した改善を示している。
その結果、不完全な合成データを扱うための適応的戦略が、ドメインの一般化に優れた結果をもたらすことが検証された。
論文 参考訳(メタデータ) (2025-11-28T07:46:32Z) - EReLiFM: Evidential Reliability-Aware Residual Flow Meta-Learning for Open-Set Domain Generalization under Noisy Labels [85.78886153628663]
Open-Set Domain Generalizationは、ディープラーニングモデルが新しいドメインで目に見えないカテゴリを認識できるようにすることを目的としている。
ラベルノイズは、ソースドメインの知識を損なうことによって、オープンセットドメインの一般化を妨げる。
本稿では,ドメインギャップを埋めるために,Evidential Reliability-Aware Residual Flow Meta-Learning (EReLiFM)を提案する。
論文 参考訳(メタデータ) (2025-10-14T16:23:11Z) - Exploring Single Domain Generalization of LiDAR-based Semantic Segmentation under Imperfect Labels [28.96799571666756]
雑音ラベル(DGLSS-NL)に基づくLiDARのための新しいタスク領域一般化について紹介する。
既存の雑音ラベル学習アプローチは,LiDARデータに適合しないことがわかった。
特徴レベルの一貫性を強制し、予測の信頼度を考慮したフィルタリングに基づくクロスエントロピー損失を適用した、強い分岐と弱い分岐を持つデュアルビューフレームワークであるDuNeを提案する。
論文 参考訳(メタデータ) (2025-10-10T06:11:34Z) - Overlap-Aware Feature Learning for Robust Unsupervised Domain Adaptation for 3D Semantic Segmentation [9.578322021478426]
3Dポイントクラウドセマンティックセグメンテーション(PCSS)は、ロボットシステムと自律運転における環境認識の基礎である。
既存の方法は、現実の摂動(例えば、雪、霧、雨)と敵の歪みに固有の脆弱性を批判的に見落としている。
この研究は、まず、現在のPCSS-UDAロバスト性を損なう2つの本質的な制限を特定する。
1) 強靭性指標による敵攻撃・破壊タイプに対するレジリエンスを定量化する頑健性評価モデル,2) 注意誘導重複抑制による識別構造を維持しつつ,双方向のドメインマッピングを可能にする非可逆的注意アライメントモジュール(IAAM) とからなる三部構成のフレームワークを提案する。
論文 参考訳(メタデータ) (2025-04-02T12:16:23Z) - Stable Neighbor Denoising for Source-free Domain Adaptive Segmentation [91.83820250747935]
擬似ラベルノイズは主に不安定なサンプルに含まれており、ほとんどのピクセルの予測は自己学習中に大きく変化する。
我々は, 安定・不安定な試料を効果的に発見する, SND(Stable Neighbor Denoising)アプローチを導入する。
SNDは、様々なSFUDAセマンティックセグメンテーション設定における最先端メソッドよりも一貫して優れている。
論文 参考訳(メタデータ) (2024-06-10T21:44:52Z) - Progressive Feature Self-reinforcement for Weakly Supervised Semantic
Segmentation [55.69128107473125]
Weakly Supervised Semantic (WSSS) のイメージレベルラベルを用いたシングルステージアプローチを提案する。
我々は、画像内容が決定論的領域(例えば、自信ある前景と背景)と不確実領域(例えば、オブジェクト境界と誤分類されたカテゴリ)に適応的に分割して、別々の処理を行う。
そこで我々は,これらの自信のある領域と同一のクラスラベルを持つ拡張画像とのセマンティック一貫性を制約する補完的な自己強調手法を提案する。
論文 参考訳(メタデータ) (2023-12-14T13:21:52Z) - Unsupervised Adaptation of Polyp Segmentation Models via Coarse-to-Fine
Self-Supervision [16.027843524655516]
本稿では,アノテートされたソースデータへの依存を解消する,ソースフリードメイン適応(Source-Free Domain Adaptation, SFDA)の実践的問題について検討する。
現在のSFDA法は、ソーストレーニングされたモデルからドメイン知識を抽出することに重点を置いているが、対象ドメインの本質的な構造を無視している。
本稿では,領域レベルと画素レベルの識別表現を粗大な自己超越によって学習する,領域間適応ネットワーク(RPANet)と呼ばれる新しいSFDAフレームワークを提案する。
論文 参考訳(メタデータ) (2023-08-13T02:37:08Z) - Uncertainty-Aware Source-Free Adaptive Image Super-Resolution with Wavelet Augmentation Transformer [60.31021888394358]
Unsupervised Domain Adaptation (UDA)は、現実世界の超解像(SR)における領域ギャップ問題に効果的に対処できる
本稿では,画像SR(SODA-SR)のためのSOurce-free Domain Adaptationフレームワークを提案する。
論文 参考訳(メタデータ) (2023-03-31T03:14:44Z) - Divide and Contrast: Source-free Domain Adaptation via Adaptive
Contrastive Learning [122.62311703151215]
Divide and Contrast (DaC) は、それぞれの制限を回避しつつ、両方の世界の善良な端を接続することを目的としている。
DaCは、ターゲットデータをソースライクなサンプルとターゲット固有なサンプルに分割する。
さらに、ソースライクなドメインと、メモリバンクベースの最大平均離散性(MMD)損失を用いて、ターゲット固有のサンプルとを整合させて、分散ミスマッチを低減する。
論文 参考訳(メタデータ) (2022-11-12T09:21:49Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。