Fugu-MT 論文翻訳(概要): Structured prototype regularization for synthetic-to-real driving scene parsing

論文の概要: Structured prototype regularization for synthetic-to-real driving scene parsing

arxiv url: http://arxiv.org/abs/2603.16083v1
Date: Tue, 17 Mar 2026 03:05:28 GMT
ステータス: 翻訳完了
システム内更新日: 2026-03-18 17:42:07.081052
Title: Structured prototype regularization for synthetic-to-real driving scene parsing
Title（参考訳）: 合成から実走行シーン解析のための構造的プロトタイプ正規化
Authors: Jiahe Fan, Xiao Ma, Sergey Vityazev, George Giakos, Shaolong Shu, Rui Fan,
Abstract要約: 運転シーンのパーシングは、自動運転車が現実世界の交通環境で確実に運転することが重要である。コストのかかるピクセルレベルのアノテーションへの依存を減らすため、自動生成されたラベルを持つ合成データセットが一般的な選択肢となっている。合成データに基づいて訓練されたモデルは、合成から実際のドメインギャップのために現実世界のシーンに適用すると、しばしば性能が良くない。
参考スコア（独自算出の注目度）: 7.087302867255982
License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
Abstract: Driving scene parsing is critical for autonomous vehicles to operate reliably in complex real-world traffic environments. To reduce the reliance on costly pixel-level annotations, synthetic datasets with automatically generated labels have become a popular alternative. However, models trained on synthetic data often perform poorly when applied to real-world scenes due to the synthetic-to-real domain gap. Despite the success of unsupervised domain adaptation in narrowing this gap, most existing methods mainly focus on global feature alignment while overlooking the semantic structure of the feature space. As a result, semantic relations among classes are insufficiently modeled, limiting the model's ability to generalize. To address these challenges, this study introduces a novel unsupervised domain adaptation framework that explicitly regularizes semantic feature structures to significantly enhance driving scene parsing performance in real-world scenarios. Specifically, the proposed method enforces inter-class separation and intra-class compactness by leveraging class-specific prototypes, thereby enhancing the discriminability and structural coherence of feature clusters. An entropy-based noise filtering strategy improves the reliability of pseudo labels, while a pixel-level attention mechanism further refines feature alignment. Extensive experiments on representative benchmarks demonstrate that the proposed method consistently outperforms recent state-of-the-art methods. These results underscore the importance of preserving semantic structure for robust synthetic-to-real adaptation in driving scene parsing tasks.
Abstract（参考訳）: 運転シーンのパーシングは、自動運転車が複雑な現実世界の交通環境において確実に運転することが重要である。コストのかかるピクセルレベルのアノテーションへの依存を減らすため、自動生成されたラベルを持つ合成データセットが一般的な選択肢となっている。しかし、合成データに基づいて訓練されたモデルは、合成から実際のドメインギャップのために現実世界のシーンに適用すると、しばしば性能が良くない。このギャップを狭めるために、教師なしのドメイン適応が成功したにもかかわらず、既存の手法のほとんどは、特徴空間のセマンティック構造を見下ろしながら、大域的な特徴アライメントに焦点を当てている。その結果、クラス間の意味的関係は十分にモデル化されず、モデルの一般化能力が制限される。これらの課題に対処するため,本研究では,実世界のシナリオにおけるシーン解析性能を大幅に向上させるために,意味的特徴構造を明示的に正規化する,教師なしドメイン適応フレームワークを提案する。具体的には,クラス固有のプロトタイプを活用することにより,クラス間分離とクラス内コンパクト化を実現し,特徴クラスタの識別性と構造的コヒーレンスを向上させる。エントロピーに基づくノイズフィルタリング戦略により、擬似ラベルの信頼性が向上し、画素レベルのアテンション機構が機能アライメントをさらに改善する。代表的なベンチマーク実験により,提案手法が最近の最先端手法より一貫して優れていることが示された。これらの結果は,運転シーン解析作業におけるロバストな合成と現実の適応のための意味構造保存の重要性を浮き彫りにした。

関連論文リスト

StepVAR: Structure-Texture Guided Pruning for Visual Autoregressive Models [98.72926158261937]
本稿では,Visual AutoRegressive モデルのためのトレーニングフリートークン解析フレームワークを提案する。我々は局所的なテクスチャの詳細を捉えるために軽量なハイパスフィルタを使用し、グローバルな構造情報を保存するために主成分分析(PCA)を活用している。スパーストークンの下で有効な次世代の予測を維持するために,近接した特徴伝達戦略を導入する。
論文参考訳（メタデータ） (2026-03-02T11:35:05Z)
A Style-Based Profiling Framework for Quantifying the Synthetic-to-Real Gap in Autonomous Driving Datasets [9.788200709163064]
本稿では,合成データセットと実画像データセットの両方に基づくスタイルプロファイルを特徴付けるためのプロファイル抽出と発見フレームワークを提案する。本フレームワークは,グラム行列に基づくスタイル抽出と,クラス内コンパクト性とクラス間分離に最適化されたメトリック学習を組み合わせて,スタイル埋め込みを抽出する。
論文参考訳（メタデータ） (2025-10-11T13:09:41Z)
Feature-Space Planes Searcher: A Universal Domain Adaptation Framework for Interpretability and Computational Efficiency [7.889121135601528]
現在の教師なし領域適応法は微調整特徴抽出器に依存している。領域適応フレームワークとしてFPS(Feature-space Planes Searcher)を提案する。 FPSは最先端の手法と比較して,競争力や性能に優れることを示す。
論文参考訳（メタデータ） (2025-08-26T05:39:21Z)
Neural Network Reprogrammability: A Unified Theme on Model Reprogramming, Prompt Tuning, and Prompt Instruction [57.19302613163439]
モデル適応のための統一フレームワークとして,ニューラルネットワークの再プログラム可能性を導入する。本稿では,4つの重要な側面にまたがる情報操作アプローチを分類する分類法を提案する。残る技術的課題や倫理的考察も分析する。
論文参考訳（メタデータ） (2025-06-05T05:42:27Z)
StyDeSty: Min-Max Stylization and Destylization for Single Domain Generalization [85.18995948334592]
単一のドメインの一般化(単一DG)は、単一のトレーニングドメインからのみ見えないドメインに一般化可能な堅牢なモデルを学ぶことを目的としている。最先端のアプローチは、主に新しいデータを合成するために、敵対的な摂動やスタイルの強化といったデータ拡張に頼っている。データ拡張の過程で、ソースと擬似ドメインのアライメントを明示的に考慮したemphStyDeStyを提案する。
論文参考訳（メタデータ） (2024-06-01T02:41:34Z)
On the Real-World Adversarial Robustness of Real-Time Semantic Segmentation Models for Autonomous Driving [59.33715889581687]
現実世界の敵対的な例(通常はパッチの形で)の存在は、安全クリティカルなコンピュータビジョンタスクにおけるディープラーニングモデルの使用に深刻な脅威をもたらす。本稿では,異なる種類の対立パッチを攻撃した場合のセマンティックセグメンテーションモデルのロバスト性を評価する。画素の誤分類を誘導する攻撃者の能力を改善するために, 新たな損失関数を提案する。
論文参考訳（メタデータ） (2022-01-05T22:33:43Z)
Adapting Segmentation Networks to New Domains by Disentangling Latent Representations [14.050836886292869]
ドメイン適応アプローチは、ラベルを持つソースドメインから取得した知識を関連するラベルを持つターゲットドメインに転送する役割を担っている。本稿では,教師付きトレーニングと比較して適応戦略の相対的有効性を捉えるための新しい性能指標を提案する。
論文参考訳（メタデータ） (2021-08-06T09:43:07Z)
Content Disentanglement for Semantically Consistent Synthetic-to-RealDomain Adaptation in Urban Traffic Scenes [39.38387505091648]
合成データ生成は、自動運転における新しい交通シナリオを生成する魅力的なアプローチです。合成データだけで訓練されたディープラーニング技術は、実際のデータでテストされたときに劇的なパフォーマンス低下に遭遇します。本稿では,合成データと実データの間で意味的に一貫性のあるドメイン適応を実現する,教師なしのエンドツーエンドドメイン適応ネットワークアーキテクチャを提案する。
論文参考訳（メタデータ） (2021-05-18T17:42:26Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。