論文の概要: SAGE: Style-Adaptive Generalization for Privacy-Constrained Semantic Segmentation Across Domains
- arxiv url: http://arxiv.org/abs/2512.02369v1
- Date: Tue, 02 Dec 2025 03:20:22 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-12-03 21:04:45.703635
- Title: SAGE: Style-Adaptive Generalization for Privacy-Constrained Semantic Segmentation Across Domains
- Title(参考訳): SAGE: ドメイン間のプライバシ制約付きセマンティックセマンティックセグメンテーションのためのスタイル適応型一般化
- Authors: Qingmei Li, Yang Zhang, Peifeng Zhang, Haohuan Fu, Juepeng Zheng,
- Abstract要約: textbfSAGEは、プライバシー制約下での凍結モデルの一般化を改善する。
まず、ソースドメインの多様なスタイル表現を構築するためにスタイル転送を利用する。
そして、モデルが各入力の視覚的コンテキストに応じてこれらのスタイルキューを適応的に融合し、動的プロンプトを形成する。
- 参考スコア(独自算出の注目度): 13.393232074517387
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Domain generalization for semantic segmentation aims to mitigate the degradation in model performance caused by domain shifts. However, in many real-world scenarios, we are unable to access the model parameters and architectural details due to privacy concerns and security constraints. Traditional fine-tuning or adaptation is hindered, leading to the demand for input-level strategies that can enhance generalization without modifying model weights. To this end, we propose a \textbf{S}tyle-\textbf{A}daptive \textbf{GE}neralization framework (\textbf{SAGE}), which improves the generalization of frozen models under privacy constraints. SAGE learns to synthesize visual prompts that implicitly align feature distributions across styles instead of directly fine-tuning the backbone. Specifically, we first utilize style transfer to construct a diverse style representation of the source domain, thereby learning a set of style characteristics that can cover a wide range of visual features. Then, the model adaptively fuses these style cues according to the visual context of each input, forming a dynamic prompt that harmonizes the image appearance without touching the interior of the model. Through this closed-loop design, SAGE effectively bridges the gap between frozen model invariance and the diversity of unseen domains. Extensive experiments on five benchmark datasets demonstrate that SAGE achieves competitive or superior performance compared to state-of-the-art methods under privacy constraints and outperforms full fine-tuning baselines in all settings.
- Abstract(参考訳): セマンティックセグメンテーションのためのドメインの一般化は、ドメインシフトによるモデルパフォーマンスの劣化を軽減することを目的としている。
しかし、多くの現実のシナリオでは、プライバシの懸念やセキュリティ上の制約のため、モデルパラメータやアーキテクチャの詳細にアクセスできません。
従来の微調整や適応は妨げられ、モデルウェイトを変更することなく一般化を向上できる入力レベルの戦略が要求される。
この目的のために,プライバシ制約下での凍結モデルの一般化を改善するために,<textbf{S}tyle-\textbf{A}daptive \textbf{GE}neralization framework (\textbf{SAGE})を提案する。
SAGEは、バックボーンを直接微調整する代わりに、スタイル間で機能分布を暗黙的に調整する視覚的なプロンプトを合成することを学ぶ。
具体的には、まず、スタイル転送を利用してソースドメインの多様なスタイル表現を構築し、それによって、幅広い視覚的特徴をカバーできるスタイル特性のセットを学習する。
そして、モデルが各入力の視覚的コンテキストに応じてこれらのスタイルキューを適応的に融合させ、モデルの内部に触れることなく画像の外観を調和させる動的なプロンプトを形成する。
この閉ループ設計を通じて、SAGEは凍結モデル不変性と目に見えない領域の多様性の間のギャップを効果的に橋渡しする。
5つのベンチマークデータセットに対する大規模な実験により、SAGEは、プライバシー制約下での最先端のメソッドと比較して、競争力や優れたパフォーマンスを達成し、すべての設定で完全な微調整ベースラインを上回ります。
関連論文リスト
- Dynamic Classifier-Free Diffusion Guidance via Online Feedback [53.54876309092376]
ワンサイズオール"アプローチは、異なるプロンプトの多様な要件に適応できない。
動的CFGスケジューリングのためのフレームワークを提案する。
我々は,小型モデルと最先端のImagen 3におけるアプローチの有効性を実証する。
論文 参考訳(メタデータ) (2025-09-19T16:27:19Z) - ICAS: IP Adapter and ControlNet-based Attention Structure for Multi-Subject Style Transfer Optimization [0.0]
ICASは効率的かつ制御可能なマルチオブジェクトスタイル転送のための新しいフレームワークである。
我々のフレームワークは、正確な局所的なスタイル合成とともに、忠実なグローバルなレイアウト維持を保証します。
ICASは、構造保存、スタイル整合性、推論効率において優れた性能を発揮する。
論文 参考訳(メタデータ) (2025-04-17T10:48:11Z) - Casual Inference via Style Bias Deconfounding for Domain Generalization [28.866189619091227]
本稿では, 因果推論に基づく新しいフレームワークであるStyle Deconfounding Causal Learningを紹介する。
提案手法は、ドメイン一般化問題に適した構造因果モデル(SCM)の構築から始まり、スタイルの影響を考慮に入れたバックドア調整戦略を適用する。
この基礎の上に構築したSGEM(style-guided Expert Module)は,トレーニング中のスタイル分布を適応的にクラスタリングし,グローバルなコンバウンディングスタイルをキャプチャする。
バックドア因果学習モジュール(BDCL)は特徴抽出中に因果介入を行い、グローバルな共起スタイルをサンプル予測に適切に統合し、スタイルバイアスを効果的に低減する。
論文 参考訳(メタデータ) (2025-03-21T04:52:31Z) - Style-Pro: Style-Guided Prompt Learning for Generalizable Vision-Language Models [5.492174268132387]
Style-Proは、CLIPのゼロショット一般化能力を緩和し、保存する新しいプロンプト学習フレームワークである。
Style-Proは、ベース・ツー・ニューの一般化、クロス・データセットの転送、ドメインの一般化など、さまざまな設定における最先端のメソッドを一貫して上回っている。
論文 参考訳(メタデータ) (2024-11-25T00:20:53Z) - Language Guided Domain Generalized Medical Image Segmentation [68.93124785575739]
単一ソースドメインの一般化は、より信頼性が高く一貫性のあるイメージセグメンテーションを現実の臨床環境にわたって約束する。
本稿では,テキストエンコーダ機能によって案内されるコントラスト学習機構を組み込むことで,テキスト情報を明確に活用する手法を提案する。
文献における既存手法に対して,本手法は良好な性能を発揮する。
論文 参考訳(メタデータ) (2024-04-01T17:48:15Z) - Direct Consistency Optimization for Robust Customization of Text-to-Image Diffusion Models [67.68871360210208]
テキスト・ツー・イメージ(T2I)拡散モデルは、いくつかの個人画像に微調整された場合、高い一貫性で視覚を生成することができる。
本稿では,微調整モデルと事前学習モデルとの偏差を制御し,直接整合性最適化(Direct Consistency Optimization)と呼ばれる新たな微調整対象を提案する。
提案手法は, 通常の微調整モデルとのマージに最適化したモデルよりも, 高速な忠実度と主観的忠実度が得られることを示す。
論文 参考訳(メタデータ) (2024-02-19T09:52:41Z) - HCVP: Leveraging Hierarchical Contrastive Visual Prompt for Domain
Generalization [69.33162366130887]
ドメイン一般化(DG)は、不変の機能を学ぶことによって、目に見えないシナリオに優れた機械学習モデルを作成するための取り組みである。
モデルにドメインレベルとタスク固有の特性を補足する新しい手法を提案する。
このアプローチは、特定の特徴から不変な特徴をより効果的に分離し、一般化を促進することを目的としている。
論文 参考訳(メタデータ) (2024-01-18T04:23:21Z) - TeG-DG: Textually Guided Domain Generalization for Face Anti-Spoofing [8.830873674673828]
既存の方法は、様々な訓練領域からドメイン不変の特徴を抽出することを目的としている。
抽出された特徴は、必然的に残差スタイルの特徴バイアスを含んでおり、その結果、一般化性能が劣る。
本稿では,テキスト情報をドメイン間アライメントに有効活用するテキストガイド型ドメイン一般化フレームワークを提案する。
論文 参考訳(メタデータ) (2023-11-30T10:13:46Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。