論文の概要: Mitigating Spurious Correlations in Weakly Supervised Semantic Segmentation via Cross-architecture Consistency Regularization
- arxiv url: http://arxiv.org/abs/2507.21959v1
- Date: Tue, 29 Jul 2025 16:09:15 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-07-30 17:08:56.653531
- Title: Mitigating Spurious Correlations in Weakly Supervised Semantic Segmentation via Cross-architecture Consistency Regularization
- Title(参考訳): クロスアーキテクチャ整合性規則化による弱監視セマンティックセマンティックセマンティックセマンティックセマンティックスにおけるスパーラス相関の緩和
- Authors: Zheyuan Zhang, Yen-chia Hsu,
- Abstract要約: 弱い教師付きセマンティックセグメンテーション (WSSS) が有望なアプローチとして登場した。
本稿では,外部監視に頼ることなく,共起問題を直接対象とする新しいWSSSフレームワークを提案する。
内部表現を整合させることでアーキテクチャ間の整合性を実現する知識伝達損失を導入する。
- 参考スコア(独自算出の注目度): 2.6954348706500766
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Scarcity of pixel-level labels is a significant challenge in practical scenarios. In specific domains like industrial smoke, acquiring such detailed annotations is particularly difficult and often requires expert knowledge. To alleviate this, weakly supervised semantic segmentation (WSSS) has emerged as a promising approach. However, due to the supervision gap and inherent bias in models trained with only image level labels, existing WSSS methods suffer from limitations such as incomplete foreground coverage, inaccurate object boundaries, and spurious correlations, especially in our domain, where emissions are always spatially coupled with chimneys. Previous solutions typically rely on additional priors or external knowledge to mitigate these issues, but they often lack scalability and fail to address the model's inherent bias toward co-occurring context. To address this, we propose a novel WSSS framework that directly targets the co-occurrence problem without relying on external supervision. Unlike prior methods that adopt a single network, we employ a teacher-student framework that combines CNNs and ViTs. We introduce a knowledge transfer loss that enforces cross-architecture consistency by aligning internal representations. Additionally, we incorporate post-processing techniques to address partial coverage and further improve pseudo mask quality.
- Abstract(参考訳): ピクセルレベルのラベルの共有は、現実的なシナリオにおいて重要な課題である。
工業煙のような特定の領域では、このような詳細なアノテーションの取得は特に困難であり、専門家の知識を必要とすることが多い。
これを軽減するために、弱い教師付きセマンティックセグメンテーション(WSSS)が有望なアプローチとして登場した。
しかし,画像レベルのラベルのみをトレーニングしたモデルでは,監督のギャップや固有のバイアスのため,既存のWSSS法では,不完全な前景被覆,不正確なオブジェクト境界,特に我々の領域では,放射が常に煙突と空間的に結合している。
従来のソリューションは通常、これらの問題を緩和するために追加の事前知識や外部知識に依存していますが、スケーラビリティが欠如し、共起コンテキストに対するモデル固有のバイアスに対処できません。
そこで本稿では, 外部監視に頼ることなく, 共起問題を直接対象とする新しいWSSSフレームワークを提案する。
1つのネットワークを採用する従来の方法とは異なり、我々はCNNとViTを組み合わせた教師学習フレームワークを採用している。
内部表現を整合させることでアーキテクチャ間の整合性を実現する知識伝達損失を導入する。
さらに、部分的カバレッジに対処し、偽マスキングの品質をさらに改善するために、ポストプロセッシング手法を取り入れた。
関連論文リスト
- Why Is Spatial Reasoning Hard for VLMs? An Attention Mechanism Perspective on Focus Areas [52.478956204238315]
機械的解釈可能性のレンズによる空間的推論の課題について検討する。
空間的推論の成功は、実際の物体の位置と注意を一致させるモデルの能力と強く相関している。
本研究の目的は,ADAPTVISを用いて,信頼性の高い地域への注意を喚起することである。
論文 参考訳(メタデータ) (2025-03-03T17:57:03Z) - Efficiently Assemble Normalization Layers and Regularization for Federated Domain Generalization [1.1534313664323637]
ドメインシフト(Domain shift)は、マシンラーニングにおいて、目に見えないドメインでテストした場合に、モデルのパフォーマンス低下に悩まされるという深刻な問題である。
FedDGは、プライバシー保護の方法で協調的なクライアントを使用してグローバルモデルをトレーニングしようと試みている。
本稿では, 誘導正規化方式に依存するFedDGの新しいアーキテクチャ手法,すなわちgPerXANを紹介する。
論文 参考訳(メタデータ) (2024-03-22T20:22:08Z) - Progressive Feature Self-reinforcement for Weakly Supervised Semantic
Segmentation [55.69128107473125]
Weakly Supervised Semantic (WSSS) のイメージレベルラベルを用いたシングルステージアプローチを提案する。
我々は、画像内容が決定論的領域(例えば、自信ある前景と背景)と不確実領域(例えば、オブジェクト境界と誤分類されたカテゴリ)に適応的に分割して、別々の処理を行う。
そこで我々は,これらの自信のある領域と同一のクラスラベルを持つ拡張画像とのセマンティック一貫性を制約する補完的な自己強調手法を提案する。
論文 参考訳(メタデータ) (2023-12-14T13:21:52Z) - Mapping conditional distributions for domain adaptation under
generalized target shift [0.0]
我々は、条件シフトとラベルシフト(GeTarS)の下でのソースとターゲットドメイン間の教師なしドメイン適応(UDA)の問題を考える。
最近のアプローチでは、ドメイン不変表現を学習するが、実際的な制限があり、実際には成り立たない強い仮定に依存している。
本稿では,既存の欠点を回避した,事前訓練された表現の整合化のための,新規で汎用的なアプローチについて検討する。
論文 参考訳(メタデータ) (2021-10-26T14:25:07Z) - Collaborative Semantic Aggregation and Calibration for Federated Domain
Generalization [28.573872986524794]
DGは、未知のターゲットドメインに適切に一般化できるモデルとして、複数の既知のソースドメインから学習することを目的としている。
本稿では、ソースデータセットをローカルにしかアクセスできないフェデレーションドメイン一般化の問題に取り組む。
データフリーなセマンティックアグリゲーションは、分離されたドメイン層でトレーニングされたモデルを層ごとに融合することで実現します。
論文 参考訳(メタデータ) (2021-10-13T14:08:29Z) - Semantic Correspondence with Transformers [68.37049687360705]
本稿では,変換器を用いたコストアグリゲーション(CAT)を提案し,意味論的に類似した画像間の密接な対応を見出す。
初期相関マップと多レベルアグリゲーションを曖昧にするための外観親和性モデリングを含む。
提案手法の有効性を示す実験を行い,広範囲にわたるアブレーション研究を行った。
論文 参考訳(メタデータ) (2021-06-04T14:39:03Z) - Causal Intervention for Weakly-Supervised Semantic Segmentation [122.1846968696862]
画像レベルのラベルのみを用いて、より優れたピクセルレベルの擬似マスクを生成することを目指している。
画像,コンテキスト,およびクラスラベル間の因果関係を分析するための構造因果モデルを提案する。
そこで本研究では,画像レベルの分類において,矛盾するバイアスを取り除くためのコンテキスト調整(CONTA)手法を提案する。
論文 参考訳(メタデータ) (2020-09-26T09:26:29Z) - Uncertainty-Aware Consistency Regularization for Cross-Domain Semantic
Segmentation [63.75774438196315]
Unsupervised Domain adapt (UDA) は、未ラベルのデータのみを持つ新しいターゲットドメインにソースドメインの既存のモデルを適用することを目的としている。
既存のほとんどの手法は、エラーを起こしやすい識別器ネットワークまたは不合理な教師モデルから生じる顕著な負の伝達に悩まされている。
ドメイン間セマンティックセグメンテーションのための不確実性を考慮した整合性正規化手法を提案する。
論文 参考訳(メタデータ) (2020-04-19T15:30:26Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。