論文の概要: Dual form Complementary Masking for Domain-Adaptive Image Segmentation
- arxiv url: http://arxiv.org/abs/2507.12008v1
- Date: Wed, 16 Jul 2025 08:05:22 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-07-17 19:00:11.293931
- Title: Dual form Complementary Masking for Domain-Adaptive Image Segmentation
- Title(参考訳): ドメイン適応画像分割のためのデュアルフォーム補完型マスキング
- Authors: Jiawen Wang, Yinda Chen, Xiaoyu Liu, Che Liu, Dong Liu, Jianqing Gao, Zhiwei Xiong,
- Abstract要約: マスク付き再構築を直接メイントレーニングパイプラインに統合するフレームワークであるMaskTwinsを提案する。
MaskTwinsは、補完的な方法で隠蔽された画像の予測間の一貫性を強制することによって、異なるドメイン間で持続する固有の構造パターンを明らかにする。
これらの結果は、個別の事前学習を必要とせず、ドメイン不変な特徴を抽出する上で、MaskTwinsの重大な利点を示している。
- 参考スコア(独自算出の注目度): 44.81357028765057
- License: http://creativecommons.org/licenses/by-nc-nd/4.0/
- Abstract: Recent works have correlated Masked Image Modeling (MIM) with consistency regularization in Unsupervised Domain Adaptation (UDA). However, they merely treat masking as a special form of deformation on the input images and neglect the theoretical analysis, which leads to a superficial understanding of masked reconstruction and insufficient exploitation of its potential in enhancing feature extraction and representation learning. In this paper, we reframe masked reconstruction as a sparse signal reconstruction problem and theoretically prove that the dual form of complementary masks possesses superior capabilities in extracting domain-agnostic image features. Based on this compelling insight, we propose MaskTwins, a simple yet effective UDA framework that integrates masked reconstruction directly into the main training pipeline. MaskTwins uncovers intrinsic structural patterns that persist across disparate domains by enforcing consistency between predictions of images masked in complementary ways, enabling domain generalization in an end-to-end manner. Extensive experiments verify the superiority of MaskTwins over baseline methods in natural and biological image segmentation. These results demonstrate the significant advantages of MaskTwins in extracting domain-invariant features without the need for separate pre-training, offering a new paradigm for domain-adaptive segmentation.
- Abstract(参考訳): 最近の研究は、Unsupervised Domain Adaptation (UDA)におけるMasked Image Modeling (MIM)と整合性正規化とを関連付けている。
しかし、単にマスクを入力画像上の特別な変形形式として扱うだけで、理論的解析を怠り、仮面再構築の表面的理解と、特徴抽出と表現学習の強化におけるその可能性の活用が不十分である。
本稿では,マスマスクの再構成をスパース信号再構成問題として再編成し,補完マスクの二重形状がドメインに依存しない画像の特徴を抽出する優れた能力を有することを理論的に証明する。
この説得力のある洞察に基づいて、マスクされた再構築を直接メインのトレーニングパイプラインに統合する、シンプルだが効果的なUDAフレームワークであるMaskTwinsを提案する。
MaskTwinsは、補完的な方法で隠蔽された画像の予測間の一貫性を強制することにより、異なるドメイン間で持続する固有の構造パターンを明らかにする。
自然および生物学的画像分割におけるベースライン法よりもMaskTwinsの方が優れていることを検証する実験が盛んである。
これらの結果は、ドメイン適応セグメンテーションの新しいパラダイムを提供するために、個別の事前トレーニングを必要とせずにドメイン不変の機能を抽出する上で、MaskTwinsの重大な利点を示している。
関連論文リスト
- AdvMIM: Adversarial Masked Image Modeling for Semi-Supervised Medical Image Segmentation [27.35164449801058]
Vision Transformerは最近、医療画像のセグメンテーションタスクで大きな人気を集めている。
Transformerは大量のラベル付きデータを有効にする必要がある。
変圧器を用いた半教師あり学習における鍵となる課題は、十分な監督信号の欠如にある。
論文 参考訳(メタデータ) (2025-06-25T16:00:18Z) - Masked Image Modeling Boosting Semi-Supervised Semantic Segmentation [38.55611683982936]
クラスごとに異なる画像領域を独立に再構成する新しいクラスワイド・マスク画像モデリングを提案する。
我々は,同一クラス内のマスキングと可視部分に対応する特徴間の距離を最小化する特徴集約戦略を開発する。
セマンティック空間において、正規化を強化するマスク付き画像モデリングの適用について検討する。
論文 参考訳(メタデータ) (2024-11-13T16:42:07Z) - LADMIM: Logical Anomaly Detection with Masked Image Modeling in Discrete Latent Space [0.0]
マスク付き画像モデリングは、画像中のマスキング領域の特徴表現を予測する自己教師付き学習技術である。
本稿では,MIMの特性を利用して論理異常を効果的に検出する手法を提案する。
提案手法をMVTecLOCOデータセット上で評価し,平均AUC 0.867。
論文 参考訳(メタデータ) (2024-10-14T07:50:56Z) - A Simple Latent Diffusion Approach for Panoptic Segmentation and Mask Inpainting [2.7563282688229664]
この研究は安定拡散の上に構築され、汎視的セグメンテーションに対する潜時拡散アプローチを提案する。
トレーニングは,(1)部分分割マスクを潜伏空間に投影する浅層オートエンコーダの訓練,(2)潜伏空間における画像条件付きサンプリングを可能にする拡散モデルの訓練,の2段階からなる。
論文 参考訳(メタデータ) (2024-01-18T18:59:19Z) - Masking Improves Contrastive Self-Supervised Learning for ConvNets, and Saliency Tells You Where [63.61248884015162]
我々は、畳み込みニューラルネットワークのためのコントラスト学習フレームワークにマスキング操作を組み込むことの負担を軽減することを目的としている。
マスクされた領域が、前景と背景の間に均等に分散されていることを考慮し、塩分濃度の制約を明示的に考慮することを提案する。
論文 参考訳(メタデータ) (2023-09-22T09:58:38Z) - Out-of-domain GAN inversion via Invertibility Decomposition for
Photo-Realistic Human Face Manipulation [22.71398343370642]
そこで我々は,新しいモジュールを設計することで,人間の顔の逆転の忠実度を高める新しいフレームワークを提案する。
従来の手法とは異なり、我々の可逆検出器は空間アライメントモジュールで同時に学習される。
本手法は実世界の人間の顔画像の逆転と操作のための実測結果を生成する。
論文 参考訳(メタデータ) (2022-12-19T06:16:58Z) - Editing Out-of-domain GAN Inversion via Differential Activations [56.62964029959131]
本稿では,構成分解パラダイムを用いて,ドメイン外反転問題に対処する新しいGAN事前編集フレームワークを提案する。
生成されたDiff-CAMマスクの助けを借りて、粗い再構成を直感的に元の画像と編集された画像で合成することができる。
また, 分解段階において, 粗い再構成から最終微編集画像を切り離すための, GAN 以前のデゴーストネットワークを提示する。
論文 参考訳(メタデータ) (2022-07-17T10:34:58Z) - Context-Aware Mixup for Domain Adaptive Semantic Segmentation [52.1935168534351]
Unsupervised domain adapt (UDA) は、ラベル付きソースドメインのモデルをラベル付きターゲットドメインに適応させることを目的としている。
ドメイン適応型セマンティックセグメンテーションのためのエンド・ツー・エンドコンテキスト・アウェア・ミックスアップ(CAMix)を提案する。
実験結果から,提案手法は最先端の手法よりも高い性能を示した。
論文 参考訳(メタデータ) (2021-08-08T03:00:22Z) - Image Inpainting with Edge-guided Learnable Bidirectional Attention Maps [85.67745220834718]
不規則な穴の画像インペインティングを改善するためのエッジガイド学習可能な双方向注意マップ(Edge-LBAM)を紹介します。
当社のEdge-LBAMメソッドには、予測エッジによる構造認識マスク更新を含むデュアルプロシージャが含まれています。
広範な実験により,エッジlbamはコヒーレントな画像構造を生成し,色差やぼやけを防止できることがわかった。
論文 参考訳(メタデータ) (2021-04-25T07:25:16Z) - MagGAN: High-Resolution Face Attribute Editing with Mask-Guided
Generative Adversarial Network [145.4591079418917]
MagGANは、望ましい属性変更に関連する顔の部分のみを編集することを学ぶ。
各属性変更の影響領域をジェネレータに組み込むために、新しいマスク誘導条件付け戦略を導入する。
高解像度(1024×1024$)の顔編集のために,マルチレベルパッチワイド識別器構造を提案する。
論文 参考訳(メタデータ) (2020-10-03T20:56:16Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。