論文の概要: Mask Consistency Regularization in Object Removal
- arxiv url: http://arxiv.org/abs/2509.10259v1
- Date: Fri, 12 Sep 2025 14:02:52 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-09-15 16:03:08.113013
- Title: Mask Consistency Regularization in Object Removal
- Title(参考訳): 物体除去におけるマスクの整合性規則化
- Authors: Hua Yuan, Jin Yuan, Yicheng Jiang, Yao Zhang, Xin Geng, Yong Rui,
- Abstract要約: Mask Consistency Regularization (MCR)は、オブジェクト削除タスクに特化した新しいトレーニング戦略である。
MCRは幻覚とマスク形状バイアスを著しく低減し、物体除去の性能を向上させる。
- 参考スコア(独自算出の注目度): 43.90240963122134
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Object removal, a challenging task within image inpainting, involves seamlessly filling the removed region with content that matches the surrounding context. Despite advancements in diffusion models, current methods still face two critical challenges. The first is mask hallucination, where the model generates irrelevant or spurious content inside the masked region, and the second is mask-shape bias, where the model fills the masked area with an object that mimics the mask's shape rather than surrounding content. To address these issues, we propose Mask Consistency Regularization (MCR), a novel training strategy designed specifically for object removal tasks. During training, our approach introduces two mask perturbations: dilation and reshape, enforcing consistency between the outputs of these perturbed branches and the original mask. The dilated masks help align the model's output with the surrounding content, while reshaped masks encourage the model to break the mask-shape bias. This combination of strategies enables MCR to produce more robust and contextually coherent inpainting results. Our experiments demonstrate that MCR significantly reduces hallucinations and mask-shape bias, leading to improved performance in object removal.
- Abstract(参考訳): オブジェクトの削除は、画像のインペイントにおいて困難なタスクであり、削除された領域を周囲のコンテキストにマッチしたコンテンツでシームレスに埋める。
拡散モデルの進歩にもかかわらず、現在の手法はまだ2つの重要な課題に直面している。
第1はマスク幻覚であり、第2はマスク領域内で無関係または刺激的な内容を生成するモデルであり、第2はマスク領域を周囲のコンテンツではなくマスクの形状を模倣するオブジェクトで満たすマスク形状バイアスである。
これらの課題に対処するために,オブジェクト除去タスクに特化した新しいトレーニング戦略であるマスク一貫性規則化(MCR)を提案する。
トレーニング中,本手法では2つのマスク摂動(拡張と再形成)を導入し,これらの摂動枝の出力と元のマスクとの整合性を強制する。
拡張されたマスクは、モデルの出力を周囲のコンテンツと整合させるのに役立ち、一方、リフォームされたマスクは、モデルがマスク形状のバイアスを破るのを奨励する。
この戦略の組み合わせにより、MCRはより堅牢でコンテキスト的に一貫性のあるインペイント結果を生成することができる。
実験の結果,MCRは幻覚やマスク形状の偏りを著しく低減し,物体除去性能が向上することが示された。
関連論文リスト
- SmartEraser: Remove Anything from Images using Masked-Region Guidance [114.36809682798784]
SmartEraserはMasked-Region Guidanceと呼ばれる新しい削除パラダイムで構築されている。
Masked-Region Guidanceは、削除プロセスのガイダンスとして、入力中のマスクされた領域を保持します。
大規模オブジェクト除去データセットであるSyn4Removalを提案する。
論文 参考訳(メタデータ) (2025-01-14T17:55:12Z) - ColorMAE: Exploring data-independent masking strategies in Masked AutoEncoders [53.3185750528969]
Masked AutoEncoders (MAE)は、堅牢な自己管理フレームワークとして登場した。
データに依存しないColorMAEという手法を導入し、ランダムノイズをフィルタすることで異なる二元マスクパターンを生成する。
ランダムマスキングと比較して,下流タスクにおける戦略の優位性を示す。
論文 参考訳(メタデータ) (2024-07-17T22:04:00Z) - MP-Former: Mask-Piloted Transformer for Image Segmentation [16.620469868310288]
Mask2Formerはデコーダ層間の一貫性のないマスク予測に悩まされている。
本手法では,マスマスマスマスマスマスマスマスマスマスマスマスマスマスマスマスマスマスマスマスマスマスマスマスマスマスマスマスマスマスマスマスマスマスマスマスマスマスマスマスマスマスマスマスマスマスマスマスマスマスマスマスのマスマスマスマスマスマスマスマスマスマスマスマスマスマスマスマスマスマスマスマスマスマスマスマスマスマスマスマスマスマスマスマスマスマスマスマスをマスマスマスマストした。
論文 参考訳(メタデータ) (2023-03-13T17:57:59Z) - Towards Improved Input Masking for Convolutional Neural Networks [66.99060157800403]
層マスキングと呼ぶCNNのための新しいマスキング手法を提案する。
本手法は,マスク形状や色がモデル出力に与える影響を排除あるいは最小化することができることを示す。
また,マスクの形状がクラスに関する情報を漏洩させる可能性を示し,クラス関連特徴に対するモデル依存度の推定に影響を及ぼすことを示した。
論文 参考訳(メタデータ) (2022-11-26T19:31:49Z) - MixMask: Revisiting Masking Strategy for Siamese ConvNets [23.946791390657875]
この研究は、textbfMixMaskと呼ばれる新しいフィリングベースのマスキング手法を導入している。
提案手法は,消去された領域を別の画像からのコンテンツに置き換えることにより,従来のマスキング手法で見られる情報の枯渇を効果的に解消する。
我々は,線形探索,半教師付きおよび教師付きファインタニング,オブジェクト検出,セグメンテーションなどの領域におけるフレームワークの性能向上を実証的に検証した。
論文 参考訳(メタデータ) (2022-10-20T17:54:03Z) - Masked Face Inpainting Through Residual Attention UNet [0.7868449549351486]
本稿では,残像UNetを用いたブラインドマスク面塗装法を提案する。
残差ブロックは次の層に情報を供給し、2ホップ離れた層に直接入力し、消滅する勾配問題を解決する。
公開されているCelebAデータセットの実験は、提案モデルの有効性と堅牢性を示している。
論文 参考訳(メタデータ) (2022-09-19T08:49:53Z) - A Unified Framework for Masked and Mask-Free Face Recognition via
Feature Rectification [19.417191498842044]
マスク付き顔とマスクなし顔の両方を識別するための統合フレームワークである顔特徴整形ネットワーク(FFR-Net)を提案する。
本研究では,最先端認識モデルにより抽出された特徴を,空間次元とチャネル次元の両方で整列するための整列ブロックを導入する。
実験により,我々のフレームワークは,マスク付き顔とマスクなし顔の両方を効果的に認識するための修正された特徴空間を学習できることが示されている。
論文 参考訳(メタデータ) (2022-02-15T12:37:59Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。