論文の概要: Training Matting Models without Alpha Labels
- arxiv url: http://arxiv.org/abs/2408.10539v1
- Date: Tue, 20 Aug 2024 04:34:06 GMT
- ステータス: 処理完了
- システム内更新日: 2024-08-21 15:03:52.689251
- Title: Training Matting Models without Alpha Labels
- Title(参考訳): アルファラベルを使わずにマッチングモデルをトレーニングする
- Authors: Wenze Liu, Zixuan Ye, Hao Lu, Zhiguo Cao, Xiangyu Yue,
- Abstract要約: この研究は、前景/背景を監督として粗く示すトリマップのような粗いアノテーションを用いて調査する。
本研究は, 既知領域からの学習意味論と適切な仮定マッチング規則との協調が, 遷移領域におけるアルファ値の推測に有効であることが示唆された。
AM-2K と P3M-10K のデータセットを用いた実験により,我々のパラダイムはファインレーベルの教師付きベースラインと同等の性能を発揮することが示された。
- 参考スコア(独自算出の注目度): 22.249204770416927
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: The labelling difficulty has been a longstanding problem in deep image matting. To escape from fine labels, this work explores using rough annotations such as trimaps coarsely indicating the foreground/background as supervision. We present that the cooperation between learned semantics from indicated known regions and proper assumed matting rules can help infer alpha values at transition areas. Inspired by the nonlocal principle in traditional image matting, we build a directional distance consistency loss (DDC loss) at each pixel neighborhood to constrain the alpha values conditioned on the input image. DDC loss forces the distance of similar pairs on the alpha matte and on its corresponding image to be consistent. In this way, the alpha values can be propagated from learned known regions to unknown transition areas. With only images and trimaps, a matting model can be trained under the supervision of a known loss and the proposed DDC loss. Experiments on AM-2K and P3M-10K dataset show that our paradigm achieves comparable performance with the fine-label-supervised baseline, while sometimes offers even more satisfying results than human-labelled ground truth. Code is available at \url{https://github.com/poppuppy/alpha-free-matting}.
- Abstract(参考訳): ラベル付けの難しさは、ディープ・イメージ・マッティングにおける長年の問題であった。
細かなラベルから逃れるために、フォアグラウンド/バックグラウンドを監督として粗いトリマップなどの粗いアノテーションを用いて調査する。
本研究は, 既知領域からの学習意味論と適切な仮定マッチング規則との協調が, 遷移領域におけるアルファ値の推測に有効であることが示唆された。
従来の画像マッチングにおける非局所原理に着想を得て,各画素近傍に方向距離整合損失(DDC損失)を構築し,入力画像に条件付けられたアルファ値を制限する。
DDC損失は、アルファマット上の類似の対と対応する画像上の距離が一貫することを強制する。
このようにして、アルファ値は学習された既知の領域から未知の遷移領域へと伝播することができる。
画像とトリマップのみを用いて、既知の損失と提案されたDDC損失の監視の下で、マッチングモデルをトレーニングすることができる。
AM-2K と P3M-10K データセットを用いた実験により,我々のパラダイムは,微ラベル教師付きベースラインと同等の性能を達成できる一方で,時として人間よりも満足度の高い結果が得られることが示された。
コードは \url{https://github.com/poppuppy/alpha-free-matting} で公開されている。
関連論文リスト
- Fine-grained Image-to-LiDAR Contrastive Distillation with Visual Foundation Models [55.99654128127689]
Visual Foundation Models (VFM) は、3D表現学習を強化するために使用される。
VFMは、弱制御された画素間コントラスト蒸留のためのセマンティックラベルを生成する。
我々は,空間分布とカテゴリー周波数の不均衡に対応するために,点のサンプリング確率を適応させる。
論文 参考訳(メタデータ) (2024-05-23T07:48:19Z) - DiffusionMat: Alpha Matting as Sequential Refinement Learning [87.76572845943929]
DiffusionMatは、粗いアルファマットから洗練されたアルファマットへの移行に拡散モデルを利用する画像マッチングフレームワークである。
補正モジュールは、各復調ステップで出力を調整し、最終的な結果が入力画像の構造と一致していることを保証する。
その結果,DiffusionMatは既存の手法よりも優れていたことが示唆された。
論文 参考訳(メタデータ) (2023-11-22T17:16:44Z) - Self-supervised Matting-specific Portrait Enhancement and Generation [40.444011984347505]
我々はStyleGANを使ってGANモデルの潜伏空間を探索する。
我々は、4つの調整された損失の下で、潜伏空間における多スケール潜伏ベクトルを最適化する。
提案手法は,任意のマッチングモデルに対して,実際のポートレート画像を洗練することができることを示す。
論文 参考訳(メタデータ) (2022-08-13T09:00:02Z) - Unsupervised Domain Adaptation with Contrastive Learning for OCT
Segmentation [49.59567529191423]
本稿では,新しい未ラベル領域からのボリューム画像のセグメンテーションのための,新しい半教師付き学習フレームワークを提案する。
教師付き学習とコントラスト学習を併用し、3次元の近傍スライス間の類似性を利用したコントラストペア方式を導入する。
論文 参考訳(メタデータ) (2022-03-07T19:02:26Z) - Long-Range Feature Propagating for Natural Image Matting [93.20589403997505]
自然画像マッチングは、トリマップ内の未知領域のアルファ値を推定する。
近年、深層学習に基づく手法は、その類似性に応じて、既知の領域から未知領域へのアルファ値の伝播を行っている。
本稿では,Alpha matte 推定のために受信フィールド外における長距離コンテキスト特徴を学習する Long-Range Feature Propagating Network (LFPNet) を提案する。
論文 参考訳(メタデータ) (2021-09-25T01:17:17Z) - Alpha Matte Generation from Single Input for Portrait Matting [79.62140902232628]
目標は、各画素が前景の被写体に与える影響を識別するアルファマットを予測することである。
従来のアプローチや既存の作業の多くは、アルファマットの予測にトリマップ、背景画像などの追加入力を使用していた。
我々は、GAN(Generative Adversarial Nets)を用いたポートレート・マッティングを行うための追加の入力不要アプローチを導入する。
論文 参考訳(メタデータ) (2021-06-06T18:53:42Z) - Semi-Supervised Domain Adaptation with Prototypical Alignment and
Consistency Learning [86.6929930921905]
本稿では,いくつかの対象サンプルがラベル付けされていれば,ドメインシフトに対処するのにどの程度役立つか検討する。
ランドマークの可能性を最大限に追求するために、ランドマークから各クラスのターゲットプロトタイプを計算するプロトタイプアライメント(PA)モジュールを組み込んでいます。
具体的には,ラベル付き画像に深刻な摂動を生じさせ,PAを非自明にし,モデル一般化性を促進する。
論文 参考訳(メタデータ) (2021-04-19T08:46:08Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。