論文の概要: Mask Guided Matting via Progressive Refinement Network
- arxiv url: http://arxiv.org/abs/2012.06722v2
- Date: Fri, 2 Apr 2021 00:57:47 GMT
- ステータス: 処理完了
- システム内更新日: 2021-05-10 05:19:18.109999
- Title: Mask Guided Matting via Progressive Refinement Network
- Title(参考訳): プログレッシブ・リファインメント・ネットワークによるマスクガイド・マットリング
- Authors: Qihang Yu, Jianming Zhang, He Zhang, Yilin Wang, Zhe Lin, Ning Xu,
Yutong Bai, Alan Yuille
- Abstract要約: mask guided (mg) mattingは一般的な粗いマスクを指導する堅牢なマットリングフレームワークである。
PRNはトリマップや低品質のアルファマットのような見えない種類の誘導マスクに一般化可能であることを示す。
我々はデータセット問題に対処するために驚くほど簡単な改善を提案する。
- 参考スコア(独自算出の注目度): 40.7044070641012
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: We propose Mask Guided (MG) Matting, a robust matting framework that takes a
general coarse mask as guidance. MG Matting leverages a network (PRN) design
which encourages the matting model to provide self-guidance to progressively
refine the uncertain regions through the decoding process. A series of guidance
mask perturbation operations are also introduced in the training to further
enhance its robustness to external guidance. We show that PRN can generalize to
unseen types of guidance masks such as trimap and low-quality alpha matte,
making it suitable for various application pipelines. In addition, we revisit
the foreground color prediction problem for matting and propose a surprisingly
simple improvement to address the dataset issue. Evaluation on real and
synthetic benchmarks shows that MG Matting achieves state-of-the-art
performance using various types of guidance inputs. Code and models are
available at https://github.com/yucornetto/MGMatting.
- Abstract(参考訳): 汎用的な粗いマスクを指導するロバストなマットリングフレームワークである,マスクガイド(mg)マットリングを提案する。
MG Matting はネットワーク (PRN) 設計を活用し、畳み込みモデルがデコードプロセスを通じて不確定領域を段階的に洗練する自己誘導を提供する。
トレーニングでは、外部誘導に対するロバスト性をさらに高めるため、一連の誘導マスク摂動操作も導入されている。
PRNは、トリマップや低品質のアルファマットなど、目に見えない種類の誘導マスクに一般化でき、様々なアプリケーションパイプラインに適していることを示す。
また,前景の色予測問題を再検討し,データセット問題に対処するための驚くほど単純な改良を提案する。
実および合成ベンチマークの評価は、MG Mattingが様々な種類のガイダンス入力を用いて最先端のパフォーマンスを達成することを示す。
コードとモデルはhttps://github.com/yucornetto/MGMatting.comで入手できる。
関連論文リスト
- Towards Natural Image Matting in the Wild via Real-Scenario Prior [69.96414467916863]
我々は,COCOデータセット,すなわちCOCO-Mattingに基づく新しいマッチングデータセットを提案する。
構築されたCOCO-Mattingは、複雑な自然シナリオにおける38,251人のインスタンスレベルのアルファマットの広範なコレクションを含む。
ネットワークアーキテクチャにおいて、提案する特徴整合変換器は、きめ細かいエッジと透過性を抽出することを学ぶ。
提案したマットアライメントデコーダは、マット固有のオブジェクトを分割し、粗いマスクを高精度なマットに変換することを目的としている。
論文 参考訳(メタデータ) (2024-10-09T06:43:19Z) - ColorMAE: Exploring data-independent masking strategies in Masked AutoEncoders [53.3185750528969]
Masked AutoEncoders (MAE)は、堅牢な自己管理フレームワークとして登場した。
データに依存しないColorMAEという手法を導入し、ランダムノイズをフィルタすることで異なる二元マスクパターンを生成する。
ランダムマスキングと比較して,下流タスクにおける戦略の優位性を示す。
論文 参考訳(メタデータ) (2024-07-17T22:04:00Z) - Bringing Masked Autoencoders Explicit Contrastive Properties for Point Cloud Self-Supervised Learning [116.75939193785143]
画像領域における視覚変換器(ViT)のコントラスト学習(CL)は、従来の畳み込みバックボーンのCLに匹敵する性能を達成した。
ViTで事前訓練した3Dポイントクラウドでは、マスク付きオートエンコーダ(MAE)モデリングが主流である。
論文 参考訳(メタデータ) (2024-07-08T12:28:56Z) - MGMap: Mask-Guided Learning for Online Vectorized HD Map Construction [17.16231247910372]
本稿では,情報領域を効果的に強調し,正確な地図要素の局所化を実現するマスク誘導方式MGMapを提案する。
具体的には、MGMapは2つの観点から強化されたマルチスケールBEV機能に基づいて学習マスクを採用する。
ベースラインと比較して,提案したMGMapは,入力モードが異なる場合,約10mAPの顕著な改善を実現している。
論文 参考訳(メタデータ) (2024-04-01T03:13:32Z) - Downstream Task Guided Masking Learning in Masked Autoencoders Using
Multi-Level Optimization [42.82742477950748]
Masked Autoencoder (MAE) は視覚表現学習における自己教師付き事前学習のための重要な手法である。
プリトレーニング中に最適なマスキング戦略を学習する新しいフレームワークであるMulti-level Optimized Mask Autoencoder (MLO-MAE)を紹介する。
視覚表現学習におけるMLO-MAEの進歩について検討した。
論文 参考訳(メタデータ) (2024-02-28T07:37:26Z) - GD-MAE: Generative Decoder for MAE Pre-training on LiDAR Point Clouds [72.60362979456035]
Masked Autoencoders (MAE)は、大規模な3Dポイントクラウドでの探索が難しい。
我々は,周囲のコンテキストを自動的にマージするためのtextbfGenerative textbfDecoder for MAE (GD-MAE)を提案する。
提案手法の有効性を, KITTI と ONCE の2つの大規模ベンチマークで実証した。
論文 参考訳(メタデータ) (2022-12-06T14:32:55Z) - Masked Surfel Prediction for Self-Supervised Point Cloud Learning [40.16043026141161]
マスク付き自動符号化において局所幾何学情報を明示的に考慮する最初の試みを行い,Masked Surfel Prediction (MaskSurf)法を提案する。
具体的には、入力点雲が高い比でマスクされていることを考慮し、トランスフォーマーベースのエンコーダデコーダネットワークを学習し、基礎となるマスク付きサーフを推定する。
MaskSurfは3つの微調整戦略の下で6つの下流タスクで検証される。
論文 参考訳(メタデータ) (2022-07-07T06:47:26Z) - Image Inpainting by End-to-End Cascaded Refinement with Mask Awareness [66.55719330810547]
任意の欠落領域を塗りつぶすことは、様々なマスクされた領域で有効な特徴を学ぶことは非自明だから難しい。
符号化フェーズにおける欠落領域のマルチスケール特徴を学習する新しいマスク対応インペイントソリューションを提案する。
私たちのフレームワークは、3つの公開データセットに関する広範な実験を通じて定量的および定性的に検証されます。
論文 参考訳(メタデータ) (2021-04-28T13:17:47Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。