論文の概要: Privacy-Preserving Portrait Matting
- arxiv url: http://arxiv.org/abs/2104.14222v1
- Date: Thu, 29 Apr 2021 09:20:19 GMT
- ステータス: 処理完了
- システム内更新日: 2021-04-30 13:12:54.140964
- Title: Privacy-Preserving Portrait Matting
- Title(参考訳): プライバシ保護ポートレートマッチング
- Authors: Jizhizi Li, Sihan Ma, Jing Zhang, Dacheng Tao
- Abstract要約: P3M-10kは、プライバシー保護ポートレートマットのための最初の大規模な匿名化ベンチマークです。
P3M-10kは1万枚の高解像度顔写真と高品質のアルファマットで構成されています。
意味認識と詳細マッチングの両方に統一されたフレームワークのパワーを利用するP3M-Netを提案する。
- 参考スコア(独自算出の注目度): 73.98225485513905
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Recently, there has been an increasing concern about the privacy issue raised
by using personally identifiable information in machine learning. However,
previous portrait matting methods were all based on identifiable portrait
images. To fill the gap, we present P3M-10k in this paper, which is the first
large-scale anonymized benchmark for Privacy-Preserving Portrait Matting.
P3M-10k consists of 10,000 high-resolution face-blurred portrait images along
with high-quality alpha mattes. We systematically evaluate both trimap-free and
trimap-based matting methods on P3M-10k and find that existing matting methods
show different generalization capabilities when following the
Privacy-Preserving Training (PPT) setting, i.e., "training on face-blurred
images and testing on arbitrary images". To devise a better trimap-free
portrait matting model, we propose P3M-Net, which leverages the power of a
unified framework for both semantic perception and detail matting, and
specifically emphasizes the interaction between them and the encoder to
facilitate the matting process. Extensive experiments on P3M-10k demonstrate
that P3M-Net outperforms the state-of-the-art methods in terms of both
objective metrics and subjective visual quality. Besides, it shows good
generalization capacity under the PPT setting, confirming the value of P3M-10k
for facilitating future research and enabling potential real-world
applications. The source code and dataset will be made publicly available.
- Abstract(参考訳): 近年,個人識別可能な情報を機械学習に利用することで生じるプライバシー問題に対する懸念が高まっている。
しかし、過去の肖像画マッチング手法はすべて、識別可能な肖像画に基づいていた。
このギャップを埋めるために,プライバシ保存ポートレートマッチングのための大規模な匿名化ベンチマークであるP3M-10kを紹介する。
P3M-10kは1万枚の高解像度の顔黒の肖像画と高品質のアルファマットで構成されている。
我々は,p3m-10kにおけるtrimap-free法とtrimap-based matting法の両方を体系的に評価し,既存のmatting法がppt(privacy-preserving training)設定に従うと異なる一般化能力を示すことを見出した。
そこで我々は,より優れたtrimapフリーなポートレート・マットリング・モデルを開発するために,意味知覚とディテール・マットングの両方のための統一フレームワークのパワーを生かしたp3m-netを提案する。
P3M-10kの広汎な実験により、P3M-Netは客観的メトリクスと主観的視覚的品質の両方の観点から最先端の手法より優れていることが示された。
さらに、PPT設定下での優れた一般化能力を示し、将来の研究を容易にし、潜在的な現実世界の応用を可能にするためにP3M-10kの価値を確認する。
ソースコードとデータセットは一般公開される予定だ。
関連論文リスト
- PF-LRM: Pose-Free Large Reconstruction Model for Joint Pose and Shape
Prediction [77.89935657608926]
画像から3Dオブジェクトを再構成するためのPF-LRM(Pose-Free Large Restruction Model)を提案する。
PF-LRMは1つのA100 GPU上で1.3秒で相対カメラのポーズを同時に推定する。
論文 参考訳(メタデータ) (2023-11-20T18:57:55Z) - PP-Matting: High-Accuracy Natural Image Matting [11.68134059283327]
PP-Mattingは、高精度な自然な画像マッチングを実現するトリマップのないアーキテクチャである。
本手法は,前景のきめ細かい詳細を抽出する高精細ディテールブランチ (HRDB) を適用する。
また,意味的セグメンテーションのサブタスクを採用した意味的文脈分岐(SCB)を提案する。
論文 参考訳(メタデータ) (2022-04-20T12:54:06Z) - Rethinking Portrait Matting with Privacy Preserving [79.37601060952201]
P3M-10kは、プライバシ保存ポートレートマッチング(P3M)のための最初の大規模匿名化ベンチマークである。
P3M-10kは10,421枚の高解像度の顔黒の肖像画と高品質のアルファマットで構成されている。
また、CNNとトランスフォーマーの両バックボーンに互換性のあるP3M-Netと呼ばれる統合マッティングモデルを提案する。
論文 参考訳(メタデータ) (2022-03-31T06:26:07Z) - Deep Automatic Natural Image Matting [82.56853587380168]
自動画像マッチング(AIM)とは、任意の自然画像からソフトフォアグラウンドをトリマップのような補助的な入力なしで推定することである。
本稿では,これらの画像の一般化されたトリマップを統一的な意味表現として予測できる,新しいエンドツーエンドマッチングネットワークを提案する。
我々のネットワークは、利用可能な合成マッチングデータセットをトレーニングし、既存の手法を客観的にも主観的にも優れています。
論文 参考訳(メタデータ) (2021-07-15T10:29:01Z) - Salient Image Matting [0.0]
本研究では,画像中の最も鮮やかな前景の画素あたりの不透明度値を推定するために,Salient Image Mattingという画像マッチングフレームワークを提案する。
我々のフレームワークは、広範囲のセマンティクスと健全なオブジェクトタイプを学ぶという課題を同時に扱う。
私たちのフレームワークは、他の自動メソッドと比較して、わずかな高価なマットデータのみを必要とします。
論文 参考訳(メタデータ) (2021-03-23T06:22:33Z) - Portrait Neural Radiance Fields from a Single Image [68.66958204066721]
本稿では,単一のポートレートからニューラルラジアンス場(NeRF)を推定する手法を提案する。
体積密度を暗黙的にモデル化する多層パーセプトロン(MLP)の重みを事前に訓練することを提案する。
非知覚面の一般化を改善するため、3次元顔変形モデルによって近似される正準座標空間を訓練する。
本手法は,制御されたキャプチャを用いて定量的に評価し,実画像への一般化を実証し,最先端画像に対して良好な結果を示す。
論文 参考訳(メタデータ) (2020-12-10T18:59:59Z) - Bridging Composite and Real: Towards End-to-end Deep Image Matting [88.79857806542006]
画像マッチングにおける意味論と細部の役割について検討する。
本稿では,共有エンコーダと2つの分離デコーダを用いた新しいGlance and Focus Matting Network(GFM)を提案する。
総合的な実証研究により、GFMは最先端の手法より優れていることが示されている。
論文 参考訳(メタデータ) (2020-10-30T10:57:13Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。