論文の概要: PPR10K: A Large-Scale Portrait Photo Retouching Dataset with
Human-Region Mask and Group-Level Consistency
- arxiv url: http://arxiv.org/abs/2105.09180v1
- Date: Wed, 19 May 2021 14:55:56 GMT
- ステータス: 処理完了
- システム内更新日: 2021-05-20 13:46:43.327317
- Title: PPR10K: A Large-Scale Portrait Photo Retouching Dataset with
Human-Region Mask and Group-Level Consistency
- Title(参考訳): PPR10K:人力マスクとグループレベル一貫性を備えた大規模ポートレート写真リタッチデータセット
- Authors: Jie Liang, Hui Zeng, Miaomiao Cui, Xuansong Xie, Lei Zhang
- Abstract要約: ポートレート写真リタッチ(英: portrait photo retouching、PPR)は、フラットなポートレート写真のコレクションの視覚的品質を高めることを目的としている。
我々は,PPR10Kという大規模PPRデータセットを構築した。
我々は,優れたHRPとGLC性能を持つPPRモデルを学習するための戦略を提案する。
- 参考スコア(独自算出の注目度): 22.903069870297553
- License: http://creativecommons.org/licenses/by-nc-sa/4.0/
- Abstract: Different from general photo retouching tasks, portrait photo retouching
(PPR), which aims to enhance the visual quality of a collection of flat-looking
portrait photos, has its special and practical requirements such as
human-region priority (HRP) and group-level consistency (GLC). HRP requires
that more attention should be paid to human regions, while GLC requires that a
group of portrait photos should be retouched to a consistent tone. Models
trained on existing general photo retouching datasets, however, can hardly meet
these requirements of PPR. To facilitate the research on this high-frequency
task, we construct a large-scale PPR dataset, namely PPR10K, which is the first
of its kind to our best knowledge. PPR10K contains $1, 681$ groups and $11,
161$ high-quality raw portrait photos in total. High-resolution segmentation
masks of human regions are provided. Each raw photo is retouched by three
experts, while they elaborately adjust each group of photos to have consistent
tones. We define a set of objective measures to evaluate the performance of PPR
and propose strategies to learn PPR models with good HRP and GLC performance.
The constructed PPR10K dataset provides a good benchmark for studying automatic
PPR methods, and experiments demonstrate that the proposed learning strategies
are effective to improve the retouching performance. Datasets and codes are
available: https://github.com/csjliang/PPR10K.
- Abstract(参考訳): 一般的な写真リタッチタスクと異なり、フラットな肖像画コレクションの視覚的品質向上を目的としたポートレート写真リタッチ(PPR)は、人間領域優先(HRP)やグループレベル整合(GLC)といった特殊かつ実践的な要件がある。
HRPは人間の領域により多くの注意を払わなければならないが、GLCはポートレート写真群を一貫したトーンに修正する必要がある。
しかし、既存の一般的なフォトリタッチデータセットでトレーニングされたモデルは、pprのこれらの要件をほとんど満たせない。
この高頻度タスクの研究を容易にするために,我々はPPR10Kという大規模PPRデータセットを構築した。
PPR10Kには、1,681ドルのグループと、11,161ドルの高品質の原像写真が含まれている。
ヒト領域の高分解能セグメンテーションマスクを提供する。
それぞれの写真は3人の専門家によって手直しされ、それぞれの写真群が一貫したトーンを持つように精巧に調整される。
我々は,PPRの性能を評価するための客観的尺度のセットを定義し,優れたHRPとGLC性能を持つPPRモデルを学習するための戦略を提案する。
構築されたPPR10Kデータセットは、自動PPR手法を研究するための優れたベンチマークを提供し、提案した学習戦略が修正性能を改善するのに有効であることを示す実験である。
データセットとコードは、https://github.com/csjliang/ppr10k。
関連論文リスト
- SRPose: Two-view Relative Pose Estimation with Sparse Keypoints [51.49105161103385]
SRPoseは、カメラ・トゥ・ワールドおよびオブジェクト・トゥ・カメラシナリオにおける2ビュー相対ポーズ推定のためのスパースキーポイントベースのフレームワークである。
精度と速度の点で最先端の手法と比較して、競争力や優れた性能を達成する。
さまざまな画像サイズやカメラ固有の機能に対して堅牢であり、低コンピューティングリソースでデプロイすることができる。
論文 参考訳(メタデータ) (2024-07-11T05:46:35Z) - SHaRPose: Sparse High-Resolution Representation for Human Pose
Estimation [39.936860590417346]
Sparse High- resolution Representations のみを人間の姿勢推定に用いるフレームワーク(SHaRPose)を提案する。
我々のモデルであるSHaRPose-Baseは、検証セット上で77.4 AP(+0.5 AP)、COCOテストデブセット上で76.7 AP(+0.5 AP)を達成し、ViTPose-Baseより1.4Times$速い速度で推論する。
論文 参考訳(メタデータ) (2023-12-17T16:29:16Z) - PIQI: Perceptual Image Quality Index based on Ensemble of Gaussian
Process Regression [2.9412539021452715]
デジタル画像の品質を評価するためにPIQI(Perceptual Image Quality Index)を提案する。
PIQIの性能は6つのベンチマークデータベースでチェックされ、12の最先端の手法と比較される。
論文 参考訳(メタデータ) (2023-05-16T06:44:17Z) - Controllable Image Enhancement [66.18525728881711]
いくつかのパラメータを制御して、複数のスタイルで高品質な画像を生成できる半自動画像強調アルゴリズムを提案する。
エンコーダ・デコーダフレームワークは、リタッチスキルを潜在コードにエンコードし、イメージ信号処理機能のパラメータにデコードする。
論文 参考訳(メタデータ) (2022-06-16T23:54:53Z) - Rethinking Portrait Matting with Privacy Preserving [79.37601060952201]
P3M-10kは、プライバシ保存ポートレートマッチング(P3M)のための最初の大規模匿名化ベンチマークである。
P3M-10kは10,421枚の高解像度の顔黒の肖像画と高品質のアルファマットで構成されている。
また、CNNとトランスフォーマーの両バックボーンに互換性のあるP3M-Netと呼ばれる統合マッティングモデルを提案する。
論文 参考訳(メタデータ) (2022-03-31T06:26:07Z) - Learning Pixel-Adaptive Weights for Portrait Photo Retouching [1.9843222704723809]
ポートレート写真リタッチ(Portrait photo retouching)は、人間の領域の優先度とグループレベルの一貫性を強調する写真リタッチタスクである。
本稿では,局所的なコンテキストキューをモデル化し,手直し品質を明示的に改善する。
PPR10Kデータセットの実験により,本手法の有効性が検証された。
論文 参考訳(メタデータ) (2021-12-07T07:23:42Z) - Palette: Image-to-Image Diffusion Models [50.268441533631176]
我々は条件付き拡散モデルを用いた画像から画像への変換のためのシンプルで一般的なフレームワークであるPaletteを紹介する。
4つの困難な画像から画像への変換タスクにおいて、Paletteは強力なGANと回帰ベースラインを上回っている。
本稿では、FID、インセプションスコア、事前訓練されたResNet-50の分類精度、参照画像に対する知覚距離などのサンプル品質スコアについて報告する。
論文 参考訳(メタデータ) (2021-11-10T17:49:29Z) - Privacy-Preserving Portrait Matting [73.98225485513905]
P3M-10kは、プライバシー保護ポートレートマットのための最初の大規模な匿名化ベンチマークです。
P3M-10kは1万枚の高解像度顔写真と高品質のアルファマットで構成されています。
意味認識と詳細マッチングの両方に統一されたフレームワークのパワーを利用するP3M-Netを提案する。
論文 参考訳(メタデータ) (2021-04-29T09:20:19Z) - Bridging Composite and Real: Towards End-to-end Deep Image Matting [88.79857806542006]
画像マッチングにおける意味論と細部の役割について検討する。
本稿では,共有エンコーダと2つの分離デコーダを用いた新しいGlance and Focus Matting Network(GFM)を提案する。
総合的な実証研究により、GFMは最先端の手法より優れていることが示されている。
論文 参考訳(メタデータ) (2020-10-30T10:57:13Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。