論文の概要: PCA-SRGAN: Incremental Orthogonal Projection Discrimination for Face
Super-resolution
- arxiv url: http://arxiv.org/abs/2005.00306v2
- Date: Fri, 28 Aug 2020 10:26:21 GMT
- ステータス: 処理完了
- システム内更新日: 2022-12-08 00:03:44.127042
- Title: PCA-SRGAN: Incremental Orthogonal Projection Discrimination for Face
Super-resolution
- Title(参考訳): PCA-SRGAN:顔超解像に対する増分直交射影識別
- Authors: Hao Dou, Chen Chen, Xiyuan Hu, Zuxing Xuan, Zhisen Hu, Silong Peng
- Abstract要約: 顔超解像にはGAN(Generative Adversarial Networks)が用いられている。
GANは歪んだ顔のディテールを容易に取り出すことができ、現実的なテクスチャの回復には依然として弱点がある。
顔データのPCAプロジェクション行列を対象とする直交射影空間における累積判別に注意を払うPCA-SRGANを提案する。
- 参考スコア(独自算出の注目度): 11.857583827896363
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Generative Adversarial Networks (GAN) have been employed for face super
resolution but they bring distorted facial details easily and still have
weakness on recovering realistic texture. To further improve the performance of
GAN based models on super-resolving face images, we propose PCA-SRGAN which
pays attention to the cumulative discrimination in the orthogonal projection
space spanned by PCA projection matrix of face data. By feeding the principal
component projections ranging from structure to details into the discriminator,
the discrimination difficulty will be greatly alleviated and the generator can
be enhanced to reconstruct clearer contour and finer texture, helpful to
achieve the high perception and low distortion eventually. This incremental
orthogonal projection discrimination has ensured a precise optimization
procedure from coarse to fine and avoids the dependence on the perceptual
regularization. We conduct experiments on CelebA and FFHQ face datasets. The
qualitative visual effect and quantitative evaluation have demonstrated the
overwhelming performance of our model over related works.
- Abstract(参考訳): 顔の超高解像度化にはgan(generative adversarial network)が採用されているが、顔の細部を歪めやすく、リアルなテクスチャの回復にも弱点がある。
超解像によるGANモデルの性能向上のために,顔データのPCAプロジェクション行列に分散した直交射影空間における累積微分に着目したPCA-SRGANを提案する。
構造からディテールに至るまでの主成分投影を判別器に供給することにより、識別の難しさを大幅に軽減し、より鮮明な輪郭とより微細なテクスチャを再構築し、最終的に高い知覚と低歪みを実現するのに役立てることができる。
この漸進的な直交射影判別は、粗いものから細かいものへの正確な最適化手順を保証し、知覚正規化への依存を避ける。
我々はCelebAとFFHQの顔データセットの実験を行う。
定性的視覚効果と定量的評価は,本モデルが関連する作品よりも圧倒的な性能を示した。
関連論文リスト
- DifAugGAN: A Practical Diffusion-style Data Augmentation for GAN-based
Single Image Super-resolution [88.13972071356422]
本稿では,DifAugGAN として知られる GAN ベースの画像超解像法(SR) のための拡散型データ拡張手法を提案する。
それは、訓練中の判別器の校正を改善するために、生成拡散モデルに拡散過程を適用することを含む。
我々のDifAugGANは、現在のGANベースのSISR手法のプラグ・アンド・プレイ戦略であり、判別器の校正を改善し、SR性能を向上させることができる。
論文 参考訳(メタデータ) (2023-11-30T12:37:53Z) - EfficientSRFace: An Efficient Network with Super-Resolution Enhancement
for Accurate Face Detection [18.977044046941813]
顔検出では、密集した顔予測タスクにおいて、人間の集団の多数の小さな顔のような低解像度の顔が一般的である。
我々は,特徴レベルの超解像再構成ネットワークを導入し,効率的なSRFaceと呼ばれる検出器を開発した。
このモジュールはトレーニングプロセスにおいて補助的な役割を担い、推論時間を増やすことなく推論中に取り除くことができる。
論文 参考訳(メタデータ) (2023-06-04T06:49:44Z) - Uncovering the Over-smoothing Challenge in Image Super-Resolution: Entropy-based Quantification and Contrastive Optimization [67.99082021804145]
我々はDetail Enhanced Contrastive Loss (DECLoss)と呼ばれるCOO問題に対する明確な解決策を提案する。
DECLossはコントラスト学習のクラスタリング特性を利用して、潜在的な高分解能分布の分散を直接的に低減する。
我々は複数の超高解像度ベンチマーク上でDECLosを評価し,PSNR指向モデルの知覚品質を向上させることを実証した。
論文 参考訳(メタデータ) (2022-01-04T08:30:09Z) - A-ESRGAN: Training Real-World Blind Super-Resolution with Attention
U-Net Discriminators [0.0]
ブラインド画像超解像(SR)は、未知の複雑な歪みに苦しむ低解像度画像の復元を目的とした、CVにおける長年の課題である。
本稿では,A-ESRGANについて述べる。A-ESRGAN,A-ESRGAN,A-ESRGAN,A-ESRGAN,A-ESRGAN,A-ESRGAN,A-ESRGAN。
論文 参考訳(メタデータ) (2021-12-19T02:50:23Z) - Face Deblurring Based on Separable Normalization and Adaptive
Denormalization [25.506065804812522]
Face Deblurringは、より明示的な構造と顔の詳細で、ぼやけた入力画像から透明な顔イメージを復元することを目的としている。
我々は、分離可能な正規化と適応的な非正規化に基づく効果的な顔分解ネットワークを設計する。
CelebAとCelebA-HQの両方のデータセットの実験結果から、提案した顔劣化ネットワークは、より詳細な顔構造を復元することが示された。
論文 参考訳(メタデータ) (2021-12-18T03:42:23Z) - LR-to-HR Face Hallucination with an Adversarial Progressive
Attribute-Induced Network [67.64536397027229]
顔の超解像は難しい問題であり、非常に不適切な問題である。
顔の特徴を取り入れたエンドツーエンドのプログレッシブ・ラーニング・フレームワークを提案する。
提案手法は,他の最先端アプローチよりも良好な顔幻覚像が得られることを示す。
論文 参考訳(メタデータ) (2021-09-29T19:50:45Z) - AOT: Appearance Optimal Transport Based Identity Swapping for Forgery
Detection [76.7063732501752]
顔偽造検出のための外観の相違が大きい新しい識別スワップアルゴリズムを提案する。
外観のギャップは主に、照明と肌の色における大きな相違から生じる。
実画像パッチと偽画像パッチの混在とを識別するために識別器を導入する。
論文 参考訳(メタデータ) (2020-11-05T06:17:04Z) - Unsupervised Learning Facial Parameter Regressor for Action Unit
Intensity Estimation via Differentiable Renderer [51.926868759681014]
骨駆動型顔モデル(BDFM)に基づいて,異なる視点で顔パラメータを予測する枠組みを提案する。
提案するフレームワークは,特徴抽出器,ジェネレータ,顔パラメータ回帰器から構成される。
論文 参考訳(メタデータ) (2020-08-20T09:49:13Z) - Feature Super-Resolution Based Facial Expression Recognition for
Multi-scale Low-Resolution Faces [7.634398926381845]
超解像法はしばしば低分解能画像の高精細化に使用されるが、FERタスクの性能は極低分解能画像では制限される。
本研究では,物体検出のための特徴的超解像法に触発されて,頑健な表情認識のための新たな生成逆ネットワークに基づく超解像法を提案する。
論文 参考訳(メタデータ) (2020-04-05T15:38:47Z) - Dual-Attention GAN for Large-Pose Face Frontalization [59.689836951934694]
本稿では,フォトリアリスティック顔フロンダル化のためのDA-GAN(Dual-Attention Generative Adversarial Network)を提案する。
具体的には、ローカル機能と長距離依存関係を統合するために、自己アテンションベースのジェネレータが導入された。
顔領域の局所的特徴を強調するために,新しい顔認識に基づく識別器を適用した。
論文 参考訳(メタデータ) (2020-02-17T20:00:56Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。