論文の概要: Systematic Analysis and Removal of Circular Artifacts for StyleGAN
- arxiv url: http://arxiv.org/abs/2103.01090v2
- Date: Thu, 4 Mar 2021 08:43:46 GMT
- ステータス: 処理完了
- システム内更新日: 2021-03-05 13:02:40.430913
- Title: Systematic Analysis and Removal of Circular Artifacts for StyleGAN
- Title(参考訳): StyleGAN用円形人工物の系統解析と除去
- Authors: Way Tan, Bihan Wen, Xulei Yang
- Abstract要約: vanilla StyleGANは高解像度で超リアルな顔画像の合成で有名です。
バニラスタイルGANによって生成された画像は、生成された画像の品質を著しく低下させる顕著な円形のアーティファクトを含んでいる。
そこで本研究では,バニラ型GANの顕著な円形アーティファクトを,PIN(Pixel-instance normalization)層を用いて簡易かつ効果的に除去する手法を提案する。
- 参考スコア(独自算出の注目度): 18.81825109737998
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: StyleGAN is one of the state-of-the-art image generators which is well-known
for synthesizing high-resolution and hyper-realistic face images. Though images
generated by vanilla StyleGAN model are visually appealing, they sometimes
contain prominent circular artifacts which severely degrade the quality of
generated images. In this work, we provide a systematic investigation on how
those circular artifacts are formed by studying the functionalities of
different stages of vanilla StyleGAN architecture, with both mechanism analysis
and extensive experiments. The key modules of vanilla StyleGAN that promote
such undesired artifacts are highlighted. Our investigation also explains why
the artifacts are usually circular, relatively small and rarely split into 2 or
more parts. Besides, we propose a simple yet effective solution to remove the
prominent circular artifacts for vanilla StyleGAN, by applying a novel
pixel-instance normalization (PIN) layer.
- Abstract(参考訳): StyleGANは、高解像度と超リアルな顔画像の合成で有名な最先端の画像ジェネレーターの1つです。
バニラスタイルGANモデルによって生成された画像は視覚的に魅力的であるが、しばしば、生成された画像の品質を著しく低下させる顕著な円形のアーティファクトを含んでいる。
本研究では、バニラ様式GANアーキテクチャの異なる段階の機能を検討し、メカニズム解析と広範な実験の両方を用いて、これらの円形アーティファクトがどのように形成されるのかを体系的に調査する。
このような望ましくないアーティファクトを促進するバニラスタイルガンのキーモジュールが強調される。
私たちの調査では、アーティファクトが通常、円形であり、比較的小さく、まれに2つ以上の部分に分割される理由も説明しています。
さらに,バニラ型GANの顕著な円形アーティファクトを,新しいピクセルインスタンス正規化(PIN)層を適用して,簡易かつ効果的に除去する手法を提案する。
関連論文リスト
- GUS-IR: Gaussian Splatting with Unified Shading for Inverse Rendering [83.69136534797686]
GUS-IRは、粗く光沢のある表面を特徴とする複雑なシーンの逆レンダリング問題に対処するために設計された新しいフレームワークである。
本稿では、逆レンダリング、フォワードシェーディング、遅延シェーディングに広く使われている2つの顕著なシェーディング技術を分析し、比較することから始める。
両手法の利点を組み合わせた統合シェーディングソリューションを提案する。
論文 参考訳(メタデータ) (2024-11-12T01:51:05Z) - ShapeMoiré: Channel-Wise Shape-Guided Network for Image Demoiréing [19.56605254816149]
光電子ディスプレイの撮影はアナログ信号干渉による望ましくないモワールパターンをしばしば導入する。
この研究は、既存の画像復号法で無視される2つの問題を特定する。
本論文では,画像復号化を支援するShapeMoire法を提案する。
論文 参考訳(メタデータ) (2024-04-28T12:12:08Z) - AltFreezing for More General Video Face Forgery Detection [138.5732617371004]
顔偽造検出のための1つのモデルにおいて,空間的および見えない時間的アーティファクトの両方をキャプチャすることを提案する。
より一般的な顔偽造検出のためのAltFreezingと呼ばれる新しいトレーニング戦略を提案する。
論文 参考訳(メタデータ) (2023-07-17T08:24:58Z) - Pyramid Texture Filtering [86.15126028139736]
目立った構造を保ちながらテクスチャをスムーズにするための,シンプルだが効果的な手法を提案する。
ガウスピラミッドの粗いレベルは、しばしば自然にテクスチャを排除し、主要な画像構造を要約する。
本手法は, 異なるスケール, 局所的なコントラスト, 形状のテクスチャから構造を分離する上で, 構造劣化や視覚的アーティファクトの導入を伴わずに有効であることを示す。
論文 参考訳(メタデータ) (2023-05-11T02:05:30Z) - GAN2X: Non-Lambertian Inverse Rendering of Image GANs [85.76426471872855]
GAN2Xは、教師なし画像のみをトレーニングに使用する、教師なし逆レンダリングの新しい手法である。
3次元形状を主眼とする従来のShape-from-GANアプローチとは異なり、GANが生成した擬似ペアデータを利用して、非ランベルト材料特性を復元する試みは初めてである。
実験により, GAN2Xは2次元画像を3次元形状, アルベド, 特異な特性に正確に分解し, 教師なしの単視3次元顔再構成の最先端性能を実現することができた。
論文 参考訳(メタデータ) (2022-06-18T16:58:49Z) - ARF: Artistic Radiance Fields [63.79314417413371]
本稿では,任意のスタイル画像の芸術的特徴を3Dシーンに転送する方法を提案する。
点雲やメッシュ上で3次元スタイリングを行う従来の手法は、幾何的再構成誤差に敏感である。
より頑健なラディアンス場表現の体系化を提案する。
論文 参考訳(メタデータ) (2022-06-13T17:55:31Z) - Ensembling with Deep Generative Views [72.70801582346344]
生成モデルは、色やポーズの変化などの現実世界の変動を模倣する人工画像の「ビュー」を合成することができる。
そこで本研究では, 画像分類などの下流解析作業において, 実画像に適用できるかどうかを検討する。
StyleGAN2を再生増強の源として使用し、顔の属性、猫の顔、車を含む分類タスクについてこの設定を調査します。
論文 参考訳(メタデータ) (2021-04-29T17:58:35Z) - GIRAFFE: Representing Scenes as Compositional Generative Neural Feature
Fields [45.21191307444531]
深部生成モデルは、高解像度で光リアルな画像合成を可能にする。
しかし、多くのアプリケーションにとって、これは十分ではない。コンテンツ生成も制御可能である必要がある。
我々のキーとなる仮説は、構成的な3Dシーン表現を生成モデルに組み込むことにより、より制御可能な画像合成につながるというものである。
論文 参考訳(メタデータ) (2020-11-24T14:14:15Z) - Leveraging Frequency Analysis for Deep Fake Image Recognition [35.1862941141084]
ディープニューラルネットワークは驚くべきほどリアルな画像を生成することができるため、人間が実際の写真と区別するのはしばしば困難である。
これらの成果は主にGAN(Generative Adversarial Networks)によって実現されている。
本稿では、周波数空間において、GAN生成した画像は、容易に識別できる重いアーティファクトを示すことを示す。
論文 参考訳(メタデータ) (2020-03-19T11:06:54Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。