論文の概要: Controlled GAN-Based Creature Synthesis via a Challenging Game Art
Dataset -- Addressing the Noise-Latent Trade-Off
- arxiv url: http://arxiv.org/abs/2108.08922v1
- Date: Thu, 19 Aug 2021 21:31:20 GMT
- ステータス: 処理完了
- システム内更新日: 2021-08-24 00:08:01.612115
- Title: Controlled GAN-Based Creature Synthesis via a Challenging Game Art
Dataset -- Addressing the Noise-Latent Trade-Off
- Title(参考訳): カオスゲームアートデータセットによる制御されたGANに基づく創造的合成 -ノイズラテックトレーディング-
- Authors: Vaibhav Vavilala and David Forsyth
- Abstract要約: 最先端のStyleGAN2ネットワークは、アートの作成と編集のための強力なメソッドをサポートしている。
これらの手法をカードアートの合成に適用し,新しいYu-Gi-Ohデータセットをトレーニングする。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: The state-of-the-art StyleGAN2 network supports powerful methods to create
and edit art, including generating random images, finding images "like" some
query, and modifying content or style. Further, recent advancements enable
training with small datasets. We apply these methods to synthesize card art, by
training on a novel Yu-Gi-Oh dataset. While noise inputs to StyleGAN2 are
essential for good synthesis, we find that, for small datasets, coarse-scale
noise interferes with latent variables because both control long-scale image
effects. We observe over-aggressive variation in art with changes in noise and
weak content control via latent variable edits. Here, we demonstrate that
training a modified StyleGAN2, where coarse-scale noise is suppressed, removes
these unwanted effects. We obtain a superior FID; changes in noise result in
local exploration of style; and identity control is markedly improved. These
results and analysis lead towards a GAN-assisted art synthesis tool for digital
artists of all skill levels, which can be used in film, games, or any creative
industry for artistic ideation.
- Abstract(参考訳): 最先端のStyleGAN2ネットワークは、ランダムな画像の生成、画像の"like"検索、コンテンツやスタイルの変更など、アートの作成と編集の強力な方法をサポートしている。
さらに、最近の進歩により、小さなデータセットによるトレーニングが可能になる。
これらの手法をカードアートの合成に適用し,新しいYu-Gi-Ohデータセットをトレーニングする。
StyleGAN2へのノイズ入力は良好な合成に不可欠であるが、小さなデータセットでは、どちらも長期画像効果を制御するため、粗いスケールノイズが潜伏変数に干渉する。
ノイズ変化を伴うアートの過回帰変動と潜在変数編集によるコンテンツ制御の弱さを観察する。
本稿では,粗大ノイズが抑制された修正stylegan2のトレーニングにより,これらの不要な効果が排除されることを示す。
我々は、優れたfid、ノイズの変化により、ローカルなスタイル探索が可能となり、アイデンティティ制御が著しく改善される。
これらの結果と分析は、あらゆるスキルレベルを持つデジタルアーティストのための、GAN支援のアート合成ツールへと導かれる。
関連論文リスト
- Hardness-Aware Scene Synthesis for Semi-Supervised 3D Object Detection [59.33188668341604]
3次元物体検出は、自律運転知覚の基本的なタスクとして機能する。
ポイントクラウドデータのための高品質なアノテーションを得るためには、コストがかかる。
本稿では,適応型合成シーンを生成するために,ハードネス対応シーン合成(HASS)手法を提案する。
論文 参考訳(メタデータ) (2024-05-27T17:59:23Z) - EchoScene: Indoor Scene Generation via Information Echo over Scene Graph Diffusion [77.0556470600979]
シーングラフ上に3次元屋内シーンを生成する対話型かつ制御可能な生成モデルであるEchoSceneを提案する。
既存の手法では、様々なノード数、複数のエッジの組み合わせ、マニピュレータによるノードエッジ操作によるシーングラフの処理に苦労している。
論文 参考訳(メタデータ) (2024-05-02T00:04:02Z) - NoisyNN: Exploring the Influence of Information Entropy Change in
Learning Systems [25.05692528736342]
本研究では,特定の条件下での各種深層建築物の性能向上効果を示す。
ノイズが作業の複雑さを軽減するのに役立つかどうかに基づいて、ノイズを正ノイズ(PN)と有害ノイズ(HN)の2つのタイプに分類する。
論文 参考訳(メタデータ) (2023-09-19T14:04:04Z) - DC-Art-GAN: Stable Procedural Content Generation using DC-GANs for
Digital Art [4.9631159466100305]
我々は,安定かつ異質なアートジェネレーションのために,敵対的な訓練を施した深層生成ネットワークのコンセプトを提唱する。
この研究は主に、DC-GAN(Deep Convolutional Generative Adversarial Network)の使用に焦点を当て、GANトレーニングにおける共通の落とし穴に対処する技術を探っている。
論文 参考訳(メタデータ) (2022-09-06T23:06:46Z) - Expanding the Latent Space of StyleGAN for Real Face Editing [4.1715767752637145]
セマンティックな操作に事前訓練されたStyleGANを使用するために、顔編集技術の急増が提案されている。
実際の画像を編集するには、最初に入力された画像をStyleGANの潜伏変数に変換する必要がある。
本稿では,低歪みと高編集性の間のトレードオフを断ち切るために,コンテンツ機能の追加により,StyleGANの潜伏空間を拡張する手法を提案する。
論文 参考訳(メタデータ) (2022-04-26T18:27:53Z) - Learning to Generate Realistic Noisy Images via Pixel-level Noise-aware
Adversarial Training [50.018580462619425]
我々は,PNGAN(Pixel-level Noise-aware Generative Adrial Network)という新しいフレームワークを提案する。
PNGANは、トレーニング済みのリアルデノイザーを使用して、フェイク画像とリアルノイズ画像をほぼノイズのないソリューション空間にマッピングする。
より優れたノイズフィッティングを実現するため,ジェネレータとしてSimple Multi-versa-scale Network (SMNet) を提案する。
論文 参考訳(メタデータ) (2022-04-06T14:09:02Z) - Practical Blind Image Denoising via Swin-Conv-UNet and Data Synthesis [148.16279746287452]
本研究では,残差畳み込み層の局所モデリング能力とスウィントランスブロックの非局所モデリング能力を組み込むスウィンコンブブロックを提案する。
トレーニングデータ合成のために,異なる種類のノイズを考慮した実用的なノイズ劣化モデルの設計を行う。
AGWN除去と実画像復号化の実験は、新しいネットワークアーキテクチャ設計が最先端の性能を達成することを実証している。
論文 参考訳(メタデータ) (2022-03-24T18:11:31Z) - Self-Distilled StyleGAN: Towards Generation from Internet Photos [47.28014076401117]
本稿では,インターネットから収集した未処理画像に対して,StyleGANをどのように適応させるかを示す。
本稿では,2つの主成分からなるスタイルGANを用いた自己蒸留法を提案する。
提案手法は,データの多様性の損失を最小限に抑えつつ,高品質な画像の生成を可能にする。
論文 参考訳(メタデータ) (2022-02-24T17:16:47Z) - You Only Need Adversarial Supervision for Semantic Image Synthesis [84.83711654797342]
我々は,高品質な結果を得るためには敵対的監督のみを必要とする,新しい簡易ganモデルを提案する。
本モデルによって合成された画像はより多様であり,実画像の色やテクスチャに密接に従っている。
論文 参考訳(メタデータ) (2020-12-08T23:00:48Z) - Towards Noise-resistant Object Detection with Noisy Annotations [119.63458519946691]
ディープオブジェクト検出器の訓練には、正確なオブジェクトラベルとバウンディングボックス座標を持つ、相当量の人間の注釈画像が必要である。
ノイズの多いアノテーションはずっと簡単にアクセスできますが、学習には有害かもしれません。
ノイズにはラベルノイズとバウンディングボックスノイズが混在している。
論文 参考訳(メタデータ) (2020-03-03T01:32:16Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。