論文の概要: Generative Adversarial Networks for photo to Hayao Miyazaki style
cartoons
- arxiv url: http://arxiv.org/abs/2005.07702v1
- Date: Fri, 15 May 2020 19:26:11 GMT
- ステータス: 処理完了
- システム内更新日: 2022-12-02 23:53:49.279277
- Title: Generative Adversarial Networks for photo to Hayao Miyazaki style
cartoons
- Title(参考訳): 宮崎早雄風漫画への写真制作のためのジェネレーティブ・アドバイサル・ネットワーク
- Authors: Filip Andersson, Simon Arvidsson
- Abstract要約: そこで我々は,Studio Ghibliの宮崎早夫の作品から60万枚以上の画像を用いてGAN(Generative Adversial Network)を訓練した。
本モデルでは,マンガに類似した平均的最先端手法について検討した。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: This paper takes on the problem of transferring the style of cartoon images
to real-life photographic images by implementing previous work done by
CartoonGAN. We trained a Generative Adversial Network(GAN) on over 60 000
images from works by Hayao Miyazaki at Studio Ghibli. To evaluate our results,
we conducted a qualitative survey comparing our results with two
state-of-the-art methods. 117 survey results indicated that our model on
average outranked state-of-the-art methods on cartoon-likeness.
- Abstract(参考訳): 本稿では,CartoonGAN による以前の作業により,漫画のスタイルを実写写真に変換する問題について考察する。
そこで我々は,Studio Ghibliの宮崎早夫の作品から60万枚以上の画像を用いてGAN(Generative Adversial Network)を訓練した。
その結果を2つの最先端手法と比較した定性的な調査を行った。
117 人の調査結果から,我々のモデルはマンガ的な手法を平均上回っていることがわかった。
関連論文リスト
- Sakuga-42M Dataset: Scaling Up Cartoon Research [4.676528353567339]
作画42Mは、多種多様の芸術様式・地域・年号を網羅した4400万文を包括的意味論で構成している。
我々のモチベーションは、漫画研究に大規模スケーリングを導入し、将来の漫画応用における一般化と堅牢性を促進することである。
論文 参考訳(メタデータ) (2024-05-13T01:50:05Z) - Emu Video: Factorizing Text-to-Video Generation by Explicit Image Conditioning [59.01091079005586]
生成を2段階に分解するテキスト・ツー・ビデオ生成モデルであるEmu Videoを提案する。
重要設計決定 - 拡散のための調整されたノイズスケジュールと多段階訓練-を同定する。
人間の評価では、生成したビデオは、以前のすべての作業と比べて、品質が強く優先される。
論文 参考訳(メタデータ) (2023-11-17T18:59:04Z) - Automatic Animation of Hair Blowing in Still Portrait Photos [61.54919805051212]
静止画写真における人間の毛髪をアニメーション化するための新しいアプローチを提案する。
毛髪構造の複雑さを考慮し, 毛髪抽出を事例分割問題として, 革新的に扱う。
そこで本研究では, 毛髪を目立たせることなく, 快楽な動きで操作できるwisp対応アニメーションモジュールを提案する。
論文 参考訳(メタデータ) (2023-09-25T15:11:40Z) - Generating Animatable 3D Cartoon Faces from Single Portraits [51.15618892675337]
1枚のポートレート画像からアニマタブルな3Dマンガの顔を生成するための新しい枠組みを提案する。
本研究では,3次元マンガの顔のテクスチャを再現する2段階再構築手法を提案する。
最後に,手作業によるテンプレート作成と変形伝達に基づく意味保存顔リギング手法を提案する。
論文 参考訳(メタデータ) (2023-07-04T04:12:50Z) - Sketch2Saliency: Learning to Detect Salient Objects from Human Drawings [99.9788496281408]
本研究では,スケッチを弱いラベルとして使用して,画像中の有能な物体を検出する方法について検討する。
これを実現するために,与えられた視覚写真に対応する逐次スケッチ座標を生成することを目的としたフォト・ツー・スケッチ生成モデルを提案する。
テストは、私たちの仮説を証明し、スケッチベースの唾液度検出モデルが、最先端技術と比較して、競争力のあるパフォーマンスを提供する方法を明確にします。
論文 参考訳(メタデータ) (2023-03-20T23:46:46Z) - CNNs and Transformers Perceive Hybrid Images Similar to Humans [47.64219291655723]
深層学習視覚モデルの予測は、ハイブリッド画像の人間の知覚と定性的に一致していることを示す。
我々の結果は、畳み込みニューラルネットワーク(CNN)とトランスフォーマー(Transformer)が、視覚野の腹側の流れにおける情報のフィードフォワードスイープのモデル化に長けているという仮説を支持する新たな証拠を提供する。
論文 参考訳(メタデータ) (2022-03-19T21:37:07Z) - Enhancement of Anime Imaging Enlargement using Modified Super-Resolution
CNN [0.0]
本稿では,画像の特徴を抽出し,画像を拡大し,アニメ画像の品質を高めるために,畳み込みニューラルネットワークに基づくモデルを提案する。
実験の結果,既存の画像拡大法やSRCNN法と比較すると,画像サイズを大きくして画像品質を向上させることができた。
論文 参考訳(メタデータ) (2021-10-05T19:38:50Z) - NTIRE 2021 Challenge on Perceptual Image Quality Assessment [128.83256694901726]
NTIRE 2021の知覚画像品質評価(IQA)に関する課題について報告する。
CVPR 2021では、画像修復・強化ワークショップ(NTIRE)のNew Trendsと連携して開催されました。
新しいタイプの画像処理技術として、GAN(Generative Adversarial Networks)に基づく知覚画像処理アルゴリズムが、より現実的なテクスチャを持つ画像を生成する。
論文 参考訳(メタデータ) (2021-05-07T05:36:54Z) - toon2real: Translating Cartoon Images to Realistic Images [1.4419517737536707]
このタスクを実行するためにいくつかの最先端モデルを適用するが、高品質な翻訳には失敗する。
本稿では,漫画領域からフォトリアリスティック領域への画像変換のためのCycleGANモデルに基づく手法を提案する。
実験の結果を実証し,提案手法が他の最先端技術であるUNITと比較して最も低いFrechet Inception Distanceスコアと優れた結果を得たことを示す。
論文 参考訳(メタデータ) (2021-02-01T20:22:05Z) - Anime-to-Real Clothing: Cosplay Costume Generation via Image-to-Image
Translation [2.4660652494309936]
本稿では,画像から画像への変換に基づく衣装画像の自動生成手法を提案する。
本稿では、高品質なコスプレ画像生成を容易にするために、GAN(Generative Adversarial Network)のための新しいアーキテクチャを提案する。
実験により,2種類の評価指標を用いて,提案したGANは既存手法よりも優れた性能を示した。
論文 参考訳(メタデータ) (2020-08-26T10:34:46Z) - Words as Art Materials: Generating Paintings with Sequential GANs [8.249180979158815]
大規模な分散データセット上での芸術画像の生成について検討する。
このデータセットには、形状、色、内容など、バリエーションのあるイメージが含まれている。
本稿では,逐次生成適応型ネットワークモデルを提案する。
論文 参考訳(メタデータ) (2020-07-08T19:17:14Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。