論文の概要: Enhancement of Anime Imaging Enlargement using Modified Super-Resolution
CNN
- arxiv url: http://arxiv.org/abs/2110.02321v1
- Date: Tue, 5 Oct 2021 19:38:50 GMT
- ステータス: 処理完了
- システム内更新日: 2021-10-07 14:16:16.335658
- Title: Enhancement of Anime Imaging Enlargement using Modified Super-Resolution
CNN
- Title(参考訳): 修正超解像CNNによるアニメ画像の拡張
- Authors: Tanakit Intaniyom, Warinthorn Thananporn, and Kuntpong Woraratpanya
- Abstract要約: 本稿では,画像の特徴を抽出し,画像を拡大し,アニメ画像の品質を高めるために,畳み込みニューラルネットワークに基づくモデルを提案する。
実験の結果,既存の画像拡大法やSRCNN法と比較すると,画像サイズを大きくして画像品質を向上させることができた。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by-nc-sa/4.0/
- Abstract: Anime is a storytelling medium similar to movies and books. Anime images are
a kind of artworks, which are almost entirely drawn by hand. Hence, reproducing
existing Anime with larger sizes and higher quality images is expensive.
Therefore, we proposed a model based on convolutional neural networks to
extract outstanding features of images, enlarge those images, and enhance the
quality of Anime images. We trained the model with a training set of 160 images
and a validation set of 20 images. We tested the trained model with a testing
set of 20 images. The experimental results indicated that our model
successfully enhanced the image quality with a larger image-size when compared
with the common existing image enlargement and the original SRCNN method.
- Abstract(参考訳): アニメは映画や本に似たストーリーテリングメディアである。
アニメのイメージは一種のアートワークであり、ほとんどすべて手で描いている。
そのため、大型で高画質のアニメを再現することは高価である。
そこで我々は,畳み込みニューラルネットワークに基づくモデルを提案し,画像の特徴を抽出し,画像を拡大し,アニメ画像の品質を向上させる。
モデルを160画像のトレーニングセットと20画像の検証セットでトレーニングした。
トレーニングされたモデルを20枚の画像でテストしました。
実験結果から,既存の画像拡大法やSRCNN法と比較して,画像サイズを大きくして画像品質を向上させることができた。
関連論文リスト
- Enhanced Anime Image Generation Using USE-CMHSA-GAN [0.0]
本稿では,高品質なアニメキャラクタ画像を生成するために,新しいジェネレーティブ・アドバイサル・ネットワークモデルUSE-CMHSA-GANを提案する。
アニメ対面データセットを用いて実験を行い, USE-CMHSA-GANが他のベンチマークモデルより優れていることを示した。
論文 参考訳(メタデータ) (2024-11-17T21:25:24Z) - PrefPaint: Aligning Image Inpainting Diffusion Model with Human Preference [62.72779589895124]
画像インペイントのための拡散モデルと人間の審美基準との整合性を、強化学習フレームワークを用いて初めて試みる。
我々は、人間の好みを付加した約51,000枚の画像からなるデータセットで報酬モデルを訓練する。
画像拡張や3次元再構成などの下流タスクの塗装比較実験により, 提案手法の有効性が示された。
論文 参考訳(メタデータ) (2024-10-29T11:49:39Z) - Illustrious: an Open Advanced Illustration Model [7.428509329724737]
我々は,高解像度,ダイナミックカラーレンジ画像,高復元性を実現するために,Illustriousと呼ばれるテキスト・ツー・イメージ画像生成モデルを開発した。
まず、バッチサイズとドロップアウト制御の重要性を探求し、制御可能なトークンベースの概念アクティベーションの学習を高速化する。
第2に、画像のトレーニング精度を高め、文字解剖の正確な描写をはるかに高解像度にし、適切な方法で20MP以上の生成能力を拡張した。
論文 参考訳(メタデータ) (2024-09-30T04:59:12Z) - Autoregressive Model Beats Diffusion: Llama for Scalable Image Generation [52.509092010267665]
我々はLlamaGenを紹介した。LlamaGenは画像生成モデルの新しいファミリーで、視覚生成ドメインに対して、大規模言語モデルのオリジナルの次世代予測のパラダイムを適用している。
これは、例えば、視覚信号に誘導バイアスのないバニラ自己回帰モデルが、適切にスケーリングすれば最先端の画像生成性能を達成できるかどうか、肯定的な答えである。
論文 参考訳(メタデータ) (2024-06-10T17:59:52Z) - Improving face generation quality and prompt following with synthetic captions [57.47448046728439]
画像から正確な外観記述を生成するために,トレーニング不要のパイプラインを導入する。
次に、これらの合成キャプションを使用して、テキストから画像への拡散モデルを微調整する。
提案手法は,高品質で現実的な人間の顔を生成するモデルの能力を大幅に向上させることを示す。
論文 参考訳(メタデータ) (2024-05-17T15:50:53Z) - xT: Nested Tokenization for Larger Context in Large Images [79.37673340393475]
xTは、グローバルコンテキストを局所的な詳細で集約するビジョントランスフォーマーのフレームワークである。
我々は、挑戦的な分類タスクにおいて、精度を最大8.6%向上させることができる。
論文 参考訳(メタデータ) (2024-03-04T10:29:58Z) - APISR: Anime Production Inspired Real-World Anime Super-Resolution [15.501488335115269]
我々は,手描きフレームの繰り返し使用により,映像ネットワークやデータセットはアニメSRでは不要であると主張している。
代わりに,ビデオソースから最も圧縮され,最も情報に富んだフレームを選択することにより,アニメ画像収集パイプラインを提案する。
提案手法は,公開ベンチマークによる広範囲な実験により評価され,最先端のアニメデータセット学習手法よりも優れていた。
論文 参考訳(メタデータ) (2024-03-03T19:52:43Z) - Emu: Enhancing Image Generation Models Using Photogenic Needles in a
Haystack [75.00066365801993]
Webスケールの画像-テキストペアによるテキスト-画像モデルのトレーニングにより、テキストから幅広い視覚概念を生成することができる。
これらの事前訓練されたモデルは、高度に美的な画像を生成することに関して、しばしば課題に直面します。
本稿では,高度に視覚的に魅力的な画像のみを生成するために,事前学習されたモデルを誘導する品質チューニングを提案する。
論文 参考訳(メタデータ) (2023-09-27T17:30:19Z) - Generative Adversarial Networks for photo to Hayao Miyazaki style
cartoons [0.0]
そこで我々は,Studio Ghibliの宮崎早夫の作品から60万枚以上の画像を用いてGAN(Generative Adversial Network)を訓練した。
本モデルでは,マンガに類似した平均的最先端手法について検討した。
論文 参考訳(メタデータ) (2020-05-15T19:26:11Z) - Unsupervised Real Image Super-Resolution via Generative Variational
AutoEncoder [47.53609520395504]
古典的な例に基づく画像超解法を再考し、知覚的画像超解法のための新しい生成モデルを考案する。
本稿では,変分オートエンコーダを用いた共同画像デノベーションと超解像モデルを提案する。
判別器の助けを借りて、超分解能サブネットワークのオーバーヘッドを加味して、分解された画像をフォトリアリスティックな視覚的品質で超解凍する。
論文 参考訳(メタデータ) (2020-04-27T13:49:36Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。