論文の概要: InfinityGAN: Towards Infinite-Resolution Image Synthesis
- arxiv url: http://arxiv.org/abs/2104.03963v1
- Date: Thu, 8 Apr 2021 17:59:30 GMT
- ステータス: 処理完了
- システム内更新日: 2021-04-09 13:01:43.604983
- Title: InfinityGAN: Towards Infinite-Resolution Image Synthesis
- Title(参考訳): InfinityGAN:無限解像合成を目指して
- Authors: Chieh Hubert Lin, Hsin-Ying Lee, Yen-Chi Cheng, Sergey Tulyakov,
Ming-Hsuan Yang
- Abstract要約: 任意の解像度画像を生成するinfinityganを提案する。
少ない計算資源でパッチバイパッチをシームレスに訓練し、推論する方法を示す。
- 参考スコア(独自算出の注目度): 92.40782797030977
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: We present InfinityGAN, a method to generate arbitrary-resolution images. The
problem is associated with several key challenges. First, scaling existing
models to a high resolution is resource-constrained, both in terms of
computation and availability of high-resolution training data. Infinity-GAN
trains and infers patch-by-patch seamlessly with low computational resources.
Second, large images should be locally and globally consistent, avoid
repetitive patterns, and look realistic. To address these, InfinityGAN takes
global appearance, local structure and texture into account.With this
formulation, we can generate images with resolution and level of detail not
attainable before. Experimental evaluation supports that InfinityGAN generates
imageswith superior global structure compared to baselines at the same time
featuring parallelizable inference. Finally, we how several applications
unlocked by our approach, such as fusing styles spatially, multi-modal
outpainting and image inbetweening at arbitrary input and output resolutions
- Abstract(参考訳): 任意の解像度画像を生成するinfinityganを提案する。
この問題はいくつかの重要な課題と関連している。
第一に、既存のモデルを高解像度にスケールすることは、計算と高解像度のトレーニングデータの可用性の両面でリソースに制約される。
Infinity-GANは、低い計算資源とシームレスにパッチ・バイ・パッチを訓練し、推測する。
第二に、大きな画像は局所的でグローバルに一貫性があり、反復的なパターンを避け、リアルに見えるべきである。
これらの問題に対処するために、InfinityGANはグローバルな外観、局所構造、テクスチャを考慮に入れ、この定式化により、これまで達成できなかった解像度とディテールのレベルで画像を生成することができる。
InfinityGANは、並列化可能な推論を特徴とするベースラインよりも優れたグローバル構造を持つ画像を生成する。
最後に, 任意の入力と出力解像度での空間的, マルチモーダルなアウトペインティング, 画像のインタクションなど, 本手法でアンロックされたいくつかのアプリケーションについて述べる。
関連論文リスト
- High-Resolution Frame Interpolation with Patch-based Cascaded Diffusion [44.52838839928787]
フレームのためのパッチベースのカスケード画素拡散モデルHiFIを提案する。
我々はHiFIがグローバルなコンテキストを必要とする高解像度で複雑なテクスチャを実現するのに有効であることを示す。
また、この手法は、推論時にメモリ使用量を劇的に削減し、また、テスト時に単一のモデルを使用することを可能にする。
論文 参考訳(メタデータ) (2024-10-15T17:59:04Z) - Beyond LLaVA-HD: Diving into High-Resolution Large Multimodal Models [44.437693135170576]
我々は、高度化タスク付きLMM、局所画像圧縮、グローバルエキスパートの混合(SliME)を提案する。
我々は,異なるタスクにおいて異なるアダプタが優れているという観察に基づいて,アダプタの混合を用いてグローバルビューからコンテキスト情報を抽出する。
提案手法は,200万のトレーニングデータのみを用いて,様々なベンチマークにおいて先行的な性能を実現する。
論文 参考訳(メタデータ) (2024-06-12T17:59:49Z) - Distance Weighted Trans Network for Image Completion [52.318730994423106]
本稿では,DWT(Distance-based Weighted Transformer)を利用した画像コンポーネント間の関係をよりよく理解するためのアーキテクチャを提案する。
CNNは、粗い事前の局所的なテクスチャ情報を強化するために使用される。
DWTブロックは、特定の粗いテクスチャやコヒーレントな視覚構造を復元するために使用される。
論文 参考訳(メタデータ) (2023-10-11T12:46:11Z) - High-Resolution GAN Inversion for Degraded Images in Large Diverse
Datasets [39.21692649763314]
本稿では,StyleGAN-XLの強力な生成能力を利用した新しいGANインバージョンフレームワークを提案する。
StyleGAN-XLによる逆問題を軽減するために、Clustering & Regularize Inversion (CRI)を提案する。
我々は、複雑な自然画像の複数の復元作業(例えば、塗装、着色、超解像)において、CRI方式を検証し、定量的および定性的な結果を示す。
論文 参考訳(メタデータ) (2023-02-07T11:24:11Z) - Learning Enriched Features for Fast Image Restoration and Enhancement [166.17296369600774]
本稿では,ネットワーク全体を通して空間的精度の高い高解像度表現を維持することを目的とする。
我々は、高解像度の空間的詳細を同時に保存しながら、複数のスケールからの文脈情報を組み合わせた豊富な特徴集合を学習する。
提案手法は,デフォーカス・デブロアリング,画像デノイング,超解像,画像強調など,さまざまな画像処理タスクに対して,最先端の処理結果を実現する。
論文 参考訳(メタデータ) (2022-04-19T17:59:45Z) - Any-resolution Training for High-resolution Image Synthesis [55.19874755679901]
生成モデルは、様々な大きさの自然画像であっても、一定の解像度で動作します。
すべてのピクセルが重要であり、そのネイティブ解像度で収集された可変サイズのイメージを持つデータセットを作成する、と我々は主張する。
ランダムなスケールでパッチをサンプリングし、可変出力解像度で新しいジェネレータを訓練するプロセスである。
論文 参考訳(メタデータ) (2022-04-14T17:59:31Z) - Efficient texture-aware multi-GAN for image inpainting [5.33024001730262]
近年のGAN (Generative Adversarial Network) のインペイント手法は顕著に改善されている。
本稿では,性能とレンダリング効率の両方を改善するマルチGANアーキテクチャを提案する。
論文 参考訳(メタデータ) (2020-09-30T14:58:03Z) - PULSE: Self-Supervised Photo Upsampling via Latent Space Exploration of
Generative Models [77.32079593577821]
PULSE (Photo Upsampling via Latent Space Exploration) は、それまで文献になかった解像度で高解像度でリアルな画像を生成する。
本手法は, 従来よりも高分解能, スケールファクターの知覚品質において, 最先端の手法よりも優れていた。
論文 参考訳(メタデータ) (2020-03-08T16:44:31Z) - Gated Fusion Network for Degraded Image Super Resolution [78.67168802945069]
本稿では,基本特徴と回復特徴を別々に抽出する二分岐畳み込みニューラルネットワークを提案する。
特徴抽出ステップを2つのタスク非依存ストリームに分解することで、デュアルブランチモデルがトレーニングプロセスを容易にすることができる。
論文 参考訳(メタデータ) (2020-03-02T13:28:32Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。