論文の概要: Aligning Latent and Image Spaces to Connect the Unconnectable
- arxiv url: http://arxiv.org/abs/2104.06954v1
- Date: Wed, 14 Apr 2021 16:29:20 GMT
- ステータス: 処理完了
- システム内更新日: 2021-04-15 16:10:36.423695
- Title: Aligning Latent and Image Spaces to Connect the Unconnectable
- Title(参考訳): 接続不能を接続するための潜伏空間と画像空間の整列化
- Authors: Ivan Skorokhodov, Grigorii Sotnikov, Mohamed Elhoseiny
- Abstract要約: 我々は,多様で複雑なコンテンツを含む無限高分解能画像を生成する手法を開発した。
これは、画像空間とラテント空間に同期同値を持つ完全同変発生器に基づいている。
LHQ, LSUNタワー, LSUNブリッジのアプローチを検証し, ベースラインを少なくとも4倍に向上させた。
- 参考スコア(独自算出の注目度): 22.90522514729253
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: In this work, we develop a method to generate infinite high-resolution images
with diverse and complex content. It is based on a perfectly equivariant
generator with synchronous interpolations in the image and latent spaces.
Latent codes, when sampled, are positioned on the coordinate grid, and each
pixel is computed from an interpolation of the nearby style codes. We modify
the AdaIN mechanism to work in such a setup and train the generator in an
adversarial setting to produce images positioned between any two latent
vectors. At test time, this allows for generating complex and diverse infinite
images and connecting any two unrelated scenes into a single arbitrarily large
panorama. Apart from that, we introduce LHQ: a new dataset of \lhqsize
high-resolution nature landscapes. We test the approach on LHQ, LSUN Tower and
LSUN Bridge and outperform the baselines by at least 4 times in terms of
quality and diversity of the produced infinite images. The project page is
located at https://universome.github.io/alis.
- Abstract(参考訳): 本研究では,多様で複雑なコンテンツを含む無限高分解能画像を生成する手法を開発した。
これは、画像と潜在空間に同期的な補間を持つ完全同変発生器に基づいている。
潜時符号は、サンプリングされると座標格子上に位置決めされ、各画素は、近傍のスタイル符号の補間から計算される。
我々は、AdaIN機構をこのような設定で動作させ、逆の設定でジェネレータを訓練し、2つの潜伏ベクトルの間に位置する画像を生成する。
テスト時には、複雑で多様な無限の画像を生成し、2つの無関係なシーンを任意に大きなパノラマに繋げることができる。
これとは別に、高解像度の自然景観を示す新しいデータセットであるLHQを紹介します。
LHQ, LSUN Tower, LSUN Bridgeのアプローチを検証し, 生成した無限画像の品質と多様性に関して, ベースラインを少なくとも4倍上回った。
プロジェクトページはhttps://universome.github.io/alisにある。
関連論文リスト
- MULAN: A Multi Layer Annotated Dataset for Controllable Text-to-Image Generation [54.64194935409982]
44K MUlti-Layer-wise RGBA 分解からなる新しいデータセット MuLAn を紹介する。
MuLAnは、高品質な画像のインスタンス分解と空間情報を提供する最初のフォトリアリスティックなリソースである。
我々は,新しい生成・編集技術,特にレイヤワイドソリューションの開発を促進することを目的としている。
論文 参考訳(メタデータ) (2024-04-03T14:58:00Z) - CoordFill: Efficient High-Resolution Image Inpainting via Parameterized
Coordinate Querying [52.91778151771145]
本稿では,近年の連続的暗黙表現の発達により,その限界を初めて破ろうとする。
実験の結果,提案手法はGTX 2080 Ti GPUを用いて2048$times$2048の画像をリアルタイムに処理できることがわかった。
論文 参考訳(メタデータ) (2023-03-15T11:13:51Z) - High-Resolution GAN Inversion for Degraded Images in Large Diverse
Datasets [39.21692649763314]
本稿では,StyleGAN-XLの強力な生成能力を利用した新しいGANインバージョンフレームワークを提案する。
StyleGAN-XLによる逆問題を軽減するために、Clustering & Regularize Inversion (CRI)を提案する。
我々は、複雑な自然画像の複数の復元作業(例えば、塗装、着色、超解像)において、CRI方式を検証し、定量的および定性的な結果を示す。
論文 参考訳(メタデータ) (2023-02-07T11:24:11Z) - Conditional Progressive Generative Adversarial Network for satellite
image generation [0.7734726150561089]
画像生成タスクを、3つのコーナーのうち1つが欠落している画像の完了として定式化する。
次に、このアプローチを拡張して、同じレベルのディテールで大きなイメージを反復的に構築します。
我々のゴールは、衛星画像データセットで典型的に見られる高解像度のサンプルを生成するためのスケーラブルな方法論を得ることである。
論文 参考訳(メタデータ) (2022-11-28T13:33:53Z) - Any-resolution Training for High-resolution Image Synthesis [55.19874755679901]
生成モデルは、様々な大きさの自然画像であっても、一定の解像度で動作します。
すべてのピクセルが重要であり、そのネイティブ解像度で収集された可変サイズのイメージを持つデータセットを作成する、と我々は主張する。
ランダムなスケールでパッチをサンプリングし、可変出力解像度で新しいジェネレータを訓練するプロセスである。
論文 参考訳(メタデータ) (2022-04-14T17:59:31Z) - Local and Global GANs with Semantic-Aware Upsampling for Image
Generation [201.39323496042527]
ローカルコンテキストを用いて画像を生成することを検討する。
セマンティックマップをガイダンスとして用いたクラス固有の生成ネットワークを提案する。
最後に,セマンティック・アウェア・アップサンプリング手法を提案する。
論文 参考訳(メタデータ) (2022-02-28T19:24:25Z) - Collaging Class-specific GANs for Semantic Image Synthesis [68.87294033259417]
本稿では,高分解能なセマンティック画像合成のための新しい手法を提案する。
1つのベースイメージジェネレータと複数のクラス固有のジェネレータで構成される。
実験により,本手法は高解像度で高品質な画像を生成することができることが示された。
論文 参考訳(メタデータ) (2021-10-08T17:46:56Z) - InfinityGAN: Towards Infinite-Resolution Image Synthesis [92.40782797030977]
任意の解像度画像を生成するinfinityganを提案する。
少ない計算資源でパッチバイパッチをシームレスに訓練し、推論する方法を示す。
論文 参考訳(メタデータ) (2021-04-08T17:59:30Z) - Using latent space regression to analyze and leverage compositionality
in GANs [33.381584322411626]
GANの組成特性を理解するためのプローブとして潜在空間への回帰を研究する。
reressorとプリトレーニングされたジェネレータを組み合わせることで、強いイメージを事前に提供し、複合イメージを作成できることが分かりました。
回帰アプローチは,潜在空間での直接編集と比較して,個々の画像部分の局所的な編集を可能にする。
論文 参考訳(メタデータ) (2021-03-18T17:58:01Z) - Adversarial Generation of Continuous Images [31.92891885615843]
本稿では,INRに基づく画像デコーダ構築のための2つの新しいアーキテクチャ手法を提案する。
私たちは、最先端の連続画像GANを構築するためにそれらを使用します。
提案したINR-GANアーキテクチャは連続画像生成装置の性能を数倍改善する。
論文 参考訳(メタデータ) (2020-11-24T11:06:40Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。