論文の概要: Semantic Pyramid for Image Generation
- arxiv url: http://arxiv.org/abs/2003.06221v2
- Date: Mon, 16 Mar 2020 14:31:49 GMT
- ステータス: 処理完了
- システム内更新日: 2022-12-24 01:12:25.965045
- Title: Semantic Pyramid for Image Generation
- Title(参考訳): 画像生成のための意味ピラミッド
- Authors: Assaf Shocher, Yossi Gandelsman, Inbar Mosseri, Michal Yarom, Michal
Irani, William T. Freeman and Tali Dekel
- Abstract要約: 本稿では,事前学習した分類モデルから学習した深部特徴空間を利用した新しいGANモデルを提案する。
古典的な画像ピラミッド表現に触発されて、我々はセマンティック・ジェネレーション・ピラミッドとしてモデルを構築した。
- 参考スコア(独自算出の注目度): 41.85213024720986
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: We present a novel GAN-based model that utilizes the space of deep features
learned by a pre-trained classification model. Inspired by classical image
pyramid representations, we construct our model as a Semantic Generation
Pyramid -- a hierarchical framework which leverages the continuum of semantic
information encapsulated in such deep features; this ranges from low level
information contained in fine features to high level, semantic information
contained in deeper features. More specifically, given a set of features
extracted from a reference image, our model generates diverse image samples,
each with matching features at each semantic level of the classification model.
We demonstrate that our model results in a versatile and flexible framework
that can be used in various classic and novel image generation tasks. These
include: generating images with a controllable extent of semantic similarity to
a reference image, and different manipulation tasks such as
semantically-controlled inpainting and compositing; all achieved with the same
model, with no further training.
- Abstract(参考訳): 本稿では,事前学習した分類モデルから学習した深部特徴空間を利用した新しいGANモデルを提案する。
古典的なイメージピラミッド表現に触発されて、我々はモデルを意味生成ピラミッドとして構築する。これは、このような深い特徴にカプセル化された意味情報の連続性を利用する階層的フレームワークであり、細かな特徴に含まれる低レベル情報から、深い特徴に含まれる高レベルな意味情報まで幅広い。
より具体的には、参照画像から抽出された特徴の集合を考慮し、分類モデルの各意味レベルで一致する特徴を持つ多様な画像サンプルを生成する。
我々は,このモデルが様々な古典的および新しい画像生成タスクで使用できる汎用的で柔軟なフレームワークをもたらすことを実証する。
参照画像とコントロール可能なセマンティックな類似性を持つ画像を生成すること、セマンティック制御されたインペイントやコンポジションのようなさまざまな操作タスク、これらはすべて同じモデルで達成され、それ以上のトレーニングは行われない。
関連論文リスト
- Masked Image Modeling Boosting Semi-Supervised Semantic Segmentation [38.55611683982936]
クラスごとに異なる画像領域を独立に再構成する新しいクラスワイド・マスク画像モデリングを提案する。
我々は,同一クラス内のマスキングと可視部分に対応する特徴間の距離を最小化する特徴集約戦略を開発する。
セマンティック空間において、正規化を強化するマスク付き画像モデリングの適用について検討する。
論文 参考訳(メタデータ) (2024-11-13T16:42:07Z) - Reinforcing Pre-trained Models Using Counterfactual Images [54.26310919385808]
本稿では,言語誘導型生成対実画像を用いた分類モデル強化のための新しいフレームワークを提案する。
逆ファクト画像データセットを用いてモデルをテストすることにより、モデルの弱点を同定する。
我々は、分類モデルを微調整し強化するために、デファクトイメージを拡張データセットとして採用する。
論文 参考訳(メタデータ) (2024-06-19T08:07:14Z) - Local and Global GANs with Semantic-Aware Upsampling for Image
Generation [201.39323496042527]
ローカルコンテキストを用いて画像を生成することを検討する。
セマンティックマップをガイダンスとして用いたクラス固有の生成ネットワークを提案する。
最後に,セマンティック・アウェア・アップサンプリング手法を提案する。
論文 参考訳(メタデータ) (2022-02-28T19:24:25Z) - Collaging Class-specific GANs for Semantic Image Synthesis [68.87294033259417]
本稿では,高分解能なセマンティック画像合成のための新しい手法を提案する。
1つのベースイメージジェネレータと複数のクラス固有のジェネレータで構成される。
実験により,本手法は高解像度で高品質な画像を生成することができることが示された。
論文 参考訳(メタデータ) (2021-10-08T17:46:56Z) - Learning to Compose Hypercolumns for Visual Correspondence [57.93635236871264]
本稿では,画像に条件付けされた関連レイヤを活用することで,動的に効率的な特徴を構成する視覚対応手法を提案する。
提案手法はダイナミックハイパーピクセルフロー(Dynamic Hyperpixel Flow)と呼ばれ,深層畳み込みニューラルネットワークから少数の関連層を選択することにより,高速にハイパーカラム機能を構成することを学習する。
論文 参考訳(メタデータ) (2020-07-21T04:03:22Z) - Generating Annotated High-Fidelity Images Containing Multiple Coherent
Objects [10.783993190686132]
コンテキスト情報を明示的に必要とせずに、複数のオブジェクトで画像を合成できるマルチオブジェクト生成フレームワークを提案する。
我々は,Multi-MNISTおよびCLEVRデータセットを用いた実験により,コヒーレンシーと忠実さの保存方法を示す。
論文 参考訳(メタデータ) (2020-06-22T11:33:55Z) - Hierarchical Image Classification using Entailment Cone Embeddings [68.82490011036263]
まずラベル階層の知識を任意のCNNベースの分類器に注入する。
画像からの視覚的セマンティクスと組み合わせた外部セマンティクス情報の利用が全体的な性能を高めることを実証的に示す。
論文 参考訳(メタデータ) (2020-04-02T10:22:02Z) - Learning Representations For Images With Hierarchical Labels [1.3579420996461438]
クラスラベルによって誘導されるセマンティック階層に関する情報を活用するための一連の手法を提案する。
画像からの視覚的セマンティクスと組み合わせた外部セマンティクス情報の提供により、全体的な性能が向上することを示す。
しかし,CNN分類器には階層的な情報が注入され,組込みベースモデルでは,新たに提示された実世界ETHエコロジーコレクションイメージデータセットの階層非依存モデルよりも優れていた。
論文 参考訳(メタデータ) (2020-04-02T09:56:03Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。