論文の概要: CoPE: Conditional image generation using Polynomial Expansions
- arxiv url: http://arxiv.org/abs/2104.05077v1
- Date: Sun, 11 Apr 2021 19:02:37 GMT
- ステータス: 処理完了
- システム内更新日: 2021-04-13 14:32:23.778432
- Title: CoPE: Conditional image generation using Polynomial Expansions
- Title(参考訳): CoPE:ポリノミアル展開を用いた条件付き画像生成
- Authors: Grigorios G Chrysos, Yannis Panagakis
- Abstract要約: 入力変数を2つ拡張し,それらの自己相関と相互相関をキャプチャする,copeと呼ばれる汎用フレームワークを導入する。
CoPEは8つのデータセットを含む5つのタスク(クラスジェネレーション、逆問題、エッジ・ツー・イメージ翻訳、イメージ・ツー・イメージ翻訳、属性誘導生成)で評価される。
徹底的な評価は、CoPEが多様な条件生成タスクに取り組むのに役立つことを示唆している。
- 参考スコア(独自算出の注目度): 50.67390290190874
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Generative modeling has evolved to a notable field of machine learning. Deep
polynomial neural networks (PNNs) have demonstrated impressive results in
unsupervised image generation, where the task is to map an input vector (i.e.,
noise) to a synthesized image. However, the success of PNNs has not been
replicated in conditional generation tasks, such as super-resolution. Existing
PNNs focus on single-variable polynomial expansions which do not fare well to
two-variable inputs, i.e., the noise variable and the conditional variable. In
this work, we introduce a general framework, called CoPE, that enables a
polynomial expansion of two input variables and captures their auto- and
cross-correlations. We exhibit how CoPE can be trivially augmented to accept an
arbitrary number of input variables. CoPE is evaluated in five tasks
(class-conditional generation, inverse problems, edges-to-image translation,
image-to-image translation, attribute-guided generation) involving eight
datasets. The thorough evaluation suggests that CoPE can be useful for tackling
diverse conditional generation tasks.
- Abstract(参考訳): 生成モデリングは機械学習の注目すべき分野へと進化してきた。
深い多項式ニューラルネットワーク(pnns)は教師なし画像生成において印象的な結果を示しており、タスクは入力ベクトル(すなわちノイズ)を合成画像にマッピングすることである。
しかし、PNNの成功は超解像のような条件付き生成タスクでは再現されていない。
既存の pnn は2変数の入力、すなわち雑音変数と条件変数によく合致しない単変数多項式展開にフォーカスしている。
本研究では,2つの入力変数の多項式展開を可能とし,それらの自動および相互相関をキャプチャする,CoPEと呼ばれる汎用フレームワークを提案する。
我々は、任意の数の入力変数を受け入れるために、CoPEを自明に拡張する方法を示す。
CoPEは8つのデータセットを含む5つのタスク(クラス条件生成、逆問題、エッジから画像への変換、画像から画像への変換、属性誘導生成)で評価される。
徹底的な評価は、CoPEが多様な条件生成タスクに取り組むのに役立つことを示唆している。
関連論文リスト
- Learning Structured Output Representations from Attributes using Deep
Conditional Generative Models [0.0]
本稿では,条件付き変分オートエンコーダアーキテクチャを再現し,属性を条件付き画像でトレーニングする。
毛髪の色や眼鏡などの特徴の異なる新しい顔と、異なる鳥類種のサンプルを創り出そうとする。
論文 参考訳(メタデータ) (2023-04-30T17:25:31Z) - Polynomial Implicit Neural Representations For Large Diverse Datasets [0.0]
Inlicit Neural representations (INR) は信号と画像の表現において大きな人気を得ている。
多くのINRアーキテクチャは正弦波位置符号化に依存しており、これはデータの高周波情報の原因となっている。
提案手法は,画像を関数で表現することでこのギャップに対処し,位置エンコーディングの必要性を解消する。
提案するPoly-INRモデルは, 畳み込み, 正規化, 自己アテンションを伴わずに, 最先端の生成モデルと同等に機能する。
論文 参考訳(メタデータ) (2023-03-20T20:09:46Z) - Signal Processing for Implicit Neural Representations [80.38097216996164]
Inlicit Neural Representation (INR)は、マルチ層パーセプトロンを介して連続したマルチメディアデータを符号化する。
既存の作業は、その離散化されたインスタンスの処理を通じて、そのような連続的な表現を操作する。
本稿では,INSP-Netと呼ばれる暗黙的ニューラル信号処理ネットワークを提案する。
論文 参考訳(メタデータ) (2022-10-17T06:29:07Z) - Optimizing Vision Transformers for Medical Image Segmentation and
Few-Shot Domain Adaptation [11.690799827071606]
我々はCS-Unet(Convolutional Swin-Unet)トランスフォーマーブロックを提案し、パッチ埋め込み、プロジェクション、フィードフォワードネットワーク、サンプリングおよびスキップ接続に関連する設定を最適化する。
CS-Unetはゼロからトレーニングすることができ、各機能プロセスフェーズにおける畳み込みの優位性を継承する。
実験によると、CS-Unetは事前トレーニングなしで、パラメータが少ない2つの医療用CTおよびMRIデータセットに対して、最先端の他のデータセットを大きなマージンで上回っている。
論文 参考訳(メタデータ) (2022-10-14T19:18:52Z) - Few-Shot Domain Adaptation with Polymorphic Transformers [50.128636842853155]
1セットの医療画像でトレーニングされたディープニューラルネットワーク(DNN)は、しばしば目に見えないテスト画像に対して深刻なパフォーマンス低下を経験する。
少数のアノテーションで訓練されたモデルを適用するという、ほとんどショットのドメイン適応は、この場合非常に実用的で有用である。
本稿では,任意のDNNバックボーンに組み込んだポリモルフィックトランス (Polymorphic Transformer) を提案する。
論文 参考訳(メタデータ) (2021-07-10T10:08:57Z) - XCiT: Cross-Covariance Image Transformers [73.33400159139708]
本稿では,トークンではなく機能チャネルをまたいで機能する自己注意の「伝達」バージョンを提案する。
その結果、XCAはトークン数に線形複雑さを持ち、高解像度画像の効率的な処理を可能にする。
論文 参考訳(メタデータ) (2021-06-17T17:33:35Z) - Locally Masked Convolution for Autoregressive Models [107.4635841204146]
LMConvは標準的な2Dコンボリューションの簡単な修正であり、任意のマスクを画像の各位置の重みに適用することができる。
我々は,パラメータを共有するが生成順序が異なる分布推定器のアンサンブルを学習し,全画像密度推定の性能を向上させる。
論文 参考訳(メタデータ) (2020-06-22T17:59:07Z) - Deep Polynomial Neural Networks [77.70761658507507]
$Pi$Netsは拡張に基づいた関数近似の新しいクラスである。
$Pi$Netsは、画像生成、顔検証、および3Dメッシュ表現学習という3つの困難なタスクで、最先端の結果を生成する。
論文 参考訳(メタデータ) (2020-06-20T16:23:32Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。