論文の概要: FaceCook: Face Generation Based on Linear Scaling Factors
- arxiv url: http://arxiv.org/abs/2109.03492v1
- Date: Wed, 8 Sep 2021 08:31:40 GMT
- ステータス: 処理完了
- システム内更新日: 2021-09-10 00:18:07.245660
- Title: FaceCook: Face Generation Based on Linear Scaling Factors
- Title(参考訳): FaceCook: 線形スケーリング係数に基づく顔生成
- Authors: Tianren Wang, Can Peng, Teng Zhang, Brian Lovell
- Abstract要約: 生成モデルの潜在ベクトルをスケーリング因子にマッピングする新しい手法を提案する。
提案手法は,画像の多様性の観点から,ベースラインよりも優れる。
- 参考スコア(独自算出の注目度): 11.682904465909003
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: With the excellent disentanglement properties of state-of-the-art generative
models, image editing has been the dominant approach to control the attributes
of synthesised face images. However, these edited results often suffer from
artifacts or incorrect feature rendering, especially when there is a large
discrepancy between the image to be edited and the desired feature set.
Therefore, we propose a new approach to mapping the latent vectors of the
generative model to the scaling factors through solving a set of multivariate
linear equations. The coefficients of the equations are the eigenvectors of the
weight parameters of the pre-trained model, which form the basis of a hyper
coordinate system. The qualitative and quantitative results both show that the
proposed method outperforms the baseline in terms of image diversity. In
addition, the method is much more time-efficient because you can obtain
synthesised images with desirable features directly from the latent vectors,
rather than the former process of editing randomly generated images requiring
many processing steps.
- Abstract(参考訳): 最先端生成モデルの優れた絡み合い特性により,合成顔画像の属性を制御するために,画像編集が主流となっている。
しかし、これらの編集結果は、特に編集対象画像と所望の機能セットとの間に大きな相違がある場合、アーティファクトや不正確な特徴レンダリングに悩まされることが多い。
そこで本研究では,多変量線形方程式の組を解き,生成モデルの潜在ベクトルをスケーリング因子にマッピングする新しい手法を提案する。
方程式の係数は、事前学習されたモデルの重みパラメータの固有ベクトルであり、超座標系の基礎を形成する。
定性的および定量的な結果は,画像の多様性の観点から,提案手法がベースラインを上回っていることを示している。
さらに、多くの処理ステップを必要とするランダムに生成された画像を編集する以前のプロセスよりも、遅延ベクトルから直接望ましい特徴を持つ合成画像を得ることができるため、より時間効率がよい。
関連論文リスト
- Fast constrained sampling in pre-trained diffusion models [77.21486516041391]
拡散モデルは、大規模な生成画像モデルの分野を支配してきた。
本研究では,大規模な事前学習拡散モデルにおける高速拘束サンプリングのアルゴリズムを提案する。
論文 参考訳(メタデータ) (2024-10-24T14:52:38Z) - A Simple Approach to Unifying Diffusion-based Conditional Generation [63.389616350290595]
多様な条件生成タスクを処理するための、シンプルで統一されたフレームワークを導入します。
提案手法は,異なる推論時間サンプリング方式による多目的化を実現する。
我々のモデルは、非親密なアライメントや粗い条件付けのような追加機能をサポートしています。
論文 参考訳(メタデータ) (2024-10-15T09:41:43Z) - Optimize and Reduce: A Top-Down Approach for Image Vectorization [12.998637003026273]
高速かつドメインに依存しないベクトル化へのトップダウンアプローチであるOptimize & Reduce (O&R)を提案する。
O&Rの目的は、B'ezier曲線パラメータを反復的に最適化することで、入力画像のコンパクトな表現を実現することである。
提案手法はドメインに依存しないものであり,固定された形状に対する再現性および知覚的品質の両方において,既存の作品よりも優れることを示す。
論文 参考訳(メタデータ) (2023-12-18T16:41:03Z) - Auto-regressive Image Synthesis with Integrated Quantization [55.51231796778219]
本稿では,条件付き画像生成のための多目的フレームワークを提案する。
CNNの帰納バイアスと自己回帰の強力なシーケンスモデリングが組み込まれている。
提案手法は,最先端技術と比較して,優れた多彩な画像生成性能を実現する。
論文 参考訳(メタデータ) (2022-07-21T22:19:17Z) - NeurInt : Learning to Interpolate through Neural ODEs [18.104328632453676]
本稿では,2つの画像間の軌跡分布を学習する新しい生成モデルを提案する。
提案手法の有効性を示すとともに,画像の品質向上と,実画像と対象画像の任意のペアに対して,スムーズな軌道上の多様な分布を学習する能力を示す。
論文 参考訳(メタデータ) (2021-11-07T16:31:18Z) - IMAGINE: Image Synthesis by Image-Guided Model Inversion [79.4691654458141]
IMGE-Guided Model INvErsion (IMAGINE) と呼ばれるインバージョンベースの手法を導入し、高品質で多様な画像を生成します。
我々は,事前学習した分類器から画像意味論の知識を活用し,妥当な世代を実現する。
IMAGINEは,1)合成中の意味的特異性制約を同時に実施し,2)ジェネレータトレーニングなしでリアルな画像を生成し,3)生成過程を直感的に制御する。
論文 参考訳(メタデータ) (2021-04-13T02:00:24Z) - High Resolution Face Editing with Masked GAN Latent Code Optimization [0.0]
顔の編集はコンピュータビジョンコミュニティで人気のある研究トピックである。
最近の提案手法は、条件付きエンコーダデコーダであるGAN(Generative Adversarial Network)をエンドツーエンドでトレーニングするか、事前に訓練されたバニラGANジェネレータモデルの潜時空間での動作を定義するかのいずれかである。
空間的および意味的制約を伴ったGAN組み込み最適化手順を提案する。
論文 参考訳(メタデータ) (2021-03-20T08:39:41Z) - Regularization via deep generative models: an analysis point of view [8.818465117061205]
本稿では, イメージングにおける逆問題(例えば, デブロアリングやインペインティング)を, 深部生成ニューラルネットワークを用いて正則化する新しい手法を提案する。
多くの場合、我々の技術はパフォーマンスの明確な改善を実現し、より堅牢であるように思える。
論文 参考訳(メタデータ) (2021-01-21T15:04:57Z) - Joint Estimation of Image Representations and their Lie Invariants [57.3768308075675]
画像は世界の状態とコンテンツの両方をエンコードする。
この情報の自動抽出は、画像表現に固有の高次元かつ絡み合った符号化のために困難である。
本稿では,これらの課題の解決を目的とした2つの理論的アプローチを紹介する。
論文 参考訳(メタデータ) (2020-12-05T00:07:41Z) - Deep Variational Network Toward Blind Image Restoration [60.45350399661175]
ブラインド画像復元はコンピュータビジョンでは一般的だが難しい問題である。
両利点を両立させることを目的として,新しいブラインド画像復元手法を提案する。
画像デノイングと超解像という2つの典型的なブラインド赤外線タスクの実験により,提案手法が現状よりも優れた性能を達成できることが実証された。
論文 参考訳(メタデータ) (2020-08-25T03:30:53Z) - Image Restoration from Parametric Transformations using Generative
Models [4.467248776406006]
生成モデルを用いた様々な画像復元問題に対する最適手法を開発した。
提案手法では,未知のパラメータを含む場合であっても,変換によって歪んだ画像の復元が可能である。
本手法は,各画像がそれぞれの生成モデルによって記述された複数の画像の混合に適応するように拡張する。
論文 参考訳(メタデータ) (2020-05-27T01:14:40Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。