論文の概要: A Simple Baseline for StyleGAN Inversion
- arxiv url: http://arxiv.org/abs/2104.07661v1
- Date: Thu, 15 Apr 2021 17:59:49 GMT
- ステータス: 処理完了
- システム内更新日: 2021-04-16 14:48:43.448306
- Title: A Simple Baseline for StyleGAN Inversion
- Title(参考訳): StyleGANインバージョンのための簡易ベースライン
- Authors: Tianyi Wei and Dongdong Chen and Wenbo Zhou and Jing Liao and Weiming
Zhang and Lu Yuan and Gang Hua and Nenghai Yu
- Abstract要約: StyleGANのインバージョンは、トレーニング済みのStyleGANを実際の顔画像編集タスクに使用できるようにする上で重要な役割を果たす。
既存の最適化ベースの手法は高品質な結果を生み出すことができるが、最適化には時間がかかることが多い。
StyleGANインバージョンのための新しいフィードフォワードネットワークを提示し、効率と品質の面で大幅に改善します。
- 参考スコア(独自算出の注目度): 133.5868210969111
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: This paper studies the problem of StyleGAN inversion, which plays an
essential role in enabling the pretrained StyleGAN to be used for real facial
image editing tasks. This problem has the high demand for quality and
efficiency. Existing optimization-based methods can produce high quality
results, but the optimization often takes a long time. On the contrary,
forward-based methods are usually faster but the quality of their results is
inferior. In this paper, we present a new feed-forward network for StyleGAN
inversion, with significant improvement in terms of efficiency and quality. In
our inversion network, we introduce: 1) a shallower backbone with multiple
efficient heads across scales; 2) multi-layer identity loss and multi-layer
face parsing loss to the loss function; and 3) multi-stage refinement.
Combining these designs together forms a simple and efficient baseline method
which exploits all benefits of optimization-based and forward-based methods.
Quantitative and qualitative results show that our method performs better than
existing forward-based methods and comparably to state-of-the-art
optimization-based methods, while maintaining the high efficiency as well as
forward-based methods. Moreover, a number of real image editing applications
demonstrate the efficacy of our method. Our project page is
~\url{https://wty-ustc.github.io/inversion}.
- Abstract(参考訳): 本稿では,事前学習したStyleGANを実際の顔画像編集タスクに使用可能にする上で,StyleGANの逆転が重要な役割を担っていることを明らかにする。
この問題には品質と効率に対する高い需要がある。
既存の最適化手法では高品質な結果が得られるが、最適化には長い時間がかかることが多い。
反対に、フォワードベースの手法は通常より速いが、結果の品質は劣っている。
本稿では,スタイルガンインバージョンのための新しいフィードフォワードネットワークを提案する。
1) スケールにまたがる複数の効率のよいヘッドを持つ浅層バックボーン, 2) 損失関数に対する多層id損失と多層顔解析損失, 3) 多段細分化について紹介する。
これらの設計を組み合わせることで、最適化ベースとフォワードベースの方法の利点をすべて活用する、シンプルで効率的なベースライン手法が形成される。
定量的および定性的な結果から,提案手法は従来の前方法よりも優れた性能を示し,最先端の最適化法と相容れない性能を示した。
さらに,本手法の有効性を示す実画像編集アプリケーションも多数存在する。
プロジェクトページは~\url{https://wty-ustc.github.io/inversion}です。
関連論文リスト
- Coupling Fairness and Pruning in a Single Run: a Bi-level Optimization
Perspective [17.394732703591462]
本研究では, プルーニングマスクと重み更新処理を公平性制約で協調的に最適化する枠組みを提案する。
このフレームワークは、単一実行時の公平性を確保しながら、パフォーマンスを維持するモデルを圧縮するように設計されている。
我々の経験的分析は、我々のフレームワークといくつかの主流プルーニング戦略を対比し、モデルフェアネス、パフォーマンス、効率の維持における我々の方法の優位性を強調している。
論文 参考訳(メタデータ) (2023-12-15T20:08:53Z) - Adaptive Image Registration: A Hybrid Approach Integrating Deep Learning
and Optimization Functions for Enhanced Precision [13.242184146186974]
本稿では,ディープニューラルネットワークと最適化に基づく画像登録のための単一のフレームワークを提案する。
また, 実験データの最大1.6%の改善と, 同じ推定時間を維持しつつ, 変形場平滑化における1.0%の性能向上を示す。
論文 参考訳(メタデータ) (2023-11-27T02:48:06Z) - HomOpt: A Homotopy-Based Hyperparameter Optimization Method [10.11271414863925]
一般化加法モデル(GAM)とホモトピー最適化を組み合わせたデータ駆動型手法であるHomOptを提案する。
本稿では,HomOptが任意のメソッドの性能と有効性を向上し,連続離散およびカテゴリー領域空間上での最適収束を高速化する方法について述べる。
論文 参考訳(メタデータ) (2023-08-07T06:01:50Z) - Sample Less, Learn More: Efficient Action Recognition via Frame Feature
Restoration [59.6021678234829]
本稿では,2つのスパースサンプリングおよび隣接するビデオフレームの中間特徴を復元する新しい手法を提案する。
提案手法の統合により, 一般的な3つのベースラインの効率は50%以上向上し, 認識精度は0.5%低下した。
論文 参考訳(メタデータ) (2023-07-27T13:52:42Z) - StyleSwap: Style-Based Generator Empowers Robust Face Swapping [90.05775519962303]
StyleSwapという簡潔で効果的なフレームワークを紹介します。
私たちの中核となる考え方は、スタイルベースのジェネレータを活用して、高忠実で堅牢な顔交換を可能にすることです。
最小限の変更だけで、StyleGAN2アーキテクチャはソースとターゲットの両方から望まれる情報をうまく処理できる。
論文 参考訳(メタデータ) (2022-09-27T16:35:16Z) - Efficient Few-Shot Object Detection via Knowledge Inheritance [62.36414544915032]
Few-shot Object Detection (FSOD) は、未確認のタスクに少ないトレーニングサンプルで適応できるジェネリック検出器を学習することを目的としている。
計算量の増加を伴わない効率的なプレトレイン・トランスファー・フレームワーク(PTF)のベースラインを提案する。
また,予測された新しいウェイトと事前訓練されたベースウェイトとのベクトル長の不整合を軽減するために,適応長再スケーリング(ALR)戦略を提案する。
論文 参考訳(メタデータ) (2022-03-23T06:24:31Z) - Resource-Efficient Invariant Networks: Exponential Gains by Unrolled
Optimization [8.37077056358265]
本稿では,最適化に基づく不変ネットワーク構築のための新しい計算プリミティブを提案する。
提案手法の効率向上と音質の実証的,理論的検討を行った。
単純な階層的オブジェクト検出タスクに対して,効率的な不変ネットワークを構築する上で,その有用性を実証する。
論文 参考訳(メタデータ) (2022-03-09T19:04:08Z) - Low-light Image Enhancement by Retinex Based Algorithm Unrolling and
Adjustment [50.13230641857892]
本稿では,低照度画像強調(LIE)問題に対する新たなディープラーニングフレームワークを提案する。
提案フレームワークは,大域的明るさと局所的明るさ感度の両方を考慮したアルゴリズムアンロールと調整ネットワークに着想を得た分解ネットワークを含む。
一連の典型的なLIEデータセットの実験では,既存の手法と比較して,定量的かつ視覚的に,提案手法の有効性が示された。
論文 参考訳(メタデータ) (2022-02-12T03:59:38Z) - Joint inference and input optimization in equilibrium networks [68.63726855991052]
ディープ均衡モデル(Deep equilibrium model)は、従来のネットワークの深さを予測し、代わりに単一の非線形層の固定点を見つけることによってネットワークの出力を計算するモデルのクラスである。
この2つの設定の間には自然なシナジーがあることが示されています。
この戦略は、生成モデルのトレーニングや、潜時符号の最適化、デノベートやインペインティングといった逆問題に対するトレーニングモデル、対逆トレーニング、勾配に基づくメタラーニングなど、様々なタスクにおいて実証される。
論文 参考訳(メタデータ) (2021-11-25T19:59:33Z) - Quantum variational optimization: The role of entanglement and problem
hardness [0.0]
本稿では, 絡み合いの役割, 変動量子回路の構造, 最適化問題の構造について検討する。
数値計算の結果,絡み合うゲートの分布を問題のトポロジに適応させる利点が示唆された。
リスク型コスト関数に条件値を適用することで最適化が向上し、最適解と重複する確率が増大することを示す。
論文 参考訳(メタデータ) (2021-03-26T14:06:54Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。