論文の概要: CooGAN: A Memory-Efficient Framework for High-Resolution Facial
Attribute Editing
- arxiv url: http://arxiv.org/abs/2011.01563v1
- Date: Tue, 3 Nov 2020 08:40:00 GMT
- ステータス: 処理完了
- システム内更新日: 2022-09-30 05:21:01.778576
- Title: CooGAN: A Memory-Efficient Framework for High-Resolution Facial
Attribute Editing
- Title(参考訳): CooGAN: 高分解能顔属性編集のためのメモリ効率の良いフレームワーク
- Authors: Xuanhong Chen, Bingbing Ni, Naiyuan Liu, Ziang Liu, Yiliu Jiang, Loc
Truong, and Qi Tian
- Abstract要約: HR顔画像編集のためのNOVEL画素変換フレームワークCooperative GAN(CooGAN)を提案する。
このフレームワークは、きめ細かい局所的な顔パッチ生成のためのローカルパス(パッチレベルHR、ローメモリ)と、グローバル低解像度(LR)顔構造監視のためのグローバルパス(画像レベルLR、ローメモリ)を備えている。
さらに,より効率的なマルチスケール機能融合のための軽量な選択転写ユニットを提案する。
- 参考スコア(独自算出の注目度): 84.92009553462384
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: In contrast to great success of memory-consuming face editing methods at a
low resolution, to manipulate high-resolution (HR) facial images, i.e.,
typically larger than 7682 pixels, with very limited memory is still
challenging. This is due to the reasons of 1) intractable huge demand of
memory; 2) inefficient multi-scale features fusion. To address these issues, we
propose a NOVEL pixel translation framework called Cooperative GAN(CooGAN) for
HR facial image editing. This framework features a local path for fine-grained
local facial patch generation (i.e., patch-level HR, LOW memory) and a global
path for global lowresolution (LR) facial structure monitoring (i.e.,
image-level LR, LOW memory), which largely reduce memory requirements. Both
paths work in a cooperative manner under a local-to-global consistency
objective (i.e., for smooth stitching). In addition, we propose a lighter
selective transfer unit for more efficient multi-scale features fusion,
yielding higher fidelity facial attributes manipulation. Extensive experiments
on CelebAHQ well demonstrate the memory efficiency as well as the high image
generation quality of the proposed framework.
- Abstract(参考訳): 低解像度でメモリ消費の顔編集手法を成功させるのとは対照的に、高解像度 (HR) の顔画像を操作することは、通常7682ピクセルより大きい。
これは理由からである。
1) 難解な膨大なメモリ需要
2)非効率なマルチスケール機能融合。
これらの問題に対処するため、HR顔画像編集のための協調ガン(CooGAN)と呼ばれるNOVELピクセル翻訳フレームワークを提案する。
このフレームワークは、きめ細かい局所的な顔パッチ生成のためのローカルパス(パッチレベルのHR、ローメモリ)と、グローバルな低解像度(LR)顔構造監視のためのグローバルパス(画像レベルのLR、ローメモリ)を備えており、メモリ要求を大幅に削減している。
どちらの経路も、局所からグローバルへの一貫性の目標(すなわち滑らかな縫い合わせのための)の下で協調的に機能する。
さらに,より効率的なマルチスケール機能融合を実現するための,より軽量な選択的転送ユニットを提案する。
celebahqに関する広範な実験は、提案フレームワークのメモリ効率と高い画像生成品質を示している。
関連論文リスト
- Beyond LLaVA-HD: Diving into High-Resolution Large Multimodal Models [44.437693135170576]
我々は、高度化タスク付きLMM、局所画像圧縮、グローバルエキスパートの混合(SliME)を提案する。
我々は,異なるタスクにおいて異なるアダプタが優れているという観察に基づいて,アダプタの混合を用いてグローバルビューからコンテキスト情報を抽出する。
提案手法は,200万のトレーニングデータのみを用いて,様々なベンチマークにおいて先行的な性能を実現する。
論文 参考訳(メタデータ) (2024-06-12T17:59:49Z) - W-Net: A Facial Feature-Guided Face Super-Resolution Network [8.037821981254389]
Face Super-Resolutionは、高解像度 (HR) の顔画像を低解像度 (LR) の顔画像から復元することを目的としている。
既存手法は, 再建効率が低く, 事前情報の利用が不十分であるため, 理想的ではない。
本稿では,この課題に対処するため,W-Netと呼ばれる新しいネットワークアーキテクチャを提案する。
論文 参考訳(メタデータ) (2024-06-02T09:05:40Z) - Real-time 6K Image Rescaling with Rate-distortion Optimization [53.61374658914277]
リアルタイム6Kレート歪み認識画像再スケーリングのための新しいフレームワークを提案する。
我々のフレームワークは、HR画像をエンコーダによってJPEG LRサムネイルに埋め込む。
そして、効率的な周波数認識復号器は、LR1から高忠実度HR画像をリアルタイムに再構成する。
論文 参考訳(メタデータ) (2023-04-03T15:21:56Z) - Hierarchical Similarity Learning for Aliasing Suppression Image
Super-Resolution [64.15915577164894]
エイリアスの影響を抑制するために階層画像超解像ネットワーク(HSRNet)を提案する。
HSRNetは、他の作品よりも定量的かつ視覚的なパフォーマンスを向上し、エイリアスをより効果的に再送信する。
論文 参考訳(メタデータ) (2022-06-07T14:55:32Z) - Memory-augmented Deep Unfolding Network for Guided Image
Super-resolution [67.83489239124557]
誘導画像超解像(GISR)は、HR画像の誘導の下で低解像度(LR)目標画像の空間分解能を高めて高解像度(HR)目標画像を得る。
従来のモデルベース手法は主に画像全体を取り、HR目標画像とHRガイダンス画像との事前分布を仮定する。
HR目標画像上で2種類の事前性を持つGISRの最大後部(MAP)推定モデルを提案する。
論文 参考訳(メタデータ) (2022-02-12T15:37:13Z) - Best-Buddy GANs for Highly Detailed Image Super-Resolution [71.13466303340192]
我々は,低分解能(LR)入力に基づいて高分解能(HR)画像を生成する単一画像超解像(SISR)問題を考える。
このラインに沿ったほとんどのメソッドは、SISRタスクに十分な柔軟性がない、事前定義されたシングルLRシングルHRマッピングに依存しています。
リッチディテールSISRのためのベストバディGAN(Beby-GAN)を提案する。
イミュータブルな1対1の制約を緩和することで、推定されたパッチを動的に最高の監視を求めることができる。
論文 参考訳(メタデータ) (2021-03-29T02:58:27Z) - PULSE: Self-Supervised Photo Upsampling via Latent Space Exploration of
Generative Models [77.32079593577821]
PULSE (Photo Upsampling via Latent Space Exploration) は、それまで文献になかった解像度で高解像度でリアルな画像を生成する。
本手法は, 従来よりも高分解能, スケールファクターの知覚品質において, 最先端の手法よりも優れていた。
論文 参考訳(メタデータ) (2020-03-08T16:44:31Z) - Joint Face Completion and Super-resolution using Multi-scale Feature
Relation Learning [26.682678558621625]
本稿では,MFG-GAN(MFG-GAN)を用いたマルチスケール機能グラフ生成手法を提案する。
GANに基づいて、MFG-GANはグラフ畳み込みとピラミッドネットワークを統合し、隠蔽された低解像度の顔画像を非隠蔽の高解像度の顔画像に復元する。
パブリックドメインCelebAとHelenデータベースの実験結果から,提案手法は顔超解像(最大4倍または8倍)と顔補完を同時に行う上で,最先端の手法よりも優れていることが示された。
論文 参考訳(メタデータ) (2020-02-29T13:31:46Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。