論文の概要: ZFlow: Gated Appearance Flow-based Virtual Try-on with 3D Priors
- arxiv url: http://arxiv.org/abs/2109.07001v1
- Date: Tue, 14 Sep 2021 22:41:14 GMT
- ステータス: 処理完了
- システム内更新日: 2021-09-16 15:02:15.926564
- Title: ZFlow: Gated Appearance Flow-based Virtual Try-on with 3D Priors
- Title(参考訳): ZFlow: 3Dプリミティブを備えたGated Outearance Flowベースのバーチャルトライオン
- Authors: Ayush Chopra, Rishabh Jain, Mayur Hemani, Balaji Krishnamurthy
- Abstract要約: 画像ベースの仮想トライオンでは、特定の衣服を着たモデルの説得力のあるイメージを合成する。
近年の方法は2段階のプロセスを含む:i) モデル ii に合わせるために衣服を変形させる。
モデルや衣服に関する幾何学的な情報の欠如は、しばしば細かい細部を不適切にレンダリングする。
我々は、これらの懸念を軽減するために、エンドツーエンドのフレームワークであるZFlowを提案する。
- 参考スコア(独自算出の注目度): 13.977100716044104
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Image-based virtual try-on involves synthesizing perceptually convincing
images of a model wearing a particular garment and has garnered significant
research interest due to its immense practical applicability. Recent methods
involve a two stage process: i) warping of the garment to align with the model
ii) texture fusion of the warped garment and target model to generate the
try-on output. Issues arise due to the non-rigid nature of garments and the
lack of geometric information about the model or the garment. It often results
in improper rendering of granular details. We propose ZFlow, an end-to-end
framework, which seeks to alleviate these concerns regarding geometric and
textural integrity (such as pose, depth-ordering, skin and neckline
reproduction) through a combination of gated aggregation of hierarchical flow
estimates termed Gated Appearance Flow, and dense structural priors at various
stage of the network. ZFlow achieves state-of-the-art results as observed
qualitatively, and on quantitative benchmarks of image quality (PSNR, SSIM, and
FID). The paper presents extensive comparisons with other existing solutions
including a detailed user study and ablation studies to gauge the effect of
each of our contributions on multiple datasets.
- Abstract(参考訳): イメージベースの仮想試行は、特定の衣服を身に着けたモデルの知覚的に説得力のあるイメージを合成することを含み、その膨大な実用性のために、重要な研究の関心を集めている。
最近の方法は2段階のプロセスを伴う。
一 模型に合致する衣服の反り
二 歪んだ衣服及びターゲットモデルのテクスチャ融合により、試着出力を生成すること。
問題は、衣服の非剛性や、モデルや衣服に関する幾何学的情報の欠如によって生じる。
しばしば細かな細部を不適切にレンダリングする。
本稿では, 階層フロー推定値のゲート集約と, ネットワークの様々な段階における構造的先行性の組み合わせにより, 幾何学的およびテクスチャ的整合性(ポーズ, 深度順応, 皮膚, ネックライン再生など)を緩和するエンド・ツー・エンドのフレームワークであるZFlowを提案する。
ZFlowは,画像品質の定量的ベンチマーク(PSNR,SSIM,FID)において,定性的に観察される最先端の結果を達成する。
本稿では,複数のデータセットに対する我々の貢献が与える影響を計測するための詳細なユーザ研究やアブレーション研究など,既存のソリューションと広範な比較を行う。
関連論文リスト
- pAE: An Efficient Autoencoder Architecture for Modeling the Lateral Geniculate Nucleus by Integrating Feedforward and Feedback Streams in Human Visual System [0.716879432974126]
本稿では,人間の視覚情報処理を近似した深部畳み込みモデルを提案する。
本研究の目的は、訓練された浅部畳み込みモデルを用いて、外側原核(LGN)領域の機能を近似することである。
pAEモデルは最終99.26%の予測性能を達成し、時間モードでの人間の結果よりも約28%向上したことを示す。
論文 参考訳(メタデータ) (2024-09-20T16:33:01Z) - Multi-View Unsupervised Image Generation with Cross Attention Guidance [23.07929124170851]
本稿では,単一カテゴリデータセット上でのポーズ条件拡散モデルの教師なし学習のための新しいパイプラインを提案する。
特定のオブジェクト部分の可視性と位置を比較することで、データセットをクラスタリングすることで、オブジェクトのポーズを識別する。
我々のモデルであるMIRAGEは、実画像における新しいビュー合成における先行研究を超越している。
論文 参考訳(メタデータ) (2023-12-07T14:55:13Z) - Advancing Pose-Guided Image Synthesis with Progressive Conditional Diffusion Models [13.019535928387702]
本稿では,ターゲット下の人物像とソースポーズのギャップを段階的に橋渡しするプログレッシブ条件拡散モデル(PCDM)を提案する。
定性的かつ定量的な結果は,難解なシナリオ下で提案したPCDMの一貫性と光現実性を示すものである。
論文 参考訳(メタデータ) (2023-10-10T05:13:17Z) - GM-NeRF: Learning Generalizable Model-based Neural Radiance Fields from
Multi-view Images [79.39247661907397]
本稿では,自由視点画像の合成に有効なフレームワークであるGeneralizable Model-based Neural Radiance Fieldsを提案する。
具体的には、多視点2D画像からの出現コードを幾何学的プロキシに登録するための幾何学誘導型アテンション機構を提案する。
論文 参考訳(メタデータ) (2023-03-24T03:32:02Z) - Person Image Synthesis via Denoising Diffusion Model [116.34633988927429]
本研究では,高忠実度人物画像合成に拡散モデルをいかに応用できるかを示す。
2つの大規模ベンチマークとユーザスタディの結果は、挑戦的なシナリオ下で提案したアプローチのフォトリアリズムを実証している。
論文 参考訳(メタデータ) (2022-11-22T18:59:50Z) - Unifying Flow, Stereo and Depth Estimation [121.54066319299261]
本稿では3つの動作と3次元知覚タスクのための統一的な定式化とモデルを提案する。
これら3つのタスクを、統一された高密度対応マッチング問題として定式化する。
我々のモデルは、モデルアーキテクチャとパラメータがタスク間で共有されているため、自然にクロスタスク転送を可能にします。
論文 参考訳(メタデータ) (2022-11-10T18:59:54Z) - Single Stage Virtual Try-on via Deformable Attention Flows [51.70606454288168]
仮想試行は、ショップ内服と基準人物画像が与えられた写真リアルなフィッティング結果を生成することを目的としている。
マルチフロー推定に変形性アテンションスキームを適用した,変形性アテンションフロー(DAFlow)を新たに開発した。
提案手法は,定性的かつ定量的に最先端の性能を実現する。
論文 参考訳(メタデータ) (2022-07-19T10:01:31Z) - Learning Monocular Depth in Dynamic Scenes via Instance-Aware Projection
Consistency [114.02182755620784]
本稿では,複数の動的物体の6-DoF動作,エゴモーション,深度を,監督なしで一眼レフカメラで明示的にモデル化する,エンドツーエンドのジョイントトレーニングフレームワークを提案する。
筆者らのフレームワークは,最先端の深度・動き推定法より優れていた。
論文 参考訳(メタデータ) (2021-02-04T14:26:42Z) - Normalizing Flows with Multi-Scale Autoregressive Priors [131.895570212956]
マルチスケール自己回帰前処理(mAR)を通した遅延空間におけるチャネルワイド依存性を導入する。
我々のmARは、分割結合フロー層(mAR-SCF)を持つモデルに先立って、複雑なマルチモーダルデータの依存関係をよりよく捉えます。
我々は,mAR-SCFにより画像生成品質が向上し,FIDとインセプションのスコアは最先端のフローベースモデルと比較して向上したことを示す。
論文 参考訳(メタデータ) (2020-04-08T09:07:11Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。