Fugu-MT 論文翻訳(概要): MV-TON: Memory-based Video Virtual Try-on network

論文の概要: MV-TON: Memory-based Video Virtual Try-on network

arxiv url: http://arxiv.org/abs/2108.07502v1
Date: Tue, 17 Aug 2021 08:35:23 GMT
ステータス: 翻訳完了
システム内更新日: 2021-08-18 13:19:21.690756
Title: MV-TON: Memory-based Video Virtual Try-on network
Title（参考訳）: MV-TON: メモリベースの仮想トライオンネットワーク
Authors: Xiaojing Zhong, Zhonghua Wu, Taizhe Tan, Guosheng Lin, Qingyao Wu
Abstract要約: メモリベースの仮想トライオンネットワーク(MV-TON)を提案する。 MV-TONは、衣服テンプレートを使わずに、望ましい服を対象者にシームレスに転送し、高精細なリアルな映像を生成する。実験により,ビデオ仮想試行課題における本手法の有効性と,既存の方法よりも優れていることを示す。
参考スコア（独自算出の注目度）: 49.496817042974456
License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
Abstract: With the development of Generative Adversarial Network, image-based virtual try-on methods have made great progress. However, limited work has explored the task of video-based virtual try-on while it is important in real-world applications. Most existing video-based virtual try-on methods usually require clothing templates and they can only generate blurred and low-resolution results. To address these challenges, we propose a Memory-based Video virtual Try-On Network (MV-TON), which seamlessly transfers desired clothes to a target person without using any clothing templates and generates high-resolution realistic videos. Specifically, MV-TON consists of two modules: 1) a try-on module that transfers the desired clothes from model images to frame images by pose alignment and region-wise replacing of pixels; 2) a memory refinement module that learns to embed the existing generated frames into the latent space as external memory for the following frame generation. Experimental results show the effectiveness of our method in the video virtual try-on task and its superiority over other existing methods.
Abstract（参考訳）: Generative Adversarial Networkの開発により、画像ベースの仮想試行法は大きな進歩を遂げた。しかし,実際のアプリケーションでは,ビデオベースの仮想試行作業が重要でありながら,限定的な作業が求められている。既存のビデオベースの仮想試行法の多くは、通常衣服のテンプレートを必要とし、ぼやけた結果と低解像度の結果しか生成できない。そこで,本稿では,被服テンプレートを使わずに,被服を被写体にシームレスに転送し,高精細なリアルビデオを生成するメモリベースビデオ仮想トライオンネットワーク(mv-ton)を提案する。特に、MV-TONは、2つのモジュールから構成される。1)モデル画像からフレーム画像へ所望の衣服をポーズアライメントし、ピクセルを領域的に置き換える試着モジュール、2)既存の生成されたフレームを潜在空間に埋め込み、後続のフレーム生成のための外部メモリとして学習するメモリリファインメントモジュール。実験により,ビデオ仮想試行課題における本手法の有効性と,既存の方法よりも優れていることを示す。

関連論文リスト

CatV2TON: Taming Diffusion Transformers for Vision-Based Virtual Try-On with Temporal Concatenation [75.10635392993748]
視覚に基づく仮想試行(V2TON)方式であるCatV2TONを導入する。 CatV2TONは、衣服と人物の入力を時間的に結合し、画像とビデオのデータセットを混合してトレーニングすることにより、堅牢な試着性能を実現する。また、背面フレームをフィルタリングし、3Dマスクのスムース化を施した精巧なビデオ試行データセットViViD-Sを提案する。
論文参考訳（メタデータ） (2025-01-20T08:09:36Z)
Fashion-VDM: Video Diffusion Model for Virtual Try-On [17.284966713669927]
仮想トライオンビデオを生成するためのビデオ拡散モデル(VDM)であるFashion-VDMを提案する。入力された衣料品画像と人物映像から,当該衣料品を装着した人の高品質な試着映像を作成することを目的としている。
論文参考訳（メタデータ） (2024-10-31T21:52:33Z)
WildVidFit: Video Virtual Try-On in the Wild via Image-Based Controlled Diffusion Models [132.77237314239025]
ビデオ仮想トライオンは、衣料品のアイデンティティを維持し、ソースビデオにおける人のポーズと身体の形に適応する現実的なシーケンスを生成することを目的としている。従来の画像ベースの手法は、ワープとブレンディングに依存しており、複雑な人間の動きや閉塞に苦しむ。衣料品の説明や人間の動きを条件とした映像生成のプロセスとして,映像試行を再認識する。私たちのソリューションであるWildVidFitは、画像ベースで制御された拡散モデルを用いて、一段階の合理化を図っている。
論文参考訳（メタデータ） (2024-07-15T11:21:03Z)
ViViD: Video Virtual Try-on using Diffusion Models [46.710863047471264]
Video Virtual try-onは、服のアイテムを対象者のビデオに転送することを目的としている。これまでのビデオベースの試行錯誤ソリューションは、視力の低い結果とぼやけた結果しか生成できない。ビデオ仮想トライオンの課題に対処するために,強力な拡散モデルを用いた新しいフレームワークViViDを提案する。
論文参考訳（メタデータ） (2024-05-20T05:28:22Z)
MV-VTON: Multi-View Virtual Try-On with Diffusion Models [91.71150387151042]
画像ベースの仮想試着の目的は、与えられた衣服を自然に身に着けている対象者の画像を生成することである。既存の方法は、前頭服を用いた正面試着のみに焦点をあてる方法である。本稿では,服の複数ビューからドレッシング結果を再構築することを目的としたMulti-View Virtual Try-ON(MV-VTON)を紹介する。
論文参考訳（メタデータ） (2024-04-26T12:27:57Z)
MoVideo: Motion-Aware Video Generation with Diffusion Models [97.03352319694795]
本稿では,映像深度と光フローの2つの側面から動きを考慮に入れたモーションアウェア・ジェネレーション(MoVideo)フレームワークを提案する。 MoVideoは、テキスト・トゥ・ビデオと画像・トゥ・ビデオ生成の両方で最先端の結果を達成し、期待できる即時一貫性、フレームの整合性、視覚的品質を示す。
論文参考訳（メタデータ） (2023-11-19T13:36:03Z)
Multi-object Video Generation from Single Frame Layouts [84.55806837855846]
本研究では,グローバルシーンを局所オブジェクトに合成するビデオ生成フレームワークを提案する。我々のフレームワークは、画像生成手法からの非自明な適応であり、この分野では新しくなっています。本モデルは広範に使用されている2つのビデオ認識ベンチマークで評価されている。
論文参考訳（メタデータ） (2023-05-06T09:07:01Z)
ClothFormer:Taming Video Virtual Try-on in All Module [12.084652803378598]
ビデオの仮想試着は、対象の服を時間的に一貫した結果でビデオの人物に合わせることを目的としている。 ClothFormerフレームワークは、複雑な環境で現実的で時間的な一貫性のある結果をうまく合成する。
論文参考訳（メタデータ） (2022-04-26T08:40:28Z)
SieveNet: A Unified Framework for Robust Image-Based Virtual Try-On [14.198545992098309]
SieveNetは、堅牢なイメージベースの仮想トライオンのためのフレームワークである。細粒度精度をモデル化する多段粗いワープネットワークを提案する。また,テクスチャ伝達ネットワークを改善するために,試着型布条件セグメンテーションマスクを導入する。
論文参考訳（メタデータ） (2020-01-17T12:33:54Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。