論文の概要: MOFA-VTON: More Fashion Possibilities with Fine-Grained Adaptations in Virtual Try-On
- arxiv url: http://arxiv.org/abs/2606.11148v1
- Date: Tue, 09 Jun 2026 17:34:25 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-06-10 15:40:58.647233
- Title: MOFA-VTON: More Fashion Possibilities with Fine-Grained Adaptations in Virtual Try-On
- Title(参考訳): MOFA-VTON:仮想トライオンにおける微粒化適応によるよりファッションの可能性
- Authors: Xiaoyu Han, Chenyang Wang, Jing Wang, Shunyuan Zheng, Quanling Meng, Shengping Zhang,
- Abstract要約: そこで本研究では,MOFA-VTONと呼ばれる仮想試着手法を提案する。
具体的には、まず、ユーザが描いた曲線のスケッチを2つの領域のマスクに変換するマスク構築戦略を設計し、従来の衣服に依存しないマスクを置き換える。
また,人体上・下方領域のレイアウト対応を独立に学習するために,クロスアテンション機構を利用したレイアウト調整ブロックを提案する。
- 参考スコア(独自算出の注目度): 26.851916074509827
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Virtual try-on aims to fit an in-shop clothing image onto a specific human body. An optimal virtual try-on method should provide diverse and flexible dressing options, accurately reflecting the varied wearing styles encountered in real-life scenarios, tailored to individual preferences and fashion aspirations. However, current methods predominantly perform a direct replacement of the original clothing with the target clothing, following the same dressing pattern. This limited control over clothing adaptation may result in fixed and monotonous try-on outputs. To delve into More Fashion Possibilities with Fine-Grained Adaptations in Virtual Try-On, we propose a novel virtual try-on method, termed MOFA-VTON, which allows adjustment for clothing adaptations in try-on results through simple sketches by users. Specifically, we first design a mask construction strategy that transforms user-drawn curve sketches into a dual-region mask, replacing the traditional clothing-agnostic mask and providing fine-grained layout guidance for the subsequent generation process. Further, we propose layout adjustment blocks that utilize the cross-attention mechanism to independently learn layout correspondences for upper and lower regions of the human body, refining the spatial arrangement of the two regions. With these implementations, our method enables flexible and fine-grained adaptations of target clothing, overcoming the constraints of a fixed layout. Extensive experiments on VITON-HD and DressCode datasets demonstrate that our proposed MOFA-VTON outperforms previous state-of-the-art methods and provides more fashion possibilities for virtual try-on.
- Abstract(参考訳): 仮想試着は、装着した衣服の画像を特定の人間の体に合わせることを目的としている。
最適な仮想試着方法は、多様なフレキシブルなドレッシングオプションを提供し、現実のシナリオで遭遇する様々な服装スタイルを正確に反映し、個人の好みやファッションの願望に合わせて調整する必要がある。
しかし、現在の方法では、同じ着物パターンに従って、元服を対象服に置き換えることが主流である。
この服飾適応に対する制限された制御は、固定された単調な試着出力をもたらす可能性がある。
仮想トライオンにおけるファイングラインド・アダプティシビリティ(Fashion Possibilities)の向上を図るために,ユーザによる簡単なスケッチによる試着結果の調整が可能な,MOFA-VTONと呼ばれる新しい仮想トライオン手法を提案する。
具体的には、まず、ユーザが描いた曲線のスケッチを2つの領域のマスクに変換するマスク構築戦略を設計し、従来の衣服に依存しないマスクを置き換えるとともに、その後の生成プロセスのためのきめ細かいレイアウトガイダンスを提供する。
さらに, クロスアテンション機構を用いて, 人体上・下方領域のレイアウト対応を独立に学習し, 空間配置を改良するレイアウト調整ブロックを提案する。
これらの実装により、固定レイアウトの制約を克服し、柔軟できめ細かな目標服の適応を可能にする。
VITON-HDとDressCodeのデータセットに関する大規模な実験は、提案したMOFA-VTONが従来の最先端の手法よりも優れており、仮想トライオンのファッション性も向上していることを示している。
関連論文リスト
- MuGa-VTON: Multi-Garment Virtual Try-On via Diffusion Transformers with Prompt Customization [19.780800887427937]
我々は,上着と下着を共用した多目的拡散フレームワーク MuGa-VTON を紹介する。
このアーキテクチャはプロンプトベースのカスタマイズをサポートし、最小限のユーザ入力できめ細かい衣服の修正を可能にする。
論文 参考訳(メタデータ) (2025-08-11T21:45:07Z) - One Model For All: Partial Diffusion for Unified Try-On and Try-Off in Any Pose [99.056324701764]
textbfOMFA (emphOne Model For All) は仮想トライオンとトライオフの両方のための統合拡散フレームワークである。
フレームワークは完全にマスクフリーで、単一のポートレートとターゲットのポーズのみを入力として必要とします。
試着タスクと試着タスクの両方で最先端の結果が得られ、仮想衣料合成のための実用的で一般化可能なソリューションを提供する。
論文 参考訳(メタデータ) (2025-08-06T15:46:01Z) - Inverse Virtual Try-On: Generating Multi-Category Product-Style Images from Clothed Individuals [76.96387718150542]
テキスト強化Multi-category Virtual Try-Off(TEMU-VTOFF)を提案する。
私たちのアーキテクチャは、画像、テキスト、マスクなどの複数のモードから衣料情報を受け取り、複数のカテゴリで機能するように設計されています。
VITON-HDおよびDress Codeデータセットの実験では、TEMU-VTOFFがVTOFFタスクに新たな最先端を設定していることが示されている。
論文 参考訳(メタデータ) (2025-05-27T11:47:51Z) - High-Fidelity Virtual Try-on with Large-Scale Unpaired Learning [36.7085107012134]
VTON(Virtual try-on)は、ターゲットの衣服イメージを基準人物に転送する。
高忠実度試行のための大規模未経験学習を活用するための新しいフレームワークである textbfBoosted Virtual Try-on (BVTON) を提案する。
論文 参考訳(メタデータ) (2024-11-03T15:00:26Z) - MV-VTON: Multi-View Virtual Try-On with Diffusion Models [91.71150387151042]
画像ベースの仮想試着の目的は、与えられた衣服を自然に身に着けている対象者の画像を生成することである。
既存の方法は、前頭服を用いた正面試着のみに焦点をあてる方法である。
本稿では,服の複数ビューからドレッシング結果を再構築することを目的としたMulti-View Virtual Try-ON(MV-VTON)を紹介する。
論文 参考訳(メタデータ) (2024-04-26T12:27:57Z) - Wear-Any-Way: Manipulable Virtual Try-on via Sparse Correspondence Alignment [8.335876030647118]
Wear-Any-Wayは、仮想トライオンのためのカスタマイズ可能なソリューションである。
まず、標準仮想試着のための強力なパイプラインを構築し、単一/複数衣料試着とモデル・ツー・モデル設定をサポートする。
特定位置の生成を誘導するポイントベース制御を含むスパースアライメントアライメントを提案する。
論文 参考訳(メタデータ) (2024-03-19T17:59:52Z) - Better Fit: Accommodate Variations in Clothing Types for Virtual Try-on [25.550019373321653]
画像ベースの仮想試着は、ターゲットとなる服を着替えたモデル画像に転送することを目的としている。
トレーニングマスクを動的に調整する適応型マスクトレーニングパラダイムを提案する。
未ペアの試行検証のために、総合的なクロストライオンベンチマークを構築した。
論文 参考訳(メタデータ) (2024-03-13T12:07:14Z) - Towards Scalable Unpaired Virtual Try-On via Patch-Routed
Spatially-Adaptive GAN [66.3650689395967]
本稿では,現実世界の仮想試行を支援するテクスチャ保存型終末ネットワークであるPAtch-routed SpaTially-Adaptive GAN (PASTA-GAN)を提案する。
PASTA-GANは、各衣服のスタイルと空間情報をアンタングルするために、革新的なパッチを外したアンタングルモジュールで構成されている。
論文 参考訳(メタデータ) (2021-11-20T08:36:12Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。