Fugu-MT 論文翻訳(概要): ACDG-VTON: Accurate and Contained Diffusion Generation for Virtual Try-On

論文の概要: ACDG-VTON: Accurate and Contained Diffusion Generation for Virtual Try-On

arxiv url: http://arxiv.org/abs/2403.13951v1
Date: Wed, 20 Mar 2024 19:45:06 GMT
ステータス: 翻訳完了
システム内更新日: 2024-03-22 17:59:26.222710
Title: ACDG-VTON: Accurate and Contained Diffusion Generation for Virtual Try-On
Title（参考訳）: ACDG-VTON:仮想トライオンにおける高精度かつ包含拡散生成
Authors: Jeffrey Zhang, Kedan Li, Shao-Yu Chang, David Forsyth,
Abstract要約: 本研究では,拡散の訓練範囲を制限する訓練手法を提案する。提案手法は,マルチガーメント試行を1回の推論サイクルで実行し,高解像度でトレーニングすることなく高品質なズームイン世代をサポートする。
参考スコア（独自算出の注目度）: 6.228968332207618
License: http://creativecommons.org/licenses/by-nc-sa/4.0/
Abstract: Virtual Try-on (VTON) involves generating images of a person wearing selected garments. Diffusion-based methods, in particular, can create high-quality images, but they struggle to maintain the identities of the input garments. We identified this problem stems from the specifics in the training formulation for diffusion. To address this, we propose a unique training scheme that limits the scope in which diffusion is trained. We use a control image that perfectly aligns with the target image during training. In turn, this accurately preserves garment details during inference. We demonstrate our method not only effectively conserves garment details but also allows for layering, styling, and shoe try-on. Our method runs multi-garment try-on in a single inference cycle and can support high-quality zoomed-in generations without training in higher resolutions. Finally, we show our method surpasses prior methods in accuracy and quality.
Abstract（参考訳）: VTON(Virtual Try-on)は、選択された服装を身に着けている人の画像を生成する。拡散に基づく手法は、特に高品質な画像を作成することができるが、彼らは入力された衣服のアイデンティティを維持するのに苦労している。この問題は,拡散のためのトレーニング定式化の具体的特徴に起因していると同定した。そこで本研究では,拡散の訓練範囲を制限するユニークな学習手法を提案する。私たちは、トレーニング中にターゲットイメージと完全に整合するコントロールイメージを使用します。これにより、推測中の衣服の細部を正確に保存することができる。本手法は衣服の詳細を効果的に保存するだけでなく, 階層化, スタイリング, 靴の試着も可能であることを実証する。提案手法は,マルチガーメント試行を1回の推論サイクルで実行し,高解像度でトレーニングすることなく高品質なズームイン世代をサポートする。最後に,提案手法が従来手法を超越した精度と品質を示す。

関連論文リスト

Teleportraits: Training-Free People Insertion into Any Scene [59.76038137014233]
我々は、事前訓練されたテキスト-画像拡散モデルを活用する、統合されたトレーニングフリーパイプラインを導入する。拡散モデルは、タスク固有の訓練を必要とせず、複雑な場面に人々を配置する知識を本質的に持っていることを示す。本手法は,視覚障害者をシームレスにシーンに挿入し,手頃なグローバル編集を実現する。
論文参考訳（メタデータ） (2025-10-07T08:12:57Z)
OmniVTON: Training-Free Universal Virtual Try-On [53.31945401098557]
イメージベースの仮想トライオン(VTON)技術は、適応性を改善するが、データバイアスと制限された普遍性によって制約される、教師付きインショップアプローチまたは教師なしインザワイルド手法のいずれかに依存している。 OmniVTONは,布地を疎結合にし,テクスチャの忠実さを両立させ,多様な設定に整合性を持たせるための条件付けを行う,初めてのトレーニングフリーユニバーサルVTONフレームワークである。
論文参考訳（メタデータ） (2025-07-20T16:37:53Z)
EfficientVITON: An Efficient Virtual Try-On Model using Optimized Diffusion Process [2.0451307225357427]
中心となる課題は、リアルな画像から画像への翻訳であり、そこでは衣服は多様な人間の形、ポーズ、人物に適合しなければならない。 2D変換を使った初期の手法では速度が提供されていたが、画像の品質はしばしば失望し、ディープラーニングのニュアンスを欠いていた。拡散モデルの最近の進歩は、高忠実度翻訳の公約を示しているが、現在の仮想試用ツールは、詳細損失やワープの問題に苦慮している。本稿では,事前学習型安定拡散モデルを利用した仮想試行システムであるEfficientVITONを提案する。
論文参考訳（メタデータ） (2025-01-20T22:44:53Z)
Learning Flow Fields in Attention for Controllable Person Image Generation [59.10843756343987]
制御可能な人物画像生成は、参照画像に条件付けされた人物画像を生成することを目的としている。そこで本研究では,対象クエリに対して,適切な参照キーへの参照を明示的にガイドする学習フロー場(Leffa)を提案する。 Leffaは外観(仮想試行)とポーズ(目的移動)の制御における最先端のパフォーマンスを実現し、細かなディテール歪みを著しく低減する。
論文参考訳（メタデータ） (2024-12-11T15:51:14Z)
FitDiT: Advancing the Authentic Garment Details for High-fidelity Virtual Try-on [73.13242624924814]
Diffusion Transformer (DiT) を用いた高忠実度仮想試行用ガーメント知覚増強技術FitDiT 布地テクスチャ抽出装置を導入し, 布地や模様, テクスチャなどのリッチな細部を, よりよく捉えられるようにした。また,クロスカテゴリー試着中にマスク領域全体を埋める衣服の発生を防止し,衣料の正しい長さに適応する拡張緩和マスク戦略を採用した。
論文参考訳（メタデータ） (2024-11-15T11:02:23Z)
Improving Virtual Try-On with Garment-focused Diffusion Models [91.95830983115474]
拡散モデルは多くの画像合成タスクにおける生成的モデリングの革新をもたらした。私たちは新しい拡散モデル、すなわちGarDiffを作り、衣服中心の拡散プロセスを引き起こします。 VITON-HDおよびDressCodeデータセットの実験は、最先端のVTONアプローチと比較して、GarDiffの優位性を示している。
論文参考訳（メタデータ） (2024-09-12T17:55:11Z)
Ada-adapter:Fast Few-shot Style Personlization of Diffusion Model with Pre-trained Image Encoder [57.574544285878794]
Ada-Adapterは拡散モデルの少数ショットスタイルのパーソナライズのための新しいフレームワークである。提案手法は,単一の参照画像を用いたゼロショット方式の効率的な転送を可能にする。フラットアートや3Dレンダリング,ロゴデザインなど,さまざまな芸術的スタイルに対するアプローチの有効性を実証する。
論文参考訳（メタデータ） (2024-07-08T02:00:17Z)
TryOn-Adapter: Efficient Fine-Grained Clothing Identity Adaptation for High-Fidelity Virtual Try-On [34.51850518458418]
仮想試着は、衣服のパターンやテクスチャの歪みを避けながら、特定の人物にシームレスにフィットするように、所定の衣服を調整することに焦点を当てる。我々はTryOn-Adapterと呼ばれる効果的で効率的なフレームワークを提案する。
論文参考訳（メタデータ） (2024-04-01T03:15:41Z)
Improving Diffusion Models for Authentic Virtual Try-on in the Wild [53.96244595495942]
本稿では,キュレートされた衣服を身に着けている人のイメージをレンダリングする,イメージベースの仮想試行について考察する。衣服の忠実度を改善し,仮想試行画像を生成する新しい拡散モデルを提案する。本稿では,一対の人着画像を用いたカスタマイズ手法を提案する。
論文参考訳（メタデータ） (2024-03-08T08:12:18Z)
OOTDiffusion: Outfitting Fusion based Latent Diffusion for Controllable Virtual Try-on [7.46772222515689]
OOTDiffusionは、リアルで制御可能なイメージベースの仮想トライオンのための新しいネットワークアーキテクチャである。我々は、事前訓練された潜伏拡散モデルのパワーを活用し、UNetを設計して、衣服の詳細特徴を学習する。 VITON-HDおよびDress Codeデータセットに関する実験により、OOTDiffusionが効率よく高品質な試行結果を生成することを示した。
論文参考訳（メタデータ） (2024-03-04T07:17:44Z)
WarpDiffusion: Efficient Diffusion Model for High-Fidelity Virtual Try-on [81.15988741258683]
画像ベースの仮想トライオン(VITON)は、ホップ内の衣服イメージを対象人物に転送することを目的としている。現在の方法では、衣服と肌の境界付近の合成品質や、ねじれた衣服のしわや影のような現実的な効果を見落としていることが多い。本稿では,新しい情報的・局所的な特徴的注意機構を通じてワーピングと拡散に基づくパラダイムを橋渡しするワープ拡散を提案する。
論文参考訳（メタデータ） (2023-12-06T18:34:32Z)
StableVITON: Learning Semantic Correspondence with Latent Diffusion Model for Virtual Try-On [35.227896906556026]
衣服画像と人物画像が与えられた場合、画像ベースの仮想試行は、衣服画像の特徴を自然に正確に反映した、カスタマイズされた画像を生成することを目的としている。本研究では,事前学習した拡散モデルの適用性を拡張し,仮想試行作業に独立して利用できるようにすることを目的とする。提案するゼロ・クロスアテンションブロックは, 意味的対応を学習することで衣服の細部を保存できるだけでなく, ワープ過程における事前学習モデル固有の知識を利用して高忠実度画像を生成する。
論文参考訳（メタデータ） (2023-12-04T08:27:59Z)
Taming the Power of Diffusion Models for High-Quality Virtual Try-On with Appearance Flow [24.187109053871833]
仮想試着は、人間と衣服の両方の詳細を保存しながら、ある画像から別の画像へ衣服を転送することを目的とした、重要な画像合成タスクである。本稿では,拡散モデルの生成を効果的に導くために,ワープモジュールを利用する例に基づく塗装手法を提案する。我々のアプローチ、すなわちDCI-VTON(Diffusion-based Conditional Inpainting for Virtual Try-ON)は、拡散モデルのパワーを効果的に活用する。
論文参考訳（メタデータ） (2023-08-11T12:23:09Z)
Dressing in the Wild by Watching Dance Videos [69.7692630502019]
本稿では,現実の場面における仮想試行に参画し,現実性と自然性の向上をもたらす。我々は,衣服の移動をより効果的に進める,wFlowと呼ばれる新しい生成ネットワークを提案する。
論文参考訳（メタデータ） (2022-03-29T08:05:45Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。