Fugu-MT 論文翻訳(概要): AnyFit: Controllable Virtual Try-on for Any Combination of Attire Across Any Scenario

論文の概要: AnyFit: Controllable Virtual Try-on for Any Combination of Attire Across Any Scenario

arxiv url: http://arxiv.org/abs/2405.18172v1
Date: Tue, 28 May 2024 13:33:08 GMT
ステータス: 翻訳完了
システム内更新日: 2024-05-29 18:29:23.877210
Title: AnyFit: Controllable Virtual Try-on for Any Combination of Attire Across Any Scenario
Title（参考訳）: AnyFit: どんなシナリオでもAttireを組み合わせられるコントロール可能なバーチャルトライオン
Authors: Yuhan Li, Hao Zhou, Wenxiang Shang, Ran Lin, Xuanhong Chen, Bingbing Ni,
Abstract要約: AnyFitは、高解像度のベンチマークと実世界のデータのベースラインを、大きなギャップで上回っている。 AnyFitの高忠実度バーチャル試作品における印象的なパフォーマンスは、あらゆるイメージから見ても、ファッションコミュニティにおける将来の研究の新たな道を切り開くものです。
参考スコア（独自算出の注目度）: 50.62711489896909
License: http://creativecommons.org/licenses/by-nc-sa/4.0/
Abstract: While image-based virtual try-on has made significant strides, emerging approaches still fall short of delivering high-fidelity and robust fitting images across various scenarios, as their models suffer from issues of ill-fitted garment styles and quality degrading during the training process, not to mention the lack of support for various combinations of attire. Therefore, we first propose a lightweight, scalable, operator known as Hydra Block for attire combinations. This is achieved through a parallel attention mechanism that facilitates the feature injection of multiple garments from conditionally encoded branches into the main network. Secondly, to significantly enhance the model's robustness and expressiveness in real-world scenarios, we evolve its potential across diverse settings by synthesizing the residuals of multiple models, as well as implementing a mask region boost strategy to overcome the instability caused by information leakage in existing models. Equipped with the above design, AnyFit surpasses all baselines on high-resolution benchmarks and real-world data by a large gap, excelling in producing well-fitting garments replete with photorealistic and rich details. Furthermore, AnyFit's impressive performance on high-fidelity virtual try-ons in any scenario from any image, paves a new path for future research within the fashion community.
Abstract（参考訳）: 画像ベースの仮想試行は大きな進歩を遂げてきたが、新しいアプローチは、さまざまなシナリオで高忠実で堅牢な画像を提供するには依然として不足している。そこで我々はまず,ハイドラブロック(Hydra Block)と呼ばれる,軽量でスケーラブルな操作子を提案する。これは並列アテンション機構によって実現され、複数の衣服が、条件付きエンコードされた枝からメインネットワークへの特徴注入を容易にする。第二に、実世界のシナリオにおけるモデルの堅牢性と表現性を著しく向上させるため、複数のモデルの残差を合成し、既存のモデルにおける情報漏洩による不安定性を克服するマスク領域促進戦略を実装することにより、そのポテンシャルを多様な設定にわたって発展させます。上記のデザインを取り入れたAnyFitは、高解像度のベンチマークと実世界のデータに大きく差をつけ、フォトリアリスティックでリッチなディテールを補うのに優れています。さらに、AnyFitがどんなイメージから見ても、どんなシナリオでも高忠実なバーチャル試行錯誤における印象的なパフォーマンスは、ファッションコミュニティにおける将来の研究の新たな道を開くものです。

関連論文リスト

DiffFit: Disentangled Garment Warping and Texture Refinement for Virtual Try-On [3.5655800569257896]
VTON(Virtual try-on)は、ターゲット服を着用している人のリアルなイメージを、電子商取引やデジタルファッションに広く応用することを目的としている。 DiffFitは,高忠実度仮想試行のための新しい2段階遅延拡散フレームワークである。
論文参考訳（メタデータ） (2025-06-29T15:31:42Z)
MagicTryOn: Harnessing Diffusion Transformer for Garment-Preserving Video Virtual Try-on [16.0505428363005]
大規模なビデオ拡散変換器上に構築された仮想仮想試行フレームワークMagicTryOnを提案する。我々は、U-Netアーキテクチャを拡散変換器に置き換え、ビデオの服飾一貫性をモデル化するために完全な自己アテンションを組み合わせる。提案手法は,既存のSOTA法を総合評価で上回り,現場シナリオに一般化する。
論文参考訳（メタデータ） (2025-05-27T15:22:02Z)
Inverse Virtual Try-On: Generating Multi-Category Product-Style Images from Clothed Individuals [76.96387718150542]
テキスト強化Multi-category Virtual Try-Off(TEMU-VTOFF)を提案する。私たちのアーキテクチャは、画像、テキスト、マスクなどの複数のモードから衣料情報を受け取り、複数のカテゴリで機能するように設計されています。 VITON-HDおよびDress Codeデータセットの実験では、TEMU-VTOFFがVTOFFタスクに新たな最先端を設定していることが示されている。
論文参考訳（メタデータ） (2025-05-27T11:47:51Z)
CrossVTON: Mimicking the Logic Reasoning on Cross-category Virtual Try-on guided by Tri-zone Priors [63.95051258676488]
CrossVTONは、クロスカテゴリ仮想試行のための堅牢なフィッティングイメージを生成するためのフレームワークである。クロスカテゴリ試行に必要な複雑な推論を構造化フレームワークに切り離す。定性評価と定量的評価の両方において、既存のベースラインを超え、最先端のパフォーマンスを達成する。
論文参考訳（メタデータ） (2025-02-20T09:05:35Z)
TryOffAnyone: Tiled Cloth Generation from a Dressed Person [1.4732811715354452]
高忠実なタイル付き衣料品画像は、パーソナライズされたレコメンデーション、服装構成、バーチャルトライオンシステムに不可欠である。本研究では, 微調整型安定拡散モデルを用いた新しい手法を提案する。本手法は,服飾用マスクを統合し,対象の衣服を効果的に分離・処理する,一段ネットワーク設計の合理化を特徴とする。
論文参考訳（メタデータ） (2024-12-11T17:41:53Z)
FitDiT: Advancing the Authentic Garment Details for High-fidelity Virtual Try-on [73.13242624924814]
Diffusion Transformer (DiT) を用いた高忠実度仮想試行用ガーメント知覚増強技術FitDiT 布地テクスチャ抽出装置を導入し, 布地や模様, テクスチャなどのリッチな細部を, よりよく捉えられるようにした。また,クロスカテゴリー試着中にマスク領域全体を埋める衣服の発生を防止し,衣料の正しい長さに適応する拡張緩和マスク戦略を採用した。
論文参考訳（メタデータ） (2024-11-15T11:02:23Z)
High-Fidelity Virtual Try-on with Large-Scale Unpaired Learning [36.7085107012134]
VTON(Virtual try-on)は、ターゲットの衣服イメージを基準人物に転送する。高忠実度試行のための大規模未経験学習を活用するための新しいフレームワークである textbfBoosted Virtual Try-on (BVTON) を提案する。
論文参考訳（メタデータ） (2024-11-03T15:00:26Z)
IMAGDressing-v1: Customizable Virtual Dressing [58.44155202253754]
IMAGDressing-v1は、固定された衣服とオプション条件で自由に編集可能な人間の画像を生成する仮想ドレッシングタスクである。 IMAGDressing-v1は、CLIPのセマンティック特徴とVAEのテクスチャ特徴をキャプチャする衣料UNetを組み込んでいる。本稿では,凍結自己注意とトレーニング可能なクロスアテンションを含むハイブリッドアテンションモジュールを提案する。
論文参考訳（メタデータ） (2024-07-17T16:26:30Z)
GenS: Generalizable Neural Surface Reconstruction from Multi-View Images [20.184657468900852]
GenSは、エンドツーエンドの一般化可能なニューラルサーフェス再構成モデルである。我々の表現はより強力であり、グローバルな滑らかさを維持しながら高周波の詳細を回復することができる。人気のあるベンチマーク実験により、我々のモデルは新たなシーンにうまく一般化できることが示された。
論文参考訳（メタデータ） (2024-06-04T17:13:10Z)
Time-Efficient and Identity-Consistent Virtual Try-On Using A Variant of Altered Diffusion Models [4.038493506169702]
本研究は, 複雑なテクスチャの詳細と, 対象者と衣服の特徴を, 様々なシナリオで保存することの課題を強調する。様々な既存アプローチが検討され、制限と未解決の側面を強調している。次に,仮想試行中にテクスチャのテクスチャ保存とユーザアイデンティティ保持に対処する,新しい拡散型ソリューションを提案する。
論文参考訳（メタデータ） (2024-03-12T07:15:29Z)
PFDM: Parser-Free Virtual Try-on via Diffusion Model [28.202996582963184]
拡散モデル(PFDM)に基づく自由仮想試行法を提案する。 2つの画像が与えられた場合、PFDMは、他の情報なしで暗黙的にワープすることで、標的人物の衣服をシームレスに「着る」ことができる。実験により,提案したPFDMは複雑な画像の処理に成功し,最先端の最先端モデルと高忠実度モデルの両方より優れていることが示された。
論文参考訳（メタデータ） (2024-02-05T14:32:57Z)
Person Image Synthesis via Denoising Diffusion Model [116.34633988927429]
本研究では,高忠実度人物画像合成に拡散モデルをいかに応用できるかを示す。 2つの大規模ベンチマークとユーザスタディの結果は、挑戦的なシナリオ下で提案したアプローチのフォトリアリズムを実証している。
論文参考訳（メタデータ） (2022-11-22T18:59:50Z)
Drivable Volumetric Avatars using Texel-Aligned Features [52.89305658071045]
光テレプレゼンスは、動的に合成された外観を実現するために、高忠実度ボディモデリングと忠実な運転の両方を必要とする。本稿では,現実人のフルボディアバターをモデリングし,駆動する際の2つの課題に対処するエンドツーエンドフレームワークを提案する。
論文参考訳（メタデータ） (2022-07-20T09:28:16Z)
Single Stage Virtual Try-on via Deformable Attention Flows [51.70606454288168]
仮想試行は、ショップ内服と基準人物画像が与えられた写真リアルなフィッティング結果を生成することを目的としている。マルチフロー推定に変形性アテンションスキームを適用した,変形性アテンションフロー(DAFlow)を新たに開発した。提案手法は,定性的かつ定量的に最先端の性能を実現する。
論文参考訳（メタデータ） (2022-07-19T10:01:31Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。