論文の概要: ART-VITON: Measurement-Guided Latent Diffusion for Artifact-Free Virtual Try-On
- arxiv url: http://arxiv.org/abs/2509.25749v1
- Date: Tue, 30 Sep 2025 04:09:47 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-10-01 14:45:00.011127
- Title: ART-VITON: Measurement-Guided Latent Diffusion for Artifact-Free Virtual Try-On
- Title(参考訳): ART-VITON:アーチファクトフリーバーチャルトライオンのための測定ガイド付き潜時拡散
- Authors: Junseo Park, Hyeryung Jang,
- Abstract要約: VITON(Virtual try-on)は、ターゲット服を着用している人のリアルなイメージを生成することを目的としている。
アーティファクトフリーな合成を維持しながら測定付着性を確保するための,測定誘導拡散フレームワークART-VITONを提案する。
- 参考スコア(独自算出の注目度): 10.814293043840038
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Virtual try-on (VITON) aims to generate realistic images of a person wearing a target garment, requiring precise garment alignment in try-on regions and faithful preservation of identity and background in non-try-on regions. While latent diffusion models (LDMs) have advanced alignment and detail synthesis, preserving non-try-on regions remains challenging. A common post-hoc strategy directly replaces these regions with original content, but abrupt transitions often produce boundary artifacts. To overcome this, we reformulate VITON as a linear inverse problem and adopt trajectory-aligned solvers that progressively enforce measurement consistency, reducing abrupt changes in non-try-on regions. However, existing solvers still suffer from semantic drift during generation, leading to artifacts. We propose ART-VITON, a measurement-guided diffusion framework that ensures measurement adherence while maintaining artifact-free synthesis. Our method integrates residual prior-based initialization to mitigate training-inference mismatch and artifact-free measurement-guided sampling that combines data consistency, frequency-level correction, and periodic standard denoising. Experiments on VITON-HD, DressCode, and SHHQ-1.0 demonstrate that ART-VITON effectively preserves identity and background, eliminates boundary artifacts, and consistently improves visual fidelity and robustness over state-of-the-art baselines.
- Abstract(参考訳): 仮想試着(VITON)は、対象の衣服を着用している人の現実的なイメージを生成し、試着領域における精密な衣服アライメントと、試着領域におけるアイデンティティと背景の忠実な保存を必要とする。
潜在拡散モデル(LDMs)は高度なアライメントと詳細合成を持つが、非トライオン領域の保存は依然として困難である。
一般的なポストホック戦略はこれらの領域を直接オリジナルコンテンツに置き換えるが、急激な遷移はしばしば境界アーティファクトを生成する。
そこで我々は,VITONを線形逆問題として再構成し,測定一貫性を徐々に強化し,非トライオン領域の急激な変化を低減させるトラジェクトリ・アライン・ソルバを採用する。
しかし、既存のソルバは世代間セマンティックドリフトに悩まされ、アーティファクトに繋がる。
アーティファクトフリーな合成を維持しながら測定付着性を確保するための,測定誘導拡散フレームワークART-VITONを提案する。
本手法は,データ整合性,周波数レベルの補正,周期的標準復調を組み合わせたトレーニングミスマッチとアーティファクトフリーな計測誘導サンプリングを緩和するために,残余の事前初期化を統合する。
VITON-HD、DressCode、SHHQ-1.0の実験では、ART-VITONはIDと背景を効果的に保存し、境界アーティファクトを排除し、最先端のベースラインに対する視覚的忠実性と堅牢性を一貫して改善している。
関連論文リスト
- STAGE: Segmentation-oriented Industrial Anomaly Synthesis via Graded Diffusion with Explicit Mask Alignment [29.572404530614175]
産業異常合成(SIAS)は下流異常セグメンテーションの性能向上に重要な役割を果たしている。
SIASメソッドにはいくつかの限界がある。
本稿では,STAGEと呼ばれるマスクアライメントを用いた傾斜拡散法を提案する。
論文 参考訳(メタデータ) (2025-09-08T13:47:01Z) - SARD: Segmentation-Aware Anomaly Synthesis via Region-Constrained Diffusion with Discriminative Mask Guidance [4.65786322515141]
SARD (Segmentation-Aware anomaly synthesis via Region-constrained Diffusion with discriminative mask Guidance) は, 異常生成に特化して設計された新しい拡散型フレームワークである。
SARDは、セグメンテーションの精度と視覚的品質において既存の手法を超越し、ピクセルレベルの異常合成のための新しい最先端技術を確立している。
論文 参考訳(メタデータ) (2025-08-05T06:43:01Z) - DS-VTON: High-Quality Virtual Try-on via Disentangled Dual-Scale Generation [38.499761393356124]
DS-VTONは、より効果的なモデリングのために目的を絞ったデュアルスケール仮想試行フレームワークである。
提案手法では, パーシングマップやセグメンテーションマスクへの依存を排除し, マスクフリーな生成パラダイムを採用する。
論文 参考訳(メタデータ) (2025-06-01T08:52:57Z) - Restoration Score Distillation: From Corrupted Diffusion Pretraining to One-Step High-Quality Generation [82.39763984380625]
Score Distillation (DSD) の原理的一般化である textitRestoration Score Distillation (RSD) を提案する。
RSDは、ぼやけた画像、不完全画像、低解像度画像など、広範囲の汚職タイプに対応している。
自然と科学の両方のデータセットの様々な復元作業において、教師モデルを一貫して上回っている。
論文 参考訳(メタデータ) (2025-05-19T17:21:03Z) - Orthogonal Subspace Decomposition for Generalizable AI-Generated Image Detection [58.87142367781417]
航法的に訓練された検出器は、限定的で単調な偽のパターンに過度に適合する傾向にあり、特徴空間は高度に制約され、低ランクになる。
潜在的な治療法の1つは、ビジョンファウンデーションモデルに事前訓練された知識を取り入れて、機能領域を広げることである。
主要なコンポーネントを凍結し、残ったコンポーネントのみを適用することで、フェイクパターンを学習しながら、トレーニング済みの知識を保存します。
論文 参考訳(メタデータ) (2024-11-23T19:10:32Z) - Dynamic Position Transformation and Boundary Refinement Network for Left Atrial Segmentation [17.09918110723713]
左心房細動は不整脈(心房細動)の診断において重要な手法である。
LAセグメンテーションの現在のほとんどの方法は、入力データがオブジェクト指向のセンタートリミングによって取得されると厳密に仮定している。
本稿では,これらの問題に対処するための新しい動的位置変換と境界改善ネットワーク(DPBNet)を提案する。
論文 参考訳(メタデータ) (2024-07-07T22:09:35Z) - Denoising as Adaptation: Noise-Space Domain Adaptation for Image Restoration [64.84134880709625]
拡散モデルを用いて,雑音空間を介して領域適応を行うことが可能であることを示す。
特に、補助的な条件入力が多段階の復調過程にどのように影響するかというユニークな性質を活用することにより、有意義な拡散損失を導出する。
拡散モデルにおけるチャネルシャッフル層や残留スワッピング型コントラスト学習などの重要な戦略を提案する。
論文 参考訳(メタデータ) (2024-06-26T17:40:30Z) - WarpDiffusion: Efficient Diffusion Model for High-Fidelity Virtual
Try-on [81.15988741258683]
画像ベースの仮想トライオン(VITON)は、ホップ内の衣服イメージを対象人物に転送することを目的としている。
現在の方法では、衣服と肌の境界付近の合成品質や、ねじれた衣服のしわや影のような現実的な効果を見落としていることが多い。
本稿では,新しい情報的・局所的な特徴的注意機構を通じてワーピングと拡散に基づくパラダイムを橋渡しするワープ拡散を提案する。
論文 参考訳(メタデータ) (2023-12-06T18:34:32Z) - GP-VTON: Towards General Purpose Virtual Try-on via Collaborative
Local-Flow Global-Parsing Learning [63.8668179362151]
仮想トライオン(Virtual Try-ON)は、ショップ内の衣服を特定の人に転送することを目的としている。
既存の手法では、異なる衣服部品の異方性変形をモデル化するために、グローバルなワーピングモジュールを使用している。
本稿では,革新的なローカルフロー・グローバル・パーシング(LFGP)ワーピングモジュールと動的グラディエント・トラニケーション(DGT)トレーニング戦略を提案する。
論文 参考訳(メタデータ) (2023-03-24T02:12:29Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。