論文の概要: Semi-supervised Latent Disentangled Diffusion Model for Textile Pattern Generation
- arxiv url: http://arxiv.org/abs/2603.16747v1
- Date: Tue, 17 Mar 2026 16:24:07 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-03-18 17:42:07.416316
- Title: Semi-supervised Latent Disentangled Diffusion Model for Textile Pattern Generation
- Title(参考訳): 繊維パターン生成のための半教師付き潜伏拡散モデル
- Authors: Chenggong Hu, Yi Wang, Mengqi Xue, Haofei Zhang, Jie Song, Li Sun,
- Abstract要約: 繊維パターン生成(TPG)は,所定の衣服画像に基づいて微細な繊維パターンを合成することを目的としている。
既存のイメージ・ツー・イメージのモデルは、このタスクの自然な候補であるようだ。
しかし、直接適用すると、これらの手法は不誠実な結果をもたらすことが多い。
忠実かつ高忠実なTPGのための新しい手法SLDDM-TPGを提案する。
- 参考スコア(独自算出の注目度): 22.45428755321959
- License: http://creativecommons.org/licenses/by-nc-nd/4.0/
- Abstract: Textile pattern generation (TPG) aims to synthesize fine-grained textile pattern images based on given clothing images. Although previous studies have not explicitly investigated TPG, existing image-to-image models appear to be natural candidates for this task. However, when applied directly, these methods often produce unfaithful results, failing to preserve fine-grained details due to feature confusion between complex textile patterns and the inherent non-rigid texture distortions in clothing images. In this paper, we propose a novel method, SLDDM-TPG, for faithful and high-fidelity TPG. Our method consists of two stages: (1) a latent disentangled network (LDN) that resolves feature confusion in clothing representations and constructs a multi-dimensional, independent clothing feature space; and (2) a semi-supervised latent diffusion model (S-LDM), which receives guidance signals from LDN and generates faithful results through semi-supervised diffusion training, combined with our designed fine-grained alignment strategy. Extensive evaluations show that SLDDM-TPG reduces FID by 4.1 and improves SSIM by up to 0.116 on our CTP-HD dataset, and also demonstrate good generalization on the VITON-HD dataset.
- Abstract(参考訳): 繊維パターン生成(TPG)は,所定の衣服画像に基づいて微細な繊維パターンを合成することを目的としている。
これまでの研究では、TPGについて明確には研究されていないが、既存の画像と画像のモデルは、この課題の自然な候補であるようだ。
しかし、直接適用すると、複雑な織物パターンと衣料画像の固有の非剛性テクスチャ歪みの相違により、細かな細部を保たず、しばしば不誠実な結果をもたらす。
本稿では,忠実かつ高忠実なTPGのための新しい手法であるSLDDM-TPGを提案する。
提案手法は,(1)服飾表現の特徴的混乱を解消し,多次元の独立した衣服特徴空間を構築する潜伏不整合ネットワーク(LDN),(2)LDNからの誘導信号を受信し,半教師付き拡散訓練により忠実な結果を生成する半教師付き潜伏拡散モデル(S-LDM)の2段階からなる。
CTP-HDデータセットでは,SLDDM-TPGはFIDを4.1削減し,SSIMを0.116改善し,VITON-HDデータセットでは良好な一般化を示した。
関連論文リスト
- FerretNet: Efficient Synthetic Image Detection via Local Pixel Dependencies [10.597504007889063]
FerretNetは1.1Mパラメータしか持たない軽量ニューラルネットワークで、効率的で堅牢な合成画像検出を提供する。
FerretNetは4クラスのProGANデータセットを専門にトレーニングし、22の生成モデルからなるオープンワールドベンチマークで平均97.1%の精度を達成した。
論文 参考訳(メタデータ) (2025-09-25T08:28:32Z) - Dual Recursive Feedback on Generation and Appearance Latents for Pose-Robust Text-to-Image Diffusion [15.384896404310645]
制御可能なT2Iモデルにおける制御条件を適切に反映する訓練不要なDual Recursive Feedback(DRF)システムを提案する。
提案手法は高品質でセマンティック・コヒーレントで構造的に一貫した画像を生成する。
論文 参考訳(メタデータ) (2025-08-13T07:46:00Z) - Trajectory Consistency Distillation: Improved Latent Consistency Distillation by Semi-Linear Consistency Function with Trajectory Mapping [75.72212215739746]
軌道整合性蒸留(TCD)は、軌道整合性と戦略的サンプリングを含む。
TCDは低NFEで画像品質を著しく向上させるが、教師モデルと比較してより詳細な結果が得られる。
論文 参考訳(メタデータ) (2024-02-29T13:44:14Z) - Text-Image Conditioned Diffusion for Consistent Text-to-3D Generation [28.079441901818296]
我々は,粒度の細かい視野の整合性を明示したNeRF(Neural Radiance Fields)のテキスト・ツー・3D手法を提案する。
本手法は,既存のテキスト・ツー・3D法に対して最先端の性能を実現する。
論文 参考訳(メタデータ) (2023-12-19T01:09:49Z) - R&B: Region and Boundary Aware Zero-shot Grounded Text-to-image
Generation [74.5598315066249]
拡散モデルを用いてゼロショット接地T2I生成を探索する。
本稿では,地域境界(R&B)を意識したクロスアテンションガイダンス手法を提案する。
論文 参考訳(メタデータ) (2023-10-13T05:48:42Z) - Synthetic Data Supervised Salient Object Detection [40.991558165686136]
そこで我々は,SODGANという,高品質な画像マスク対を無限に生成できる新しいSOD手法を提案する。
SODGANは、生成モデルから直接生成された合成データを用いて、SODに初めて取り組みます。
提案手法は, 半弱弱教師付き手法において新たなSOTA性能を実現し, 完全教師付きSOTA手法よりも優れる。
論文 参考訳(メタデータ) (2022-10-25T08:36:29Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。