論文の概要: Dual-Diffusional Generative Fashion Recommendation
- arxiv url: http://arxiv.org/abs/2605.17357v1
- Date: Sun, 17 May 2026 09:52:18 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-05-19 17:57:47.91863
- Title: Dual-Diffusional Generative Fashion Recommendation
- Title(参考訳): Dual-Diffusional Generative Fashion Recommendation
- Authors: Mingzhe Yu, Lei Wu, Qianru Sun, Yunshan Ma,
- Abstract要約: 本稿ではDualFashion, Dual-Diffusional Generative Fashion Recommendation Architectureを提案する。
提案アーキテクチャは,ファッションアイテムイメージとテキスト記述の両方を生成する。
パーソナライズされたFill-in-the-BlankおよびGenerative Outfit Recommendationタスク間のiFashionとPolyvore-Uの実験は、DualFashionが高いパフォーマンスを達成することを示す。
- 参考スコア(独自算出の注目度): 34.16599050803813
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Personalized generative recommender systems have emerged as a promising solution for fashion recommendation. However, existing methods primarily rely on implicit visual embeddings from historical interactions, which often contain preference-irrelevant information and result in insufficient user behavior modeling. Moreover, these models typically generate only item images, providing limited interpretability. To address these limitations, we propose DualFashion, a Dual-Diffusional Generative Fashion Recommendation Architecture that jointly models image and text modalities for personalized and explainable recommendation. DualFashion adopts a dual-diffusion Transformer with image and text branches, where structured attribute-level captions and visual outfit information are jointly used as conditioning signals to model user behavior. The proposed architecture produces both fashion item images and textual descriptions, ensuring visual compatibility while providing explicit semantic interpretability. Furthermore, we introduce a text-augmented fine-tuning strategy that enhances generation diversity and enables effective cross-modal knowledge transfer without incurring heavy computational costs. Extensive experiments on iFashion and Polyvore-U across Personalized Fill-in-the-Blank and Generative Outfit Recommendation tasks demonstrate that DualFashion achieves strong performance in behavior modeling, interpretability, and efficiency compared to state-of-the-art methods. Our code and model checkpoints are available at https://github.com/LinkMingzhe/DualFashion.
- Abstract(参考訳): ファッションレコメンデーションのための有望なソリューションとして、パーソナライズされた生成レコメンデーションシステムが現れている。
しかし、既存の手法は主に歴史的相互作用からの暗黙的な視覚的埋め込みに依存しており、それはしばしば嗜好に無関係な情報を含んでおり、結果としてユーザー行動のモデリングが不十分である。
さらに、これらのモデルは典型的にはアイテムイメージのみを生成し、限定的な解釈性を提供する。
これらの制約に対処するため、DualFashionは、パーソナライズされた説明可能なレコメンデーションのために、画像とテキストのモダリティを共同でモデル化する、Dual-Diffusional Generative Fashion Recommendation Architectureを提案する。
DualFashionは、イメージとテキストブランチを備えたデュアル拡散トランスフォーマーを採用しており、構造化属性レベルのキャプションと視覚的な服装情報は、ユーザの振る舞いをモデル化するための条件付け信号として共同で使用される。
提案アーキテクチャは、ファッションアイテムの画像とテキスト記述の両方を生成し、明示的な意味論的解釈性を提供しながら、視覚的互換性を確保する。
さらに,テキストによる微調整戦略を導入し,生成の多様性を高め,計算コストを伴わずに効果的なクロスモーダルな知識伝達を実現する。
パーソナライズされたFill-in-the-BlankおよびGenerative Outfit Recommendationタスク間でのiFashionとPolyvore-Uに関する大規模な実験により、DualFashionは、最先端の手法と比較して、動作モデリング、解釈可能性、効率性において高いパフォーマンスを達成することが示された。
私たちのコードとモデルチェックポイントはhttps://github.com/LinkMingzhe/DualFashion.comで公開されています。
関連論文リスト
- VersaVogue: Visual Expert Orchestration and Preference Alignment for Unified Fashion Synthesis [37.779702074028044]
VersaVogueは、コントロール可能なファッション合成のための統一されたフレームワークである。
衣料品生成と仮想ドレッシングをサポートし、ファッションライフサイクルのデザインとショートステージに対応する。
論文 参考訳(メタデータ) (2026-04-08T15:31:30Z) - RePrompt: Reasoning-Augmented Reprompting for Text-to-Image Generation via Reinforcement Learning [88.14234949860105]
RePromptは、強化学習による迅速な強化プロセスに明示的な推論を導入する、新しいリプロンプトフレームワークである。
提案手法は,人手による注釈付きデータなしでエンドツーエンドのトレーニングを可能にする。
論文 参考訳(メタデータ) (2025-05-23T06:44:26Z) - Personalized Fashion Recommendation with Image Attributes and Aesthetics Assessment [15.423307815155534]
利用可能な情報、特に画像を2つのグラフ属性に変換することで、より正確なファッションレコメンデーションを提供することを目指している。
画像とテキストを2つのコンポーネントとして分離する従来の手法と比較して,提案手法は画像とテキスト情報を組み合わせてよりリッチな属性グラフを作成する。
IQON3000データセットの予備実験により,提案手法はベースラインと比較して競争精度が向上することを示した。
論文 参考訳(メタデータ) (2025-01-06T15:31:10Z) - Fashionability-Enhancing Outfit Image Editing with Conditional Diffusion Models [8.632093933229678]
本稿では,キー属性の制御を維持しつつ,ファッション性が向上したファッション画像を生成する,新しい拡散モデルに基づくアプローチを提案する。
本手法の主な構成要素は,1) ファッション性向上,2) ボディ特性の保存, 生成した画像の本来の形状と比率の維持, 3) 自動的なファッション最適化であり, 手動の入力や外部のプロンプトに依存しない。
論文 参考訳(メタデータ) (2024-12-24T13:27:25Z) - Improving Diffusion Models for Authentic Virtual Try-on in the Wild [53.96244595495942]
本稿では,キュレートされた衣服を身に着けている人のイメージをレンダリングする,イメージベースの仮想試行について考察する。
衣服の忠実度を改善し,仮想試行画像を生成する新しい拡散モデルを提案する。
本稿では,一対の人着画像を用いたカスタマイズ手法を提案する。
論文 参考訳(メタデータ) (2024-03-08T08:12:18Z) - Style Aligned Image Generation via Shared Attention [61.121465570763085]
本稿では,一連の生成画像間のスタイルアライメントを確立する技術であるStyleAlignedを紹介する。
拡散過程において、最小限の注意共有を生かして、T2Iモデル内の画像間のスタイル整合性を維持する。
本手法は,多種多様なスタイルやテキストのプロンプトにまたがって評価を行い,高品質で忠実であることを示す。
論文 参考訳(メタデータ) (2023-12-04T18:55:35Z) - FashionTex: Controllable Virtual Try-on with Text and Texture [29.7855591607239]
テキストとテクスチャの両方の利点を多段階のファッション操作に組み合わせたマルチモーダル・インタラクティブ・セッティングを提案する。
FashionTexフレームワークは、アノテーション付きのペアトレーニングデータなしで、布の種類や局所的なテクスチャパターンを意味的に制御することができる。
論文 参考訳(メタデータ) (2023-05-08T04:10:36Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。