論文の概要: Learning to Synthesize Compatible Fashion Items Using Semantic Alignment and Collocation Classification: An Outfit Generation Framework
- arxiv url: http://arxiv.org/abs/2502.06827v1
- Date: Wed, 05 Feb 2025 12:13:53 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-02-12 14:08:43.576838
- Title: Learning to Synthesize Compatible Fashion Items Using Semantic Alignment and Collocation Classification: An Outfit Generation Framework
- Title(参考訳): セマンティックアライメントとコロケーション分類を用いた競合するファッションアイテムの合成学習:アウトフィット生成フレームワーク
- Authors: Dongliang Zhou, Haijun Zhang, Kai Yang, Linlin Liu, Han Yan, Xiaofei Xu, Zhao Zhang, Shuicheng Yan,
- Abstract要約: 衣料品全体を合成することを目的とした,新しい衣料品生成フレームワークであるOutfitGANを提案する。
OutfitGANにはセマンティックアライメントモジュールがあり、既存のファッションアイテムと合成アイテムのマッピング対応を特徴付ける。
提案モデルの性能を評価するため,20,000のファッション衣装からなる大規模データセットを構築した。
- 参考スコア(独自算出の注目度): 59.09707044733695
- License:
- Abstract: The field of fashion compatibility learning has attracted great attention from both the academic and industrial communities in recent years. Many studies have been carried out for fashion compatibility prediction, collocated outfit recommendation, artificial intelligence (AI)-enabled compatible fashion design, and related topics. In particular, AI-enabled compatible fashion design can be used to synthesize compatible fashion items or outfits in order to improve the design experience for designers or the efficacy of recommendations for customers. However, previous generative models for collocated fashion synthesis have generally focused on the image-to-image translation between fashion items of upper and lower clothing. In this paper, we propose a novel outfit generation framework, i.e., OutfitGAN, with the aim of synthesizing a set of complementary items to compose an entire outfit, given one extant fashion item and reference masks of target synthesized items. OutfitGAN includes a semantic alignment module, which is responsible for characterizing the mapping correspondence between the existing fashion items and the synthesized ones, to improve the quality of the synthesized images, and a collocation classification module, which is used to improve the compatibility of a synthesized outfit. In order to evaluate the performance of our proposed models, we built a large-scale dataset consisting of 20,000 fashion outfits. Extensive experimental results on this dataset show that our OutfitGAN can synthesize photo-realistic outfits and outperform state-of-the-art methods in terms of similarity, authenticity and compatibility measurements.
- Abstract(参考訳): ファッションコンパチブルラーニングの分野は、近年、学術と工業の双方から大きな注目を集めている。
ファッションコンパチブルの予測、コロケーションされたファッションレコメンデーション、人工知能(AI)対応のファッションデザイン、関連するトピックなど、多くの研究が実施されている。
特に、AI対応のファッションデザインは、デザイナのデザインエクスペリエンスを改善するために、互換性のあるファッションアイテムや衣装を合成したり、顧客へのレコメンデーションの有効性を高めるために使用することができる。
しかし,従来のファッション合成モデルでは,上着と下着のファッションアイテム間のイメージ・ツー・イメージ翻訳が中心であった。
本稿では,現在あるファッションアイテムと対象の合成アイテムの参照マスクが与えられた服全体を構成するために,補足品の集合を合成することを目的とした,新しい衣料品生成フレームワークであるOutfitGANを提案する。
OutfitGANは、既存のファッション品物と合成品物のマッピング対応を特徴付けるセマンティックアライメントモジュールと、合成品物の互換性を改善するために使用されるコロケーション分類モジュールとを含む。
提案モデルの性能を評価するため,20,000のファッション衣装からなる大規模データセットを構築した。
このデータセットの大規模な実験結果から、OutfitGANは写真リアルな衣装を合成し、類似性、真正性、互換性の測定で最先端の手法を上回ります。
関連論文リスト
- Dressing the Imagination: A Dataset for AI-Powered Translation of Text into Fashion Outfits and A Novel KAN Adapter for Enhanced Feature Adaptation [2.3010373219231495]
FLORAは4,330種類のファッション服とそれに対応するテキスト記述を含む最初の包括的データセットである。
第2のコントリビューションとして,Kolmogorov-Arnold Networks (KAN) を適応モジュールとして利用する Kan Adapters を導入する。
さらなる研究とコラボレーションを促進するため、我々はFLORAと実装コードの両方をオープンソース化します。
論文 参考訳(メタデータ) (2024-11-21T07:27:45Z) - Is Synthetic Image Useful for Transfer Learning? An Investigation into Data Generation, Volume, and Utilization [62.157627519792946]
ブリッジドトランスファー(ブリッジドトランスファー)と呼ばれる新しいフレームワークを導入する。このフレームワークは、当初、トレーニング済みモデルの微調整に合成画像を使用し、転送性を向上させる。
合成画像と実画像のスタイルアライメントを改善するために,データセットスタイルの逆変換方式を提案する。
提案手法は10の異なるデータセットと5つの異なるモデルで評価され、一貫した改善が示されている。
論文 参考訳(メタデータ) (2024-03-28T22:25:05Z) - Lost Your Style? Navigating with Semantic-Level Approach for
Text-to-Outfit Retrieval [2.07180164747172]
ファッションレコメンデーションの基盤となるアプローチとして,テキスト・ツー・アウトフィット検索タスクを導入する。
我々のモデルは3つのセマンティックレベル、スタイル、服装で考案され、各レベルがデータを段階的に集約し、一貫性のある服装勧告を形成する。
メリーランド・ポリボアとポリボア・アウトフィットのデータセットを用いて,本手法はテキストビデオ検索タスクにおける最先端モデルよりも有意に優れていた。
論文 参考訳(メタデータ) (2023-11-03T07:23:21Z) - ARMANI: Part-level Garment-Text Alignment for Unified Cross-Modal
Fashion Design [66.68194916359309]
クロスモーダルなファッション画像合成は、世代領域において最も有望な方向の1つとして現れてきた。
MaskCLIPは衣服をセマンティックな部分に分解し、視覚情報とテキスト情報の微粒化と意味的に正確なアライメントを確保する。
ArmANIは、学習したクロスモーダルコードブックに基づいて画像を一様トークンに識別し、Transformerを使用して実際の画像に対する画像トークンの分布をモデル化する。
論文 参考訳(メタデータ) (2022-08-11T03:44:02Z) - Dress Well via Fashion Cognitive Learning [18.867513936553195]
そこで本稿では,Fashion Cognitive Network (FCN) を提案する。
FCNには2つのサブモジュール、すなわち服用エンコーダとマルチラベルグラフニューラルネットワーク(ML-GCN)がある。
論文 参考訳(メタデータ) (2022-08-01T06:52:37Z) - VICTOR: Visual Incompatibility Detection with Transformers and
Fashion-specific contrastive pre-training [18.753508811614644]
Visual InCompatibility TransfORmer (VICTOR) は、1) 回帰としての全体的な互換性、2) ミスマッチアイテムの検出の2つのタスクに最適化されている。
Polyvore-MISFITと呼ばれる新しいデータセットを作成し、部分的にミスマッチした服を生成するために、Polyvoreの服のベンチマークを構築した。
一連のアブレーションと比較分析により、提案されたアーキテクチャは、現在のPolyvoreデータセットの最先端を競合し、越えることが可能であることを示している。
論文 参考訳(メタデータ) (2022-07-27T11:18:55Z) - Addressing the Cold-Start Problem in Outfit Recommendation Using Visual
Preference Modelling [51.147871738838305]
本稿では,新しい視覚的嗜好モデリング手法を活用することで,新規ユーザに対するコールドスタート問題に対処する。
機能重み付けクラスタリングによるアプローチの活用を実演し、時事指向の衣装レコメンデーションをパーソナライズする。
論文 参考訳(メタデータ) (2020-08-04T10:07:09Z) - Personalized Fashion Recommendation from Personal Social Media Data: An
Item-to-Set Metric Learning Approach [71.63618051547144]
ソーシャルメディアデータからパーソナライズされたファッションレコメンデーションの問題について検討する。
本稿では,ユーザの過去のファッションアイテムと新しいファッションアイテムとの類似性を学習する,アイテムツーセットのメトリック学習フレームワークを提案する。
提案手法の有効性を検証するために,実世界のソーシャルメディアデータセットを収集する。
論文 参考訳(メタデータ) (2020-05-25T23:24:24Z) - Fashion Recommendation and Compatibility Prediction Using Relational
Network [18.13692056232815]
我々は、新しい互換性学習モデルを開発するための関係ネットワーク(RN)を開発する。
FashionRNは、任意の数のアイテムを任意の順序で、服全体の互換性を学習する。
我々はPolyvoreのウェブサイトから収集した49,740の服の大規模なデータセットを用いてモデルを評価した。
論文 参考訳(メタデータ) (2020-05-13T21:00:54Z) - Learning Diverse Fashion Collocation by Neural Graph Filtering [78.9188246136867]
本稿では,グラフニューラルネットワークを用いて,フレキシブルなファッションアイテムセットをモデル化する新しいファッションコロケーションフレームワークであるNeural Graph Filteringを提案する。
エッジベクトルに対称演算を適用することにより、このフレームワークは様々な入力/出力を許容し、それらの順序に不変である。
提案手法を,Polyvoreデータセット,Polyvore-Dデータセット,Amazon Fashionデータセットの3つの一般的なベンチマークで評価した。
論文 参考訳(メタデータ) (2020-03-11T16:17:08Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。