論文の概要: FCBoost-Net: A Generative Network for Synthesizing Multiple Collocated Outfits via Fashion Compatibility Boosting
- arxiv url: http://arxiv.org/abs/2502.00992v1
- Date: Mon, 03 Feb 2025 02:18:09 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-02-05 14:56:52.339560
- Title: FCBoost-Net: A Generative Network for Synthesizing Multiple Collocated Outfits via Fashion Compatibility Boosting
- Title(参考訳): FCBoost-Net:Fashion Compatibility Boostingを通じて複数のコラボレートアウトカムを合成するジェネレーティブネットワーク
- Authors: Dongliang Zhou, Haijun Zhang, Jianghong Ma, Jicong Fan, Zhao Zhang,
- Abstract要約: FCBoost-Netは,事前学習された生成モデルのパワーを利用する,服飾生成のための新しいフレームワークである。
FCBoost-Netは、複数のファッションアイテムをランダムに合成し、合成されたセットの互換性は、新しいファッションコンパチブルブースターを用いて、いくつかのラウンドで改善される。
実証的な証拠は、提案手法がランダムに合成されたファッションアイテムのファッション互換性を改善し、多様性を維持することができることを示している。
- 参考スコア(独自算出の注目度): 37.32190866187711
- License:
- Abstract: Outfit generation is a challenging task in the field of fashion technology, in which the aim is to create a collocated set of fashion items that complement a given set of items. Previous studies in this area have been limited to generating a unique set of fashion items based on a given set of items, without providing additional options to users. This lack of a diverse range of choices necessitates the development of a more versatile framework. However, when the task of generating collocated and diversified outfits is approached with multimodal image-to-image translation methods, it poses a challenging problem in terms of non-aligned image translation, which is hard to address with existing methods. In this research, we present FCBoost-Net, a new framework for outfit generation that leverages the power of pre-trained generative models to produce multiple collocated and diversified outfits. Initially, FCBoost-Net randomly synthesizes multiple sets of fashion items, and the compatibility of the synthesized sets is then improved in several rounds using a novel fashion compatibility booster. This approach was inspired by boosting algorithms and allows the performance to be gradually improved in multiple steps. Empirical evidence indicates that the proposed strategy can improve the fashion compatibility of randomly synthesized fashion items as well as maintain their diversity. Extensive experiments confirm the effectiveness of our proposed framework with respect to visual authenticity, diversity, and fashion compatibility.
- Abstract(参考訳): アウトフィット生成は、ファッションテクノロジーの分野で難しい課題であり、特定のアイテムを補完する一連のファッションアイテムを作成することを目的としている。
この領域におけるこれまでの研究は、特定のアイテムのセットに基づいたユニークなファッションアイテムのセットを、ユーザーに追加のオプションを提供することなく作成することに限定されてきた。
この多様な選択肢の欠如は、より汎用的なフレームワークの開発を必要とする。
しかし,マルチモーダルな画像から画像への変換手法では,コンロケーションや多角化を行うタスクがアプローチされる場合,既存の手法では対処が困難である非整列画像の変換において,困難な問題が発生する。
本研究では、事前学習した生成モデルのパワーを活用して、複数のコロケーションおよび多様化された衣装を生産する、新しい衣装生成フレームワークFCBoost-Netを提案する。
当初、FCBoost-Netは複数のファッションアイテムをランダムに合成し、合成されたセットの互換性は、新しいファッション互換ブースターを用いていくつかのラウンドで改善される。
このアプローチはアルゴリズムの強化にインスパイアされ、複数のステップで徐々にパフォーマンスが向上する。
実証的な証拠は、提案手法がランダムに合成されたファッションアイテムのファッション互換性を改善し、多様性を維持することができることを示している。
広範にわたる実験により,視覚的正当性,多様性,ファッションの整合性に関して,提案手法の有効性が確認された。
関連論文リスト
- UniFashion: A Unified Vision-Language Model for Multimodal Fashion Retrieval and Generation [29.489516715874306]
ファッション分野におけるマルチモーダル生成と検索タスクの課題を同時に解決する統合フレームワークUniFashionを提案する。
我々のモデルは、様々なファッションタスクにおいて、過去のシングルタスク・オブ・ザ・アーティファクトモデルよりも大幅に優れています。
論文 参考訳(メタデータ) (2024-08-21T03:17:20Z) - Multi-Garment Customized Model Generation [3.1679243514285194]
マルチゲージカスタマイズモデル生成は、潜在拡散モデル(LDM)に基づく統合フレームワークである
本フレームワークは,脱結合型マルチガーメント機能融合による複数衣服の条件生成を支援する。
提案する衣料エンコーダは,他の拡張モジュールと組み合わせることができるプラグアンドプレイモジュールである。
論文 参考訳(メタデータ) (2024-08-09T17:57:33Z) - AnyFit: Controllable Virtual Try-on for Any Combination of Attire Across Any Scenario [50.62711489896909]
AnyFitは、高解像度のベンチマークと実世界のデータのベースラインを、大きなギャップで上回っている。
AnyFitの高忠実度バーチャル試作品における印象的なパフォーマンスは、あらゆるイメージから見ても、ファッションコミュニティにおける将来の研究の新たな道を切り開くものです。
論文 参考訳(メタデータ) (2024-05-28T13:33:08Z) - MMTryon: Multi-Modal Multi-Reference Control for High-Quality Fashion Generation [70.83668869857665]
MMTryonはマルチモーダルなマルチ参照VIrtual Try-ONフレームワークである。
テキスト命令と複数の衣料品画像を入力として、高品質な合成試行結果を生成することができる。
論文 参考訳(メタデータ) (2024-05-01T11:04:22Z) - FaD-VLP: Fashion Vision-and-Language Pre-training towards Unified
Retrieval and Captioning [66.38951790650887]
ファッション分野におけるマルチモーダルタスクは、eコマースにとって大きな可能性を秘めている。
本稿では,ファッションとテクストのペアから構築した弱教師付き三つ組に基づく,ファッション特有の事前学習フレームワークを提案する。
3重項に基づくタスクは、標準的なマルチモーダル事前学習タスクに有効な追加であることを示す。
論文 参考訳(メタデータ) (2022-10-26T21:01:19Z) - VICTOR: Visual Incompatibility Detection with Transformers and
Fashion-specific contrastive pre-training [18.753508811614644]
Visual InCompatibility TransfORmer (VICTOR) は、1) 回帰としての全体的な互換性、2) ミスマッチアイテムの検出の2つのタスクに最適化されている。
Polyvore-MISFITと呼ばれる新しいデータセットを作成し、部分的にミスマッチした服を生成するために、Polyvoreの服のベンチマークを構築した。
一連のアブレーションと比較分析により、提案されたアーキテクチャは、現在のPolyvoreデータセットの最先端を競合し、越えることが可能であることを示している。
論文 参考訳(メタデータ) (2022-07-27T11:18:55Z) - M6-Fashion: High-Fidelity Multi-modal Image Generation and Editing [51.033376763225675]
我々は、マルチモーダル制御のスタイルの事前知識と柔軟性を、1つの統合された2段階フレームワーク M6-Fashion に適用し、実践的なAI支援型ファッションデザインに焦点を当てる。
M6-Fashionは、非自己回帰生成の自己補正を利用して、推論速度を改善し、全体的な一貫性を高め、様々な信号制御をサポートする。
論文 参考訳(メタデータ) (2022-05-24T01:18:14Z) - Learning Diverse Fashion Collocation by Neural Graph Filtering [78.9188246136867]
本稿では,グラフニューラルネットワークを用いて,フレキシブルなファッションアイテムセットをモデル化する新しいファッションコロケーションフレームワークであるNeural Graph Filteringを提案する。
エッジベクトルに対称演算を適用することにより、このフレームワークは様々な入力/出力を許容し、それらの順序に不変である。
提案手法を,Polyvoreデータセット,Polyvore-Dデータセット,Amazon Fashionデータセットの3つの一般的なベンチマークで評価した。
論文 参考訳(メタデータ) (2020-03-11T16:17:08Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。