論文の概要: FashionStylist: An Expert Knowledge-enhanced Multimodal Dataset for Fashion Understanding
- arxiv url: http://arxiv.org/abs/2604.09249v1
- Date: Fri, 10 Apr 2026 12:03:55 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-04-13 17:57:53.84673
- Title: FashionStylist: An Expert Knowledge-enhanced Multimodal Dataset for Fashion Understanding
- Title(参考訳): FashionStylist: ファッション理解のための知識強化型マルチモーダルデータセット
- Authors: Kaidong Feng, Zhuoxuan Huang, Huizhong Guo, Yuting Jin, Xinyu Chen, Yue Liang, Yifei Gai, Li Zhou, Yunshan Ma, Zhu Sun,
- Abstract要約: FashionStylistは、総合的および専門家レベルのファッション理解のためのエキスパートアノテーション付きベンチマークである。
FashionStylistは、アイテムレベルと服装レベルの両方で、専門的に根拠付けられたアノテーションを提供する。
着物間接地、装束完了、装束評価の3つの代表的タスクをサポートする。
- 参考スコア(独自算出の注目度): 14.029623403884179
- License: http://creativecommons.org/licenses/by-nc-sa/4.0/
- Abstract: Fashion understanding requires both visual perception and expert-level reasoning about style, occasion, compatibility, and outfit rationale. However, existing fashion datasets remain fragmented and task-specific, often focusing on item attributes, outfit co-occurrence, or weak textual supervision, and thus provide limited support for holistic outfit understanding. In this paper, we introduce FashionStylist, an expert-annotated benchmark for holistic and expert-level fashion understanding. Constructed through a dedicated fashion-expert annotation pipeline, FashionStylist provides professionally grounded annotations at both the item and outfit levels. It supports three representative tasks: outfit-to-item grounding, outfit completion, and outfit evaluation. These tasks cover realistic item recovery from complex outfits with layering and accessories, compatibility-aware composition beyond co-occurrence matching, and expert-level assessment of style, season, occasion, and overall coherence. Experimental results show that FashionStylist serves not only as a unified benchmark for multiple fashion tasks, but also as an effective training resource for improving grounding, completion, and outfit-level semantic evaluation in MLLM-based fashion systems.
- Abstract(参考訳): ファッション理解には、視覚的知覚と、スタイル、機会、互換性、服装の合理性に関する専門家レベルの推論の両方が必要である。
しかし、既存のファッションデータセットは断片化され、タスク固有のままであり、アイテム属性、服の共起性、あるいは弱いテキストの監督に重点を置いている。
本稿では、包括的および専門家レベルのファッション理解のためのエキスパートアノテーション付きベンチマークであるFashionStylistを紹介する。
FashionStylistは、ファッション専門家専用のアノテーションパイプラインを通じて構築され、アイテムレベルと衣装レベルの両方で専門的に基礎付けられたアノテーションを提供する。
着物間接地、装束完了、装束評価の3つの代表的タスクをサポートする。
これらのタスクは、階層化とアクセサリーを備えた複雑な衣装から現実的なアイテムの回復、互換性に配慮したコンポジション、スタイル、季節、機会、全体的なコヒーレンスに関する専門家レベルの評価を含む。
実験結果から,FashionStylistは複数のファッションタスクの統一ベンチマークとして機能するだけでなく,MLLMに基づくファッションシステムにおけるグラウンドニング,コンプリート,衣装レベルのセマンティックアセスメントを改善するための効果的なトレーニングリソースとしても機能することがわかった。
関連論文リスト
- OmniFashion: Towards Generalist Fashion Intelligence via Multi-Task Vision-Language Learning [39.27438949211405]
FashionXは100万スケールのデータセットで、衣装の中の目に見えるファッションアイテムを完全に注釈付けします。
オムニファシオン(OmniFashion)は、多様なファッションタスクを統一的なファッション対話パラダイムの下でブリッジする、視覚言語統合フレームワークである。
マルチサブタスクと検索ベンチマークの実験により、OmniFashionは強いタスクレベルの精度とクロスタスクの一般化を達成することが示された。
論文 参考訳(メタデータ) (2026-03-03T06:48:27Z) - COutfitGAN: Learning to Synthesize Compatible Outfits Supervised by Silhouette Masks and Fashion Styles [23.301719420997927]
本稿では,任意の数のファッションアイテムに基づいて,相補的で相補的なファッションアイテムを生成する新しいタスクを提案する。
特に,衣服を構成することができるファッションアイテムを考えると,この論文の目的は,特定のファッションアイテムと互換性のある他の補完的なファッションアイテムの写実的なイメージを合成することである。
これを実現するために、ピラミッドスタイル抽出器、衣装生成装置、UNetベースのリアル/フェイク判別器、コロケーション判別器を含む、CoutfitGANと呼ばれる衣服生成フレームワークを提案する。
論文 参考訳(メタデータ) (2025-02-12T03:32:28Z) - Learning to Synthesize Compatible Fashion Items Using Semantic Alignment and Collocation Classification: An Outfit Generation Framework [59.09707044733695]
衣料品全体を合成することを目的とした,新しい衣料品生成フレームワークであるOutfitGANを提案する。
OutfitGANにはセマンティックアライメントモジュールがあり、既存のファッションアイテムと合成アイテムのマッピング対応を特徴付ける。
提案モデルの性能を評価するため,20,000のファッション衣装からなる大規模データセットを構築した。
論文 参考訳(メタデータ) (2025-02-05T12:13:53Z) - MMTryon: Multi-Modal Multi-Reference Control for High-Quality Fashion Generation [70.83668869857665]
MMTryonはマルチモーダルなマルチ参照VIrtual Try-ONフレームワークである。
テキスト命令と複数の衣料品画像を入力として、高品質な合成試行結果を生成することができる。
論文 参考訳(メタデータ) (2024-05-01T11:04:22Z) - FashionReGen: LLM-Empowered Fashion Report Generation [61.84580616045145]
先進大言語モデル(LLM)に基づく知的ファッション分析・報告システムを提案する。
具体的には、いくつかの重要な手順を備えた効果的なキャットウォーク分析に基づくFashionReGenの提供を試みる。
また、他の領域における工業的重要性を持つより高度なタスクの探索にも刺激を与えている。
論文 参考訳(メタデータ) (2024-03-11T12:29:35Z) - Lost Your Style? Navigating with Semantic-Level Approach for
Text-to-Outfit Retrieval [2.07180164747172]
ファッションレコメンデーションの基盤となるアプローチとして,テキスト・ツー・アウトフィット検索タスクを導入する。
我々のモデルは3つのセマンティックレベル、スタイル、服装で考案され、各レベルがデータを段階的に集約し、一貫性のある服装勧告を形成する。
メリーランド・ポリボアとポリボア・アウトフィットのデータセットを用いて,本手法はテキストビデオ検索タスクにおける最先端モデルよりも有意に優れていた。
論文 参考訳(メタデータ) (2023-11-03T07:23:21Z) - Social Media Fashion Knowledge Extraction as Captioning [61.41631195195498]
ソーシャルメディアにおけるファッション知識抽出の課題について検討する。
ファッション知識を文変換法を用いて自然言語キャプションに変換する。
このフレームワークは,ソーシャルメディア投稿から直接文ベースのファッション知識を生成することを目的としている。
論文 参考訳(メタデータ) (2023-09-28T09:07:48Z) - FaD-VLP: Fashion Vision-and-Language Pre-training towards Unified
Retrieval and Captioning [66.38951790650887]
ファッション分野におけるマルチモーダルタスクは、eコマースにとって大きな可能性を秘めている。
本稿では,ファッションとテクストのペアから構築した弱教師付き三つ組に基づく,ファッション特有の事前学習フレームワークを提案する。
3重項に基づくタスクは、標準的なマルチモーダル事前学習タスクに有効な追加であることを示す。
論文 参考訳(メタデータ) (2022-10-26T21:01:19Z) - OutfitTransformer: Learning Outfit Representations for Fashion
Recommendation [6.890771095769622]
本稿では,全項目間の互換性関係を符号化した効果的な衣服レベルの表現を学習するフレームワークであるOutfitTransformerを提案する。
互換性予測のために,グローバルな装束表現を捕捉し,分類損失を用いてフレームワークを訓練するための装束トークンを設計する。
補完的な項目検索のために,対象項目の仕様を考慮に入れたターゲット項目トークンを設計する。
生成されたターゲットアイテムの埋め込みは、残りの服にマッチする互換性のあるアイテムを検索するために使用される。
論文 参考訳(メタデータ) (2022-04-11T00:55:40Z) - Semi-Supervised Visual Representation Learning for Fashion Compatibility [17.893627646979038]
そこで本研究では,フライ時に擬陽性で擬陰性な衣服を作成できる半教師付き学習手法を提案する。
トレーニングバッチ内の各ラベル付き服について、ラベル付服の各項目とラベル付品とをマッチングすることにより、擬似アウトフィットを得る。
我々はPolyvore、Polyvore-D、新たに作成した大規模Fashion Outfitsデータセットについて広範な実験を行った。
論文 参考訳(メタデータ) (2021-09-16T15:35:38Z) - Fashionpedia: Ontology, Segmentation, and an Attribute Localization
Dataset [62.77342894987297]
本稿では,インスタンス分割と局所化属性認識を共同で行う新しい属性・マスクRCNNモデルを提案する。
また、Fashionpediaで事前学習したインスタンスセグメンテーションモデルにより、ImageNetの事前学習よりも、他のファッションデータセットの転送学習性能が向上することを示す。
論文 参考訳(メタデータ) (2020-04-26T02:38:26Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。