論文の概要: GarmentSketch: Large-scale Sketch-to-Fashion Benchmark
- arxiv url: http://arxiv.org/abs/2606.14025v1
- Date: Fri, 12 Jun 2026 01:58:35 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-06-15 16:00:42.706131
- Title: GarmentSketch: Large-scale Sketch-to-Fashion Benchmark
- Title(参考訳): GarmentSketch: 大規模なSketch-to-Fashionベンチマーク
- Authors: Duong-Duy-Khang Bui, Minh-Tan Pham, Tam V. Nguyen, Minh-Triet Tran, Trung-Nghia Le,
- Abstract要約: GarmentSketchは、21の衣服カテゴリーにわたる26,249のファッションスケッチからなる、新しいデータセットである。
我々はGarmentSketchを最先端の生成モデルでベンチマークし、スケッチ誘導による画像生成のベースライン性能を提供する。
GarmentSketchは、包括的で豊富な注釈付きリソースを提供することで、スケッチ理解、きめ細かいファッション画像生成、デザインにおける創造的な人間とAIのコラボレーションを促進する基盤を確立する。
- 参考スコア(独自算出の注目度): 21.93639380627745
- License: http://creativecommons.org/licenses/by-nc-sa/4.0/
- Abstract: Fashion sketching is a cornerstone of design workflows, allowing rapid visualization of creative concepts prior to physical prototyping. Yet, progress in sketch-based fashion image synthesis has been hindered by the absence of large-scale, high-quality paired resources. To bridge this gap, we present GarmentSketch, a novel dataset comprising 26,249 fashion sketches across 21 garment categories, each paired with detailed textual descriptions. Captions were produced through a multi-stage pipeline that integrates multiple multimodal large language models (MLLMs) with human-in-the-loop refinement, ensuring both semantic accuracy and descriptive richness. We benchmark GarmentSketch on state-of-the-art generative models, providing baseline performance for sketch-guided text-to-image generation. Our experiments reveal both the promise and the current limitations of existing methods. By offering a comprehensive and richly annotated resource, GarmentSketch establishes a foundation for advancing sketch understanding, fine-grained fashion image generation, and creative human-AI collaboration in design. The dataset will be available at: https://khangbdd.github.io/garmentsketch.
- Abstract(参考訳): ファッションスケッチはデザインワークフローの基盤であり、物理的なプロトタイピングの前に創造的な概念を素早く視覚化することができる。
しかし、スケッチベースのファッション画像合成の進歩は、大規模で高品質なペアリングリソースの欠如によって妨げられている。
このギャップを埋めるために、21の衣服カテゴリにわたる26,249のファッションスケッチからなる新しいデータセットであるGarmentSketchを紹介します。
キャプションはマルチステージパイプラインを通じて生成され、複数のマルチモーダルな大規模言語モデル(MLLM)と人間のループ内改良を統合し、セマンティックな精度と記述的な豊かさを確保した。
我々はGarmentSketchを最先端の生成モデルでベンチマークし、スケッチ誘導による画像生成のベースライン性能を提供する。
我々の実験は既存の手法の約束と現在の限界の両方を明らかにした。
GarmentSketchは、包括的で豊富な注釈付きリソースを提供することで、スケッチ理解、きめ細かいファッション画像生成、デザインにおける創造的な人間とAIのコラボレーションを促進する基盤を確立する。
データセットは、https://khangbdd.github.io/garmentsketch.comで提供される。
関連論文リスト
- LOTS of Fashion! Multi-Conditioning for Image Generation via Sketch-Text Pairing [13.90016469666642]
ファッション画像生成のためのLOTS(LOcalized Text and Sketch for fashion image generation)を提案する。
LOTSは、ペア化されたローカライズドスケッチ+テキスト情報の条件付けによるグローバルな記述を活用し、拡散適応のための新しいステップベースのマージ戦略を導入する。
提案手法を検証するため,Fashionpedia上に構築したSketchyは,画像毎に複数のテキスト-スケッチペアが提供される最初のファッションデータセットである。
論文 参考訳(メタデータ) (2025-07-30T12:48:29Z) - HiGarment: Cross-modal Harmony Based Diffusion Model for Flat Sketch to Realistic Garment Image [20.177936034245572]
HiGarmentは、テキストおよび視覚的モダリティ間のファブリック表現を強化する新しいフレームワークである。
本研究では,フラットスケッチとテキストガイダンスを統合し,リアルな衣料品画像を生成するFlat Sketch to Realistic Garment Image (FS2RG)を提案する。
衣料品生成のための最大のオープンソースデータセットであるMulti-modal Detailed Garmentを収集する。
論文 参考訳(メタデータ) (2025-05-29T07:23:40Z) - AIpparel: A Multimodal Foundation Model for Digital Garments [71.12933771326279]
縫製パターンの生成と編集のためのマルチモーダル基礎モデルであるAIpparelを紹介する。
当社のモデルでは,12万以上のユニークな衣服をカスタマイズした大規模データセット上で,最先端の大規模マルチモーダルモデルを微調整する。
本稿では,これらの複雑な縫製パターンを簡潔に符号化し,LLMが効率的に予測できる新しいトークン化手法を提案する。
論文 参考訳(メタデータ) (2024-12-05T07:35:19Z) - HAIFIT: Human-to-AI Fashion Image Translation [6.034505799418777]
本稿では,スケッチを高忠実なライフスタイルの衣料品画像に変換する新しいアプローチであるHAIFITを紹介する。
本手法は, ファッションデザインに欠かせない, 独特のスタイルの保存に優れ, 細部が複雑である。
論文 参考訳(メタデータ) (2024-03-13T16:06:07Z) - ARMANI: Part-level Garment-Text Alignment for Unified Cross-Modal
Fashion Design [66.68194916359309]
クロスモーダルなファッション画像合成は、世代領域において最も有望な方向の1つとして現れてきた。
MaskCLIPは衣服をセマンティックな部分に分解し、視覚情報とテキスト情報の微粒化と意味的に正確なアライメントを確保する。
ArmANIは、学習したクロスモーダルコードブックに基づいて画像を一様トークンに識別し、Transformerを使用して実際の画像に対する画像トークンの分布をモデル化する。
論文 参考訳(メタデータ) (2022-08-11T03:44:02Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。