論文の概要: FIRST: A Million-Entry Dataset for Text-Driven Fashion Synthesis and
Design
- arxiv url: http://arxiv.org/abs/2311.07414v1
- Date: Mon, 13 Nov 2023 15:50:25 GMT
- ステータス: 処理完了
- システム内更新日: 2023-11-14 14:01:18.626340
- Title: FIRST: A Million-Entry Dataset for Text-Driven Fashion Synthesis and
Design
- Title(参考訳): FIRST:テキスト駆動ファッション合成と設計のための100万エントリデータセット
- Authors: Zhen Huang, Yihao Li, Dong Pei, Jiapeng Zhou, Xuliang Ning, Jianlin
Han, Xiaoguang Han, Xuejun Chen
- Abstract要約: リッチ構造化テキスト(FIRST)記述を用いた100万枚の高解像度ファッション画像からなる新しいデータセットを提案する。
FISRTでトレーニングされた一般的な生成モデルの実験は、FIRSTの必要性を示している。
私たちはコミュニティに、よりインテリジェントなファッション合成とデザインシステムの開発を依頼します。
- 参考スコア(独自算出の注目度): 10.556799226837535
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Text-driven fashion synthesis and design is an extremely valuable part of
artificial intelligence generative content(AIGC), which has the potential to
propel a tremendous revolution in the traditional fashion industry. To advance
the research on text-driven fashion synthesis and design, we introduce a new
dataset comprising a million high-resolution fashion images with rich
structured textual(FIRST) descriptions. In the FIRST, there is a wide range of
attire categories and each image-paired textual description is organized at
multiple hierarchical levels. Experiments on prevalent generative models
trained over FISRT show the necessity of FIRST. We invite the community to
further develop more intelligent fashion synthesis and design systems that make
fashion design more creative and imaginative based on our dataset. The dataset
will be released soon.
- Abstract(参考訳): テキストによるファッション合成とデザインは、人工知能生成コンテンツ(AIGC)の極めて貴重な部分であり、伝統的なファッション産業において大きな革命をもたらす可能性がある。
テキスト駆動型ファッション合成とデザインの研究を進めるために,リッチ構造化テキスト(FIRST)記述を用いた100万枚の高解像度ファッション画像からなる新しいデータセットを提案する。
FIRSTには幅広い服装カテゴリーがあり、画像に見合った文章の記述は複数の階層レベルで整理される。
FISRTでトレーニングされた一般的な生成モデルの実験は、FIRSTの必要性を示している。
私たちはコミュニティに、私たちのデータセットに基づいてファッションデザインをより創造的で想像力のあるものにする、よりインテリジェントなファッション合成とデザインシステムの開発を依頼します。
データセットはまもなくリリースされる予定だ。
関連論文リスト
- FashionReGen: LLM-Empowered Fashion Report Generation [61.84580616045145]
先進大言語モデル(LLM)に基づく知的ファッション分析・報告システムを提案する。
具体的には、いくつかの重要な手順を備えた効果的なキャットウォーク分析に基づくFashionReGenの提供を試みる。
また、他の領域における工業的重要性を持つより高度なタスクの探索にも刺激を与えている。
論文 参考訳(メタデータ) (2024-03-11T12:29:35Z) - DressCode: Autoregressively Sewing and Generating Garments from Text
Guidance [65.14645319768367]
初心者向けデザインの民主化を目的とした,テキスト駆動型3D衣料生成フレームワークDressCodeを紹介した。
筆者らはまず,テキストコンディショニングとクロスアテンションを統合したGPTアーキテクチャであるSewingGPTを紹介した。
大規模言語モデルを活用することにより,本フレームワークは自然言語インタラクションによりCGフレンドリーな衣服を生成する。
論文 参考訳(メタデータ) (2024-01-29T16:24:21Z) - Hierarchical Fashion Design with Multi-stage Diffusion Models [17.848891542772446]
クロスモーダルなファッション合成と編集は、ファッションデザイナーにインテリジェントなサポートを提供する。
現在の拡散モデルは、画像合成における可換安定性と制御性を示している。
共有多段階拡散モデルを用いた新しいファッションデザイン手法であるHieraFashDiffを提案する。
論文 参考訳(メタデータ) (2024-01-15T03:38:57Z) - Quality and Quantity: Unveiling a Million High-Quality Images for
Text-to-Image Synthesis in Fashion Design [15.07430279883459]
Fashion-Diffusion データセットは,多年にわたる厳格な努力の成果である。
データセットは100万以上の高品質なファッションイメージで構成されており、詳細なテキスト記述と組み合わせている。
T2Iに基づくファッションデザイン分野の標準化を促進するために,ファッションデザインモデルの性能評価のための新しいベンチマークを提案する。
論文 参考訳(メタデータ) (2023-11-19T06:43:11Z) - Social Media Fashion Knowledge Extraction as Captioning [61.41631195195498]
ソーシャルメディアにおけるファッション知識抽出の課題について検討する。
ファッション知識を文変換法を用いて自然言語キャプションに変換する。
このフレームワークは,ソーシャルメディア投稿から直接文ベースのファッション知識を生成することを目的としている。
論文 参考訳(メタデータ) (2023-09-28T09:07:48Z) - Multimodal Garment Designer: Human-Centric Latent Diffusion Models for
Fashion Image Editing [40.70752781891058]
本稿では,人間中心のファッション画像の生成を導くマルチモーダルなファッション画像編集の課題を提案する。
我々は遅延拡散モデルに基づく新しいアーキテクチャを提案することでこの問題に対処する。
タスクに適した既存のデータセットがないので、既存の2つのファッションデータセットも拡張します。
論文 参考訳(メタデータ) (2023-04-04T18:03:04Z) - TextileNet: A Material Taxonomy-based Fashion Textile Dataset [18.178308615950026]
繊維素材の識別と分類は、ファッション繊維分野において重要な役割を担っている。
ファブリック素材, 分類, ファブリック分類に基づくファブリックファブリックテキスタイルネットを構築した。
TextileNetは、繊維材料の最先端ディープラーニングモデルのトレーニングと評価に使用することができる。
論文 参考訳(メタデータ) (2023-01-15T19:02:18Z) - FaD-VLP: Fashion Vision-and-Language Pre-training towards Unified
Retrieval and Captioning [66.38951790650887]
ファッション分野におけるマルチモーダルタスクは、eコマースにとって大きな可能性を秘めている。
本稿では,ファッションとテクストのペアから構築した弱教師付き三つ組に基づく,ファッション特有の事前学習フレームワークを提案する。
3重項に基づくタスクは、標準的なマルチモーダル事前学習タスクに有効な追加であることを示す。
論文 参考訳(メタデータ) (2022-10-26T21:01:19Z) - ARMANI: Part-level Garment-Text Alignment for Unified Cross-Modal
Fashion Design [66.68194916359309]
クロスモーダルなファッション画像合成は、世代領域において最も有望な方向の1つとして現れてきた。
MaskCLIPは衣服をセマンティックな部分に分解し、視覚情報とテキスト情報の微粒化と意味的に正確なアライメントを確保する。
ArmANIは、学習したクロスモーダルコードブックに基づいて画像を一様トークンに識別し、Transformerを使用して実際の画像に対する画像トークンの分布をモデル化する。
論文 参考訳(メタデータ) (2022-08-11T03:44:02Z) - Knowledge Enhanced Neural Fashion Trend Forecasting [81.2083786318119]
本研究は,特定のユーザグループを対象とした,きめ細かいファッション要素の傾向の調査に焦点をあてる。
まず、Instagramから収集した大規模なファッショントレンドデータセット(FIT)に、時系列のファッション要素の記録とユーザー情報を抽出した。
本稿では,時系列データモデリングにおける深部再帰型ニューラルネットワークの機能を利用する知識強化型ニューラルネットワークモデル(KERN)を提案する。
論文 参考訳(メタデータ) (2020-05-07T07:42:17Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。