論文の概要: FIRST: A Million-Entry Dataset for Text-Driven Fashion Synthesis and
Design
- arxiv url: http://arxiv.org/abs/2311.07414v1
- Date: Mon, 13 Nov 2023 15:50:25 GMT
- ステータス: 処理完了
- システム内更新日: 2023-11-14 14:01:18.626340
- Title: FIRST: A Million-Entry Dataset for Text-Driven Fashion Synthesis and
Design
- Title(参考訳): FIRST:テキスト駆動ファッション合成と設計のための100万エントリデータセット
- Authors: Zhen Huang, Yihao Li, Dong Pei, Jiapeng Zhou, Xuliang Ning, Jianlin
Han, Xiaoguang Han, Xuejun Chen
- Abstract要約: リッチ構造化テキスト(FIRST)記述を用いた100万枚の高解像度ファッション画像からなる新しいデータセットを提案する。
FISRTでトレーニングされた一般的な生成モデルの実験は、FIRSTの必要性を示している。
私たちはコミュニティに、よりインテリジェントなファッション合成とデザインシステムの開発を依頼します。
- 参考スコア(独自算出の注目度): 10.556799226837535
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Text-driven fashion synthesis and design is an extremely valuable part of
artificial intelligence generative content(AIGC), which has the potential to
propel a tremendous revolution in the traditional fashion industry. To advance
the research on text-driven fashion synthesis and design, we introduce a new
dataset comprising a million high-resolution fashion images with rich
structured textual(FIRST) descriptions. In the FIRST, there is a wide range of
attire categories and each image-paired textual description is organized at
multiple hierarchical levels. Experiments on prevalent generative models
trained over FISRT show the necessity of FIRST. We invite the community to
further develop more intelligent fashion synthesis and design systems that make
fashion design more creative and imaginative based on our dataset. The dataset
will be released soon.
- Abstract(参考訳): テキストによるファッション合成とデザインは、人工知能生成コンテンツ(AIGC)の極めて貴重な部分であり、伝統的なファッション産業において大きな革命をもたらす可能性がある。
テキスト駆動型ファッション合成とデザインの研究を進めるために,リッチ構造化テキスト(FIRST)記述を用いた100万枚の高解像度ファッション画像からなる新しいデータセットを提案する。
FIRSTには幅広い服装カテゴリーがあり、画像に見合った文章の記述は複数の階層レベルで整理される。
FISRTでトレーニングされた一般的な生成モデルの実験は、FIRSTの必要性を示している。
私たちはコミュニティに、私たちのデータセットに基づいてファッションデザインをより創造的で想像力のあるものにする、よりインテリジェントなファッション合成とデザインシステムの開発を依頼します。
データセットはまもなくリリースされる予定だ。
関連論文リスト
- Dressing the Imagination: A Dataset for AI-Powered Translation of Text into Fashion Outfits and A Novel KAN Adapter for Enhanced Feature Adaptation [2.3010373219231495]
FLORAは4,330種類のファッション服とそれに対応するテキスト記述を含む最初の包括的データセットである。
第2のコントリビューションとして,Kolmogorov-Arnold Networks (KAN) を適応モジュールとして利用する Kan Adapters を導入する。
さらなる研究とコラボレーションを促進するため、我々はFLORAと実装コードの両方をオープンソース化します。
論文 参考訳(メタデータ) (2024-11-21T07:27:45Z) - FashionSD-X: Multimodal Fashion Garment Synthesis using Latent Diffusion [11.646594594565098]
本研究では,遅延拡散モデルを用いて,ファッションデザインのプロセスを変えるための新しい生成パイプラインを提案する。
我々は、スケッチデータを統合することで、マルチモーダルドレスコードやVITON-HDを含む最先端の仮想試行データセットを活用し、強化する。
論文 参考訳(メタデータ) (2024-04-26T14:59:42Z) - Multimodal-Conditioned Latent Diffusion Models for Fashion Image Editing [40.70752781891058]
本稿では,マルチモーダルなファッション画像編集の課題に取り組む。
本研究の目的は,テキスト,人体ポーズ,衣料品スケッチ,布地テクスチャなど,マルチモーダルなプロンプトでガイドされた人中心のファッションイメージを作成することである。
論文 参考訳(メタデータ) (2024-03-21T20:43:10Z) - FashionReGen: LLM-Empowered Fashion Report Generation [61.84580616045145]
先進大言語モデル(LLM)に基づく知的ファッション分析・報告システムを提案する。
具体的には、いくつかの重要な手順を備えた効果的なキャットウォーク分析に基づくFashionReGenの提供を試みる。
また、他の領域における工業的重要性を持つより高度なタスクの探索にも刺激を与えている。
論文 参考訳(メタデータ) (2024-03-11T12:29:35Z) - DressCode: Autoregressively Sewing and Generating Garments from Text Guidance [61.48120090970027]
DressCodeは、初心者向けのデザインを民主化し、ファッションデザイン、バーチャルトライオン、デジタルヒューマン創造において大きな可能性を秘めている。
まず,テキスト条件の埋め込みとクロスアテンションを統合して縫製パターンを生成する,GPTベースのアーキテクチャであるSewingGPTを紹介する。
次に、トレーニング済みの安定拡散を調整し、タイルベースの衣服用物理レンダリング(PBR)テクスチャを生成します。
論文 参考訳(メタデータ) (2024-01-29T16:24:21Z) - Hierarchical Fashion Design with Multi-stage Diffusion Models [17.848891542772446]
クロスモーダルなファッション合成と編集は、ファッションデザイナーにインテリジェントなサポートを提供する。
現在の拡散モデルは、画像合成における可換安定性と制御性を示している。
共有多段階拡散モデルを用いた新しいファッションデザイン手法であるHieraFashDiffを提案する。
論文 参考訳(メタデータ) (2024-01-15T03:38:57Z) - Quality and Quantity: Unveiling a Million High-Quality Images for Text-to-Image Synthesis in Fashion Design [14.588884182004277]
Fashion-Diffusion データセットは,多年にわたる厳格な努力の成果である。
データセットは100万以上の高品質なファッションイメージで構成されており、詳細なテキスト記述と組み合わせている。
T2Iに基づくファッションデザイン分野の標準化を促進するために,ファッションデザインモデルの性能評価のための新しいベンチマークを提案する。
論文 参考訳(メタデータ) (2023-11-19T06:43:11Z) - Social Media Fashion Knowledge Extraction as Captioning [61.41631195195498]
ソーシャルメディアにおけるファッション知識抽出の課題について検討する。
ファッション知識を文変換法を用いて自然言語キャプションに変換する。
このフレームワークは,ソーシャルメディア投稿から直接文ベースのファッション知識を生成することを目的としている。
論文 参考訳(メタデータ) (2023-09-28T09:07:48Z) - FaD-VLP: Fashion Vision-and-Language Pre-training towards Unified
Retrieval and Captioning [66.38951790650887]
ファッション分野におけるマルチモーダルタスクは、eコマースにとって大きな可能性を秘めている。
本稿では,ファッションとテクストのペアから構築した弱教師付き三つ組に基づく,ファッション特有の事前学習フレームワークを提案する。
3重項に基づくタスクは、標準的なマルチモーダル事前学習タスクに有効な追加であることを示す。
論文 参考訳(メタデータ) (2022-10-26T21:01:19Z) - ARMANI: Part-level Garment-Text Alignment for Unified Cross-Modal
Fashion Design [66.68194916359309]
クロスモーダルなファッション画像合成は、世代領域において最も有望な方向の1つとして現れてきた。
MaskCLIPは衣服をセマンティックな部分に分解し、視覚情報とテキスト情報の微粒化と意味的に正確なアライメントを確保する。
ArmANIは、学習したクロスモーダルコードブックに基づいて画像を一様トークンに識別し、Transformerを使用して実際の画像に対する画像トークンの分布をモデル化する。
論文 参考訳(メタデータ) (2022-08-11T03:44:02Z) - Knowledge Enhanced Neural Fashion Trend Forecasting [81.2083786318119]
本研究は,特定のユーザグループを対象とした,きめ細かいファッション要素の傾向の調査に焦点をあてる。
まず、Instagramから収集した大規模なファッショントレンドデータセット(FIT)に、時系列のファッション要素の記録とユーザー情報を抽出した。
本稿では,時系列データモデリングにおける深部再帰型ニューラルネットワークの機能を利用する知識強化型ニューラルネットワークモデル(KERN)を提案する。
論文 参考訳(メタデータ) (2020-05-07T07:42:17Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。