Fugu-MT 論文翻訳(概要): FIRST: A Million-Entry Dataset for Text-Driven Fashion Synthesis and Design

論文の概要: FIRST: A Million-Entry Dataset for Text-Driven Fashion Synthesis and Design

arxiv url: http://arxiv.org/abs/2311.07414v1
Date: Mon, 13 Nov 2023 15:50:25 GMT
ステータス: 翻訳完了
システム内更新日: 2023-11-14 14:01:18.626340
Title: FIRST: A Million-Entry Dataset for Text-Driven Fashion Synthesis and Design
Title（参考訳）: FIRST:テキスト駆動ファッション合成と設計のための100万エントリデータセット
Authors: Zhen Huang, Yihao Li, Dong Pei, Jiapeng Zhou, Xuliang Ning, Jianlin Han, Xiaoguang Han, Xuejun Chen
Abstract要約: リッチ構造化テキスト(FIRST)記述を用いた100万枚の高解像度ファッション画像からなる新しいデータセットを提案する。 FISRTでトレーニングされた一般的な生成モデルの実験は、FIRSTの必要性を示している。私たちはコミュニティに、よりインテリジェントなファッション合成とデザインシステムの開発を依頼します。
参考スコア（独自算出の注目度）: 10.556799226837535
License: http://creativecommons.org/licenses/by/4.0/
Abstract: Text-driven fashion synthesis and design is an extremely valuable part of artificial intelligence generative content(AIGC), which has the potential to propel a tremendous revolution in the traditional fashion industry. To advance the research on text-driven fashion synthesis and design, we introduce a new dataset comprising a million high-resolution fashion images with rich structured textual(FIRST) descriptions. In the FIRST, there is a wide range of attire categories and each image-paired textual description is organized at multiple hierarchical levels. Experiments on prevalent generative models trained over FISRT show the necessity of FIRST. We invite the community to further develop more intelligent fashion synthesis and design systems that make fashion design more creative and imaginative based on our dataset. The dataset will be released soon.
Abstract（参考訳）: テキストによるファッション合成とデザインは、人工知能生成コンテンツ(AIGC)の極めて貴重な部分であり、伝統的なファッション産業において大きな革命をもたらす可能性がある。テキスト駆動型ファッション合成とデザインの研究を進めるために,リッチ構造化テキスト(FIRST)記述を用いた100万枚の高解像度ファッション画像からなる新しいデータセットを提案する。 FIRSTには幅広い服装カテゴリーがあり、画像に見合った文章の記述は複数の階層レベルで整理される。 FISRTでトレーニングされた一般的な生成モデルの実験は、FIRSTの必要性を示している。私たちはコミュニティに、私たちのデータセットに基づいてファッションデザインをより創造的で想像力のあるものにする、よりインテリジェントなファッション合成とデザインシステムの開発を依頼します。データセットはまもなくリリースされる予定だ。

関連論文リスト

Rethinking Layered Graphic Design Generation with a Top-Down Approach [76.33538798060326]
図形デザインは、アイデアやメッセージを伝えるのに不可欠である。デザイナーは通常、編集を簡単にするために、オブジェクト、背景、ベクトル化されたテキスト層に作業を整理する。 GenAI方式の登場により、ピクセルフォーマットにおける高品質なグラフィックデザインの無限の供給がよりアクセスしやすくなってきた。これにもかかわらず、非層型設計は人間の設計を刺激し、レイアウトやテキストスタイルの選択に影響を与え、最終的に層型設計を導いた。本稿では,AI生成したデザインを編集可能な階層化設計に変換する最初の試みとして,グラフィックデザイン生成フレームワークであるAccordionを提案する。
論文参考訳（メタデータ） (2025-07-08T02:26:08Z)
Learning to Synthesize Compatible Fashion Items Using Semantic Alignment and Collocation Classification: An Outfit Generation Framework [59.09707044733695]
衣料品全体を合成することを目的とした,新しい衣料品生成フレームワークであるOutfitGANを提案する。 OutfitGANにはセマンティックアライメントモジュールがあり、既存のファッションアイテムと合成アイテムのマッピング対応を特徴付ける。提案モデルの性能を評価するため,20,000のファッション衣装からなる大規模データセットを構築した。
論文参考訳（メタデータ） (2025-02-05T12:13:53Z)
Dressing the Imagination: A Dataset for AI-Powered Translation of Text into Fashion Outfits and A Novel KAN Adapter for Enhanced Feature Adaptation [2.3010373219231495]
FLORAは4,330種類のファッション服とそれに対応するテキスト記述を含む最初の包括的データセットである。第2のコントリビューションとして,Kolmogorov-Arnold Networks (KAN) を適応モジュールとして利用する Kan Adapters を導入する。さらなる研究とコラボレーションを促進するため、我々はFLORAと実装コードの両方をオープンソース化します。
論文参考訳（メタデータ） (2024-11-21T07:27:45Z)
FashionSD-X: Multimodal Fashion Garment Synthesis using Latent Diffusion [11.646594594565098]
本研究では,遅延拡散モデルを用いて,ファッションデザインのプロセスを変えるための新しい生成パイプラインを提案する。我々は、スケッチデータを統合することで、マルチモーダルドレスコードやVITON-HDを含む最先端の仮想試行データセットを活用し、強化する。
論文参考訳（メタデータ） (2024-04-26T14:59:42Z)
Multimodal-Conditioned Latent Diffusion Models for Fashion Image Editing [40.70752781891058]
本稿では,マルチモーダルなファッション画像編集の課題に取り組む。本研究の目的は,テキスト,人体ポーズ,衣料品スケッチ,布地テクスチャなど,マルチモーダルなプロンプトでガイドされた人中心のファッションイメージを作成することである。
論文参考訳（メタデータ） (2024-03-21T20:43:10Z)
FashionReGen: LLM-Empowered Fashion Report Generation [61.84580616045145]
先進大言語モデル(LLM)に基づく知的ファッション分析・報告システムを提案する。具体的には、いくつかの重要な手順を備えた効果的なキャットウォーク分析に基づくFashionReGenの提供を試みる。また、他の領域における工業的重要性を持つより高度なタスクの探索にも刺激を与えている。
論文参考訳（メタデータ） (2024-03-11T12:29:35Z)
DressCode: Autoregressively Sewing and Generating Garments from Text Guidance [61.48120090970027]
DressCodeは、初心者向けのデザインを民主化し、ファッションデザイン、バーチャルトライオン、デジタルヒューマン創造において大きな可能性を秘めている。まず,テキスト条件の埋め込みとクロスアテンションを統合して縫製パターンを生成する,GPTベースのアーキテクチャであるSewingGPTを紹介する。次に、トレーニング済みの安定拡散を調整し、タイルベースの衣服用物理レンダリング(PBR)テクスチャを生成します。
論文参考訳（メタデータ） (2024-01-29T16:24:21Z)
Hierarchical Fashion Design with Multi-stage Diffusion Models [17.848891542772446]
クロスモーダルなファッション合成と編集は、ファッションデザイナーにインテリジェントなサポートを提供する。現在の拡散モデルは、画像合成における可換安定性と制御性を示している。共有多段階拡散モデルを用いた新しいファッションデザイン手法であるHieraFashDiffを提案する。
論文参考訳（メタデータ） (2024-01-15T03:38:57Z)
Quality and Quantity: Unveiling a Million High-Quality Images for Text-to-Image Synthesis in Fashion Design [14.588884182004277]
Fashion-Diffusion データセットは,多年にわたる厳格な努力の成果である。データセットは100万以上の高品質なファッションイメージで構成されており、詳細なテキスト記述と組み合わせている。 T2Iに基づくファッションデザイン分野の標準化を促進するために,ファッションデザインモデルの性能評価のための新しいベンチマークを提案する。
論文参考訳（メタデータ） (2023-11-19T06:43:11Z)
Social Media Fashion Knowledge Extraction as Captioning [61.41631195195498]
ソーシャルメディアにおけるファッション知識抽出の課題について検討する。ファッション知識を文変換法を用いて自然言語キャプションに変換する。このフレームワークは,ソーシャルメディア投稿から直接文ベースのファッション知識を生成することを目的としている。
論文参考訳（メタデータ） (2023-09-28T09:07:48Z)
FaD-VLP: Fashion Vision-and-Language Pre-training towards Unified Retrieval and Captioning [66.38951790650887]
ファッション分野におけるマルチモーダルタスクは、eコマースにとって大きな可能性を秘めている。本稿では,ファッションとテクストのペアから構築した弱教師付き三つ組に基づく,ファッション特有の事前学習フレームワークを提案する。 3重項に基づくタスクは、標準的なマルチモーダル事前学習タスクに有効な追加であることを示す。
論文参考訳（メタデータ） (2022-10-26T21:01:19Z)
ARMANI: Part-level Garment-Text Alignment for Unified Cross-Modal Fashion Design [66.68194916359309]
クロスモーダルなファッション画像合成は、世代領域において最も有望な方向の1つとして現れてきた。 MaskCLIPは衣服をセマンティックな部分に分解し、視覚情報とテキスト情報の微粒化と意味的に正確なアライメントを確保する。 ArmANIは、学習したクロスモーダルコードブックに基づいて画像を一様トークンに識別し、Transformerを使用して実際の画像に対する画像トークンの分布をモデル化する。
論文参考訳（メタデータ） (2022-08-11T03:44:02Z)
Knowledge Enhanced Neural Fashion Trend Forecasting [81.2083786318119]
本研究は,特定のユーザグループを対象とした,きめ細かいファッション要素の傾向の調査に焦点をあてる。まず、Instagramから収集した大規模なファッショントレンドデータセット(FIT)に、時系列のファッション要素の記録とユーザー情報を抽出した。本稿では,時系列データモデリングにおける深部再帰型ニューラルネットワークの機能を利用する知識強化型ニューラルネットワークモデル(KERN)を提案する。
論文参考訳（メタデータ） (2020-05-07T07:42:17Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。