論文の概要: Dressing the Imagination: A Dataset for AI-Powered Translation of Text into Fashion Outfits and A Novel KAN Adapter for Enhanced Feature Adaptation
- arxiv url: http://arxiv.org/abs/2411.13901v1
- Date: Thu, 21 Nov 2024 07:27:45 GMT
- ステータス: 翻訳完了
- システム内更新日: 2024-11-22 15:19:10.145821
- Title: Dressing the Imagination: A Dataset for AI-Powered Translation of Text into Fashion Outfits and A Novel KAN Adapter for Enhanced Feature Adaptation
- Title(参考訳): Dressing the Imagination: AIによるテキストのファッション効果への変換のためのデータセットと機能適応のための新しいkan Adapter
- Authors: Gayatri Deshmukh, Somsubhra De, Chirag Sehgal, Jishu Sen Gupta, Sparsh Mittal,
- Abstract要約: FLORAは4,330種類のファッション服とそれに対応するテキスト記述を含む最初の包括的データセットである。
第2のコントリビューションとして,Kolmogorov-Arnold Networks (KAN) を適応モジュールとして利用する Kan Adapters を導入する。
さらなる研究とコラボレーションを促進するため、我々はFLORAと実装コードの両方をオープンソース化します。
- 参考スコア(独自算出の注目度): 2.3010373219231495
- License:
- Abstract: Specialized datasets that capture the fashion industry's rich language and styling elements can boost progress in AI-driven fashion design. We present FLORA (Fashion Language Outfit Representation for Apparel Generation), the first comprehensive dataset containing 4,330 curated pairs of fashion outfits and corresponding textual descriptions. Each description utilizes industry-specific terminology and jargon commonly used by professional fashion designers, providing precise and detailed insights into the outfits. Hence, the dataset captures the delicate features and subtle stylistic elements necessary to create high-fidelity fashion designs. We demonstrate that fine-tuning generative models on the FLORA dataset significantly enhances their capability to generate accurate and stylistically rich images from textual descriptions of fashion sketches. FLORA will catalyze the creation of advanced AI models capable of comprehending and producing subtle, stylistically rich fashion designs. It will also help fashion designers and end-users to bring their ideas to life. As a second orthogonal contribution, we introduce KAN Adapters, which leverage Kolmogorov-Arnold Networks (KAN) as adaptive modules. They serve as replacements for traditional MLP-based LoRA adapters. With learnable spline-based activations, KAN Adapters excel in modeling complex, non-linear relationships, achieving superior fidelity, faster convergence and semantic alignment. Extensive experiments and ablation studies on our proposed FLORA dataset validate the superiority of KAN Adapters over LoRA adapters. To foster further research and collaboration, we will open-source both the FLORA and our implementation code.
- Abstract(参考訳): ファッション産業のリッチ言語とスタイリング要素をキャプチャする特別なデータセットは、AI駆動のファッションデザインの進歩を促進することができる。
FLORA(Fashion Language Outfit Representation for Apparel Generation)は,ファッション服4,330のキュレートされたペアとそれに対応するテキスト記述を含む,最初の包括的データセットである。
それぞれの説明は、プロのファッションデザイナーがよく使う業界固有の用語と用語を利用しており、衣装について正確に詳細な洞察を与えている。
したがって、データセットは、高忠実度ファッションデザインを作成するために必要な繊細な特徴と微妙なスタイル要素をキャプチャする。
FLORAデータセット上の微調整生成モデルは、ファッションスケッチのテキスト記述から正確でスタイリスティックにリッチな画像を生成する能力を著しく向上することを示した。
FLORAは、微妙でスタイリスティックにリッチなファッションデザインを解釈し、生産できる高度なAIモデルの作成を触媒する。
また、ファッションデザイナーやエンドユーザが自分のアイデアを生き返らせるのにも役立ちます。
第2の直交的寄与として、Kan Adaptersを導入し、Kolmogorov-Arnold Networks (KAN) を適応モジュールとして活用する。
従来のMLPベースのLoRAアダプタの代替となる。
学習可能なスプラインベースのアクティベーションにより、Kan Adaptersは複雑な非線形関係のモデリングに優れ、優れた忠実さ、より高速な収束、セマンティックアライメントを実現している。
提案したFLORAデータセットの広汎な実験とアブレーション実験により、LORAアダプタよりもKANアダプタの方が優れていることが検証された。
さらなる研究とコラボレーションを促進するため、我々はFLORAと実装コードの両方をオープンソース化します。
関連論文リスト
- Learning to Synthesize Compatible Fashion Items Using Semantic Alignment and Collocation Classification: An Outfit Generation Framework [59.09707044733695]
衣料品全体を合成することを目的とした,新しい衣料品生成フレームワークであるOutfitGANを提案する。
OutfitGANにはセマンティックアライメントモジュールがあり、既存のファッションアイテムと合成アイテムのマッピング対応を特徴付ける。
提案モデルの性能を評価するため,20,000のファッション衣装からなる大規模データセットを構築した。
論文 参考訳(メタデータ) (2025-02-05T12:13:53Z) - Towards Intelligent Design: A Self-driven Framework for Collocated Clothing Synthesis Leveraging Fashion Styles and Textures [17.35328594773488]
衣料品合成(CCS)はファッション技術において重要な話題となっている。
これまでの調査では、上着と下着のペアのようなペアの衣装を使って、この課題を達成するための生成モデルを訓練していた。
そこで我々は,組立衣料を必要とせず,組立衣料を合成する,スタイル・テクスチャ誘導型生成ネットワーク(ST-Net)を新たに導入した。
論文 参考訳(メタデータ) (2025-01-23T05:46:08Z) - Decoding Style: Efficient Fine-Tuning of LLMs for Image-Guided Outfit Recommendation with Preference [4.667044856219814]
本稿では,大規模言語モデル(LLM)の表現力を利用した,個人化された衣装推薦手法を提案する。
MLLM(Multimodal Large Language Model)を用いた画像キャプションによる項目記述の視覚的・テキスト的ギャップを橋渡しする。
このフレームワークは、Polyvoreデータセットで評価され、その効果を2つの重要なタスク、すなわちFill-in-the-blankと補完的なアイテム検索で実証する。
論文 参考訳(メタデータ) (2024-09-18T17:15:06Z) - ArtWeaver: Advanced Dynamic Style Integration via Diffusion Model [73.95608242322949]
Stylized Text-to-Image Generation (STIG)は、テキストプロンプトとスタイル参照画像から画像を生成することを目的としている。
我々は、事前訓練された安定拡散を利用して、誤解釈スタイルや一貫性のない意味論といった課題に対処する新しいフレームワーク、ArtWeaverを提案する。
論文 参考訳(メタデータ) (2024-05-24T07:19:40Z) - FashionReGen: LLM-Empowered Fashion Report Generation [61.84580616045145]
先進大言語モデル(LLM)に基づく知的ファッション分析・報告システムを提案する。
具体的には、いくつかの重要な手順を備えた効果的なキャットウォーク分析に基づくFashionReGenの提供を試みる。
また、他の領域における工業的重要性を持つより高度なタスクの探索にも刺激を与えている。
論文 参考訳(メタデータ) (2024-03-11T12:29:35Z) - HieraFashDiff: Hierarchical Fashion Design with Multi-stage Diffusion Models [17.74292177764933]
ファッションデザインに適した,ヒエラファッシュディフ(HieraFashDiff)という新しい階層的拡散型フレームワークを提案する。
我々のモデルは、デノシングプロセスを2段階に展開することで、実用的なファッションデザインワークフローを模倣するように設計されている。
本モデルでは,ファッションデザイン生成と局所的なきめ細かい編集を一つのフレームワークでサポートする。
論文 参考訳(メタデータ) (2024-01-15T03:38:57Z) - HiCAST: Highly Customized Arbitrary Style Transfer with Adapter Enhanced
Diffusion Models [84.12784265734238]
Arbitrary Style Transfer (AST)の目標は、あるスタイル参照の芸術的特徴を所定の画像/ビデオに注入することである。
各種のセマンティックな手がかりに基づいてスタイリング結果を明示的にカスタマイズできるHiCASTを提案する。
新たな学習目標をビデオ拡散モデルトレーニングに活用し,フレーム間の時間的一貫性を大幅に向上させる。
論文 参考訳(メタデータ) (2024-01-11T12:26:23Z) - FIRST: A Million-Entry Dataset for Text-Driven Fashion Synthesis and
Design [10.556799226837535]
リッチ構造化テキスト(FIRST)記述を用いた100万枚の高解像度ファッション画像からなる新しいデータセットを提案する。
FISRTでトレーニングされた一般的な生成モデルの実験は、FIRSTの必要性を示している。
私たちはコミュニティに、よりインテリジェントなファッション合成とデザインシステムの開発を依頼します。
論文 参考訳(メタデータ) (2023-11-13T15:50:25Z) - Fashionformer: A simple, Effective and Unified Baseline for Human
Fashion Segmentation and Recognition [80.74495836502919]
本研究では,共同ファッションセグメンテーションと属性認識に着目した。
本稿では,セグメンテーションのためのオブジェクトクエリと属性予測のための属性クエリを紹介する。
属性ストリームのために,よりきめ細かい特徴を探索する新しいマルチレイヤレンダリングモジュールを設計する。
論文 参考訳(メタデータ) (2022-04-10T11:11:10Z) - Learning Diverse Fashion Collocation by Neural Graph Filtering [78.9188246136867]
本稿では,グラフニューラルネットワークを用いて,フレキシブルなファッションアイテムセットをモデル化する新しいファッションコロケーションフレームワークであるNeural Graph Filteringを提案する。
エッジベクトルに対称演算を適用することにより、このフレームワークは様々な入力/出力を許容し、それらの順序に不変である。
提案手法を,Polyvoreデータセット,Polyvore-Dデータセット,Amazon Fashionデータセットの3つの一般的なベンチマークで評価した。
論文 参考訳(メタデータ) (2020-03-11T16:17:08Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。