Fugu-MT 論文翻訳(概要): Prompt2Fashion: An automatically generated fashion dataset

論文の概要: Prompt2Fashion: An automatically generated fashion dataset

arxiv url: http://arxiv.org/abs/2409.06442v2
Date: Thu, 12 Sep 2024 18:22:51 GMT
ステータス: 翻訳完了
システム内更新日: 2024-09-16 11:48:15.931561
Title: Prompt2Fashion: An automatically generated fashion dataset
Title（参考訳）: Prompt2Fashion: 自動生成されたファッションデータセット
Authors: Georgia Argyrou, Angeliki Dimitriou, Maria Lymperaiou, Giorgos Filandrianos, Giorgos Stamou,
Abstract要約: 生成モデルを利用して、ユーザが指示するさまざまな機会、スタイル、身体タイプに合わせて、ファッションイメージデータセットを自動構築する。我々は、異なるLarge Language Models(LLMs)を使用し、高度な美的品質、詳細、専門家と非専門家の双方の要求に関連のあるパーソナライズされた衣装を提供するための戦略を推進します。
参考スコア（独自算出の注目度）: 1.8817715864806608
License: http://creativecommons.org/licenses/by-nc-nd/4.0/
Abstract: Despite the rapid evolution and increasing efficacy of language and vision generative models, there remains a lack of comprehensive datasets that bridge the gap between personalized fashion needs and AI-driven design, limiting the potential for truly inclusive and customized fashion solutions. In this work, we leverage generative models to automatically construct a fashion image dataset tailored to various occasions, styles, and body types as instructed by users. We use different Large Language Models (LLMs) and prompting strategies to offer personalized outfits of high aesthetic quality, detail, and relevance to both expert and non-expert users' requirements, as demonstrated by qualitative analysis. Up until now the evaluation of the generated outfits has been conducted by non-expert human subjects. Despite the provided fine-grained insights on the quality and relevance of generation, we extend the discussion on the importance of expert knowledge for the evaluation of artistic AI-generated datasets such as this one. Our dataset is publicly available on GitHub at https://github.com/georgiarg/Prompt2Fashion.
Abstract（参考訳）: 言語と視覚生成モデルの急速な進化と効果の増大にもかかわらず、パーソナライズされたファッションニーズとAI駆動設計のギャップを埋める包括的なデータセットはいまだに欠如しており、真に包括的でカスタマイズされたファッションソリューションの可能性を制限する。本研究では、生成モデルを利用して、ユーザが指示するさまざまな機会、スタイル、身体タイプに合わせて、ファッションイメージデータセットを自動構築する。質的分析によって示されるように,我々は異なるLarge Language Model(LLM)を使用し,高度の美的品質,詳細,および専門家と非専門家の双方の要求に関連性のあるパーソナライズされた衣服を提供するための戦略を推進している。これまでのところ、生成した服の評価は、専門家でない被験者によって行われてきた。生成の質と関連性に関する詳細な知見を提供するにもかかわらず、我々は、このような芸術的AI生成データセットの評価において、専門家の知識の重要性についての議論を拡大する。データセットはGitHubでhttps://github.com/georgiarg/Prompt2Fashion.comで公開されている。

関連論文リスト

PSR: Scaling Multi-Subject Personalized Image Generation with Pairwise Subject-Consistency Rewards [86.1965460124838]
スケーラブルなマルチオブジェクトデータ生成パイプラインを提案する。まず、単一オブジェクトのパーソナライズモデルを用いて、マルチイメージおよびマルチオブジェクトシナリオの知識を得る。主観的整合性とテキスト制御性を両立させるため,ペアワイズ・サブジェスト・コンシスタンス・リワードを設計する。
論文参考訳（メタデータ） (2025-12-01T03:25:49Z)
Data Therapist: Eliciting Domain Knowledge from Subject Matter Experts Using Large Language Models [17.006423792670414]
我々は、ドメインの専門家が混在開始プロセスを通じて暗黙の知識を外部化するのに役立つWebベースのツールであるData Therapistを紹介します。得られた構造化知識ベースは、人間と自動化された可視化設計の両方に通知することができる。
論文参考訳（メタデータ） (2025-05-01T11:10:17Z)
Personalized Image Generation with Deep Generative Models: A Decade Survey [51.26287478042516]
本稿では、様々な生成モデルにまたがって、一般化されたパーソナライズされた画像生成についてレビューする。まず、異なる生成モデル間でパーソナライズプロセスを標準化する統合フレームワークを定義する。次に、各生成モデルにおけるパーソナライズ手法の詳細な分析を行い、そのユニークな貢献と革新を強調します。
論文参考訳（メタデータ） (2025-02-18T17:34:04Z)
Personalized Representation from Personalized Generation [36.848215621708235]
我々は、パーソナライズされた合成データを用いてパーソナライズされた表現を学習するという課題を定式化する。提案手法は,多様な下流タスクに対するパーソナライズされた表現学習を改善する。
論文参考訳（メタデータ） (2024-12-20T18:59:03Z)
IntroStyle: Training-Free Introspective Style Attribution using Diffusion Features [89.95303251220734]
本稿では,拡散モデルのみによって生成された特徴を用いて,スタイル帰属問題を解決するための学習自由フレームワークを提案する。これはイントロスペクティブなスタイル属性(IntroStyle)と表現され、スタイル検索の最先端モデルよりも優れたパフォーマンスを示す。また,芸術的スタイルを分離し,きめ細かなスタイル帰属性能を評価するために,スタイルハック(SHacks)の合成データセットも導入した。
論文参考訳（メタデータ） (2024-12-19T01:21:23Z)
Understanding Museum Exhibits using Vision-Language Reasoning [52.35301212718003]
博物館は、様々なエポック、文明、地域の文化遺産や歴史的遺物の保管所として機能している。ドメイン固有モデルは、インタラクティブなクエリ解決と歴史的洞察を得るために不可欠である。世界中の展示品に対して,65万枚の画像と2億枚の質問回答ペアの大規模なデータセットを収集し,キュレートする。
論文参考訳（メタデータ） (2024-12-02T10:54:31Z)
KITTEN: A Knowledge-Intensive Evaluation of Image Generation on Visual Entities [93.74881034001312]
テキスト・画像生成モデルにおける実体の忠実度に関する系統的研究を行う。我々はランドマークの建物、航空機、植物、動物など、幅広い現実世界の視覚的実体を生成する能力に焦点をあてる。その結果、最も高度なテキスト・画像モデルでさえ、正確な視覚的詳細を持つエンティティを生成できないことが判明した。
論文参考訳（メタデータ） (2024-10-15T17:50:37Z)
PersLLM: A Personified Training Approach for Large Language Models [66.16513246245401]
データ構築とモデルチューニングを改善するためのフレームワークPersLLMを提案する。データ利用が不十分な場合には、Chain-of-Thoughtプロンプトやアンチインダクションといった戦略を取り入れます。厳密な振舞いパターンを設計し,モデルの性格の特異性とダイナミズムを高めるために自動DPOを導入する。
論文参考訳（メタデータ） (2024-07-17T08:13:22Z)
Aligning Vision Models with Human Aesthetics in Retrieval: Benchmarks and Algorithms [91.19304518033144]
検索システムにおける視覚モデルと人間の審美基準の整合を図る。本研究では、視覚モデルと人間の美学をよりよく整合させるために、視覚モデルを微調整する嗜好に基づく強化学習手法を提案する。
論文参考訳（メタデータ） (2024-06-13T17:59:20Z)
Towards Unified Multi-Modal Personalization: Large Vision-Language Models for Generative Recommendation and Beyond [87.1712108247199]
我々の目標は、マルチモーダルパーソナライゼーションシステム(UniMP)のための統一パラダイムを確立することである。我々は、幅広いパーソナライズされたニーズに対処できる汎用的でパーソナライズされた生成フレームワークを開発する。我々の手法は、パーソナライズされたタスクのための基礎言語モデルの能力を高める。
論文参考訳（メタデータ） (2024-03-15T20:21:31Z)
User Modeling and User Profiling: A Comprehensive Survey [0.0]
本稿では,ユーザモデリングとプロファイリング研究の現状,進化,今後の方向性について調査する。我々は、初期のステレオタイプモデルから最新のディープラーニング技術までの開発をトレースする、歴史的概要を提供する。また、プライバシ保護技術に対する重要なニーズと、ユーザモデリングアプローチにおける説明可能性と公正性への推進にも対処する。
論文参考訳（メタデータ） (2024-02-15T02:06:06Z)
Quality and Quantity: Unveiling a Million High-Quality Images for Text-to-Image Synthesis in Fashion Design [14.588884182004277]
Fashion-Diffusion データセットは,多年にわたる厳格な努力の成果である。データセットは100万以上の高品質なファッションイメージで構成されており、詳細なテキスト記述と組み合わせている。 T2Iに基づくファッションデザイン分野の標準化を促進するために,ファッションデザインモデルの性能評価のための新しいベンチマークを提案する。
論文参考訳（メタデータ） (2023-11-19T06:43:11Z)
Foundational Models Defining a New Era in Vision: A Survey and Outlook [151.49434496615427]
視覚シーンの構成的性質を観察し、推論する視覚システムは、我々の世界を理解するのに不可欠である。モデルは、このようなモダリティと大規模なトレーニングデータとのギャップを埋めることを学び、コンテキスト推論、一般化、テスト時の迅速な機能を容易にした。このようなモデルの出力は、例えば、バウンディングボックスを設けて特定のオブジェクトをセグメント化したり、画像や映像シーンについて質問したり、言語命令でロボットの動作を操作することで対話的な対話を行うなど、リトレーニングすることなく、人為的なプロンプトによって変更することができる。
論文参考訳（メタデータ） (2023-07-25T17:59:18Z)
Unsupervised Neural Stylistic Text Generation using Transfer learning and Adapters [66.17039929803933]
応答生成のためのスタイル特化属性を学習するために,モデルパラメータの0.3%しか更新しない新しい転送学習フレームワークを提案する。我々はPERSONALITY-CAPTIONSデータセットからスタイル固有の属性を学習する。
論文参考訳（メタデータ） (2022-10-07T00:09:22Z)
FashionVQA: A Domain-Specific Visual Question Answering System [2.6924405243296134]
我々は、ファッション写真画像におけるアパレルに関する複雑な自然言語質問に答えるために、視覚的質問応答システム(VQA)を訓練する。最高のモデルの正確さは、人間が生成した質問に答える場合でも、人間の専門家レベルを超えます。大規模マルチモーダルなドメイン特化データセットを生成するための我々のアプローチは、自然言語で通信可能な特殊なモデルを訓練するためのパスを提供する。
論文参考訳（メタデータ） (2022-08-24T01:18:13Z)
StyleGAN-Human: A Data-Centric Odyssey of Human Generation [96.7080874757475]
この研究は、データ中心の観点から、"データエンジニアリング"における複数の重要な側面を調査します。さまざまなポーズやテクスチャを抽出した230万以上のサンプルで、大規模な人間の画像データセットを収集し、注釈付けします。本稿では,データサイズ,データ分布,データアライメントといった,スタイルGANに基づく人為的生成のためのデータ工学における3つの重要な要素について精査する。
論文参考訳（メタデータ） (2022-04-25T17:55:08Z)
Aesthetics, Personalization and Recommendation: A survey on Deep Learning in Fashion [3.202857828083949]
この調査は、ビジュアルデータの解釈と活用方法を深く掘り下げることで、それを達成するという、注目すべきアプローチを示している。美学は衣服の推奨において重要な役割を担っており、利用者の判断は衣服が美学と一致しているかどうかに大きく依存するが、従来のイメージは直接これを描写することはできない。この調査はまた、美学をアパレル推奨の重要な要素として認識する必要性を満たすために、テンソル因子分解モデルや条件付きランダム場モデルなどの注目すべきモデルも強調している。
論文参考訳（メタデータ） (2021-01-20T19:57:13Z)
Using Artificial Intelligence to Analyze Fashion Trends [0.76146285961466]
本研究では,人工知能(A.I.)アルゴリズムを用いたデータ駆動量抽象手法を提案する。 A.I.モデルは、さまざまなシナリオ下で大規模なデータセットのファッションイメージに基づいてトレーニングされた。 A.I.モデルは検出された領域の豊富な記述を生成でき、画像中の衣服を正確に結合できることがわかった。
論文参考訳（メタデータ） (2020-05-03T04:46:12Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。