論文の概要: Character-based Outfit Generation with Vision-augmented Style Extraction
via LLMs
- arxiv url: http://arxiv.org/abs/2402.05941v1
- Date: Fri, 2 Feb 2024 02:11:31 GMT
- ステータス: 処理完了
- システム内更新日: 2024-02-18 14:33:31.975979
- Title: Character-based Outfit Generation with Vision-augmented Style Extraction
via LLMs
- Title(参考訳): LLMを用いた視覚的スタイル抽出による文字ベースアウトフィット生成
- Authors: Najmeh Forouzandehmehr, Yijie Cao, Nikhil Thakurdesai, Ramin Giahi,
Luyi Ma, Nima Farrokhsiar, Jianpeng Xu, Evren Korpeoglu, Kannan Achan
- Abstract要約: 衣料品生成問題は、ユーザの興味に基づいて、完全な衣料品を推奨することを含む。
既存のアプローチでは、アンカーアイテムや特定のクエリスタイルに基づいたアイテムの推奨に重点を置いているが、映画やソーシャルメディアなどの有名キャラクターに対する顧客の関心は考慮していない。
我々は,文字情報を正確に解釈し,年齢や性別などの顧客仕様に従って完全な装束を生成することを目的とした,新しいキャラクタベースアウトフィット生成(COG)問題を定義する。
- 参考スコア(独自算出の注目度): 8.694568783952667
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: The outfit generation problem involves recommending a complete outfit to a
user based on their interests. Existing approaches focus on recommending items
based on anchor items or specific query styles but do not consider customer
interests in famous characters from movie, social media, etc. In this paper, we
define a new Character-based Outfit Generation (COG) problem, designed to
accurately interpret character information and generate complete outfit sets
according to customer specifications such as age and gender. To tackle this
problem, we propose a novel framework LVA-COG that leverages Large Language
Models (LLMs) to extract insights from customer interests (e.g., character
information) and employ prompt engineering techniques for accurate
understanding of customer preferences. Additionally, we incorporate
text-to-image models to enhance the visual understanding and generation
(factual or counterfactual) of cohesive outfits. Our framework integrates LLMs
with text-to-image models and improves the customer's approach to fashion by
generating personalized recommendations. With experiments and case studies, we
demonstrate the effectiveness of our solution from multiple dimensions.
- Abstract(参考訳): 衣装生成問題は、ユーザーの興味に基づいて、完全な衣装を推奨することを含む。
既存のアプローチではアンカーアイテムや特定のクエリスタイルに基づいてアイテムを推薦するが、映画やソーシャルメディアなどの有名キャラクターに対する顧客の関心は考慮していない。
本稿では,文字情報を正確に解釈し,年齢や性別などの顧客仕様に従って完全な衣装セットを生成することを目的とした,新しい文字ベース衣装生成(cog)問題を定義する。
そこで本研究では,大規模言語モデル(lva-cog)を活用し,客の興味(文字情報など)から洞察を抽出し,客の嗜好を正確に理解するための迅速な工学的手法を活用した,新しいlva-cogを提案する。
さらに,結束した衣装の視覚的理解と生成(実物的あるいは反物的)を高めるために,テキストから画像へのモデルを取り入れた。
本フレームワークは,LLMとテキスト・ツー・イメージ・モデルを統合し,パーソナライズされたレコメンデーションを生成することにより,顧客のファッションへのアプローチを改善する。
実験とケーススタディにより,複数次元からの解の有効性を実証する。
関連論文リスト
- Decoding Style: Efficient Fine-Tuning of LLMs for Image-Guided Outfit Recommendation with Preference [4.667044856219814]
本稿では,大規模言語モデル(LLM)の表現力を利用した,個人化された衣装推薦手法を提案する。
MLLM(Multimodal Large Language Model)を用いた画像キャプションによる項目記述の視覚的・テキスト的ギャップを橋渡しする。
このフレームワークは、Polyvoreデータセットで評価され、その効果を2つの重要なタスク、すなわちFill-in-the-blankと補完的なアイテム検索で実証する。
論文 参考訳(メタデータ) (2024-09-18T17:15:06Z) - Prompt2Fashion: An automatically generated fashion dataset [1.8817715864806608]
生成モデルを利用して、ユーザが指示するさまざまな機会、スタイル、身体タイプに合わせて、ファッションイメージデータセットを自動構築する。
我々は、異なるLarge Language Models(LLMs)を使用し、高度な美的品質、詳細、専門家と非専門家の双方の要求に関連のあるパーソナライズされた衣装を提供するための戦略を推進します。
論文 参考訳(メタデータ) (2024-09-10T11:48:05Z) - Lost Your Style? Navigating with Semantic-Level Approach for
Text-to-Outfit Retrieval [2.07180164747172]
ファッションレコメンデーションの基盤となるアプローチとして,テキスト・ツー・アウトフィット検索タスクを導入する。
我々のモデルは3つのセマンティックレベル、スタイル、服装で考案され、各レベルがデータを段階的に集約し、一貫性のある服装勧告を形成する。
メリーランド・ポリボアとポリボア・アウトフィットのデータセットを用いて,本手法はテキストビデオ検索タスクにおける最先端モデルよりも有意に優れていた。
論文 参考訳(メタデータ) (2023-11-03T07:23:21Z) - Exploring Large Language Model for Graph Data Understanding in Online
Job Recommendations [63.19448893196642]
本稿では,大規模言語モデルが提供するリッチな文脈情報と意味表現を利用して行動グラフを解析する新しいフレームワークを提案する。
この機能を利用することで、個々のユーザに対してパーソナライズされた、正確なジョブレコメンデーションが可能になる。
論文 参考訳(メタデータ) (2023-07-10T11:29:41Z) - Unsupervised Neural Stylistic Text Generation using Transfer learning
and Adapters [66.17039929803933]
応答生成のためのスタイル特化属性を学習するために,モデルパラメータの0.3%しか更新しない新しい転送学習フレームワークを提案する。
我々はPERSONALITY-CAPTIONSデータセットからスタイル固有の属性を学習する。
論文 参考訳(メタデータ) (2022-10-07T00:09:22Z) - An Application to Generate Style Guided Compatible Outfit [16.63265212958939]
我々は,新しいスタイルエンコーダネットワークを用いて,スタイルやテーマによってガイドされた衣装を作成することを目的としている。
様々な実験を通して,本手法の様々な側面を広範囲に解析する。
論文 参考訳(メタデータ) (2022-05-02T05:45:05Z) - Towards Personalized Answer Generation in E-Commerce via
Multi-Perspective Preference Modeling [62.049330405736406]
Eコマースプラットフォーム上での製品質問回答(PQA)は、インテリジェントオンラインショッピングアシスタントとして機能するため、注目を集めている。
なぜなら、多くの顧客は、自分でのみカスタマイズされた情報でパーソナライズされた回答を見たいと思っているからです。
PQAにおけるパーソナライズされた回答を生成するための,新しいマルチパースペクティブなユーザ嗜好モデルを提案する。
論文 参考訳(メタデータ) (2021-12-27T07:51:49Z) - Addressing the Cold-Start Problem in Outfit Recommendation Using Visual
Preference Modelling [51.147871738838305]
本稿では,新しい視覚的嗜好モデリング手法を活用することで,新規ユーザに対するコールドスタート問題に対処する。
機能重み付けクラスタリングによるアプローチの活用を実演し、時事指向の衣装レコメンデーションをパーソナライズする。
論文 参考訳(メタデータ) (2020-08-04T10:07:09Z) - Personalized Fashion Recommendation from Personal Social Media Data: An
Item-to-Set Metric Learning Approach [71.63618051547144]
ソーシャルメディアデータからパーソナライズされたファッションレコメンデーションの問題について検討する。
本稿では,ユーザの過去のファッションアイテムと新しいファッションアイテムとの類似性を学習する,アイテムツーセットのメトリック学習フレームワークを提案する。
提案手法の有効性を検証するために,実世界のソーシャルメディアデータセットを収集する。
論文 参考訳(メタデータ) (2020-05-25T23:24:24Z) - Learning Diverse Fashion Collocation by Neural Graph Filtering [78.9188246136867]
本稿では,グラフニューラルネットワークを用いて,フレキシブルなファッションアイテムセットをモデル化する新しいファッションコロケーションフレームワークであるNeural Graph Filteringを提案する。
エッジベクトルに対称演算を適用することにより、このフレームワークは様々な入力/出力を許容し、それらの順序に不変である。
提案手法を,Polyvoreデータセット,Polyvore-Dデータセット,Amazon Fashionデータセットの3つの一般的なベンチマークで評価した。
論文 参考訳(メタデータ) (2020-03-11T16:17:08Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。