論文の概要: End-to-End Image-Based Fashion Recommendation
- arxiv url: http://arxiv.org/abs/2205.02923v1
- Date: Thu, 5 May 2022 21:14:42 GMT
- ステータス: 処理完了
- システム内更新日: 2022-05-09 13:28:10.531991
- Title: End-to-End Image-Based Fashion Recommendation
- Title(参考訳): エンドツーエンド画像ベースファッションレコメンデーション
- Authors: Shereen Elsayed, Lukas Brinkmeyer and Lars Schmidt-Thieme
- Abstract要約: ファッションベースのレコメンデーション設定では、アイテムイメージの機能を取り入れることが重要な要素と考えられている。
本稿では,画像特徴を取り入れたシンプルな属性認識モデルを提案する。
2つの画像ベースの実世界のレコメンデータシステムデータセットの実験では、提案されたモデルが、最先端の画像ベースモデル全てを大幅に上回っていることが示されている。
- 参考スコア(独自算出の注目度): 5.210197476419621
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: In fashion-based recommendation settings, incorporating the item image
features is considered a crucial factor, and it has shown significant
improvements to many traditional models, including but not limited to matrix
factorization, auto-encoders, and nearest neighbor models. While there are
numerous image-based recommender approaches that utilize dedicated deep neural
networks, comparisons to attribute-aware models are often disregarded despite
their ability to be easily extended to leverage items' image features. In this
paper, we propose a simple yet effective attribute-aware model that
incorporates image features for better item representation learning in item
recommendation tasks. The proposed model utilizes items' image features
extracted by a calibrated ResNet50 component. We present an ablation study to
compare incorporating the image features using three different techniques into
the recommender system component that can seamlessly leverage any available
items' attributes. Experiments on two image-based real-world recommender
systems datasets show that the proposed model significantly outperforms all
state-of-the-art image-based models.
- Abstract(参考訳): ファッションベースのレコメンデーション設定では、アイテムイメージの機能を組み込むことが重要な要素と考えられており、行列の分解やオートエンコーダ、近隣のモデルに限らず、多くの伝統的なモデルに大幅に改善されている。
専用ディープニューラルネットワークを利用するイメージベースのレコメンダアプローチは数多く存在するが、属性認識モデルとの比較は、アイテムの画像機能を活用するために簡単に拡張できるにもかかわらず、しばしば無視される。
本稿では,アイテムレコメンデーションタスクにおいて,より優れた項目表現学習を実現するための画像特徴を組み込んだ,単純かつ効果的な属性認識モデルを提案する。
提案モデルは,キャリブレーションされたresnet50コンポーネントによって抽出されたアイテムのイメージ特徴を利用する。
本稿では,3つの異なる手法を用いた画像特徴を,利用可能なアイテムの属性をシームレスに活用できるレコメンデータシステムコンポーネントに組み込むことを比較検討する。
2つの画像ベースの実世界のレコメンダシステムに関する実験では、提案されたモデルが最先端の画像ベースモデルを大きく上回っていることが示されている。
関連論文リスト
- Generating Multi-Image Synthetic Data for Text-to-Image Customization [48.59231755159313]
テキスト・ツー・イメージ・モデルのカスタマイズにより、ユーザーはカスタムのコンセプトを挿入し、目に見えない設定でコンセプトを生成することができる。
既存の方法は、コストのかかるテストタイム最適化か、マルチイメージの監督なしにシングルイメージのトレーニングデータセットのトレーニングエンコーダに依存している。
両制約に対処する簡単なアプローチを提案する。
論文 参考訳(メタデータ) (2025-02-03T18:59:41Z) - Personalized Fashion Recommendation with Image Attributes and Aesthetics Assessment [15.423307815155534]
利用可能な情報、特に画像を2つのグラフ属性に変換することで、より正確なファッションレコメンデーションを提供することを目指している。
画像とテキストを2つのコンポーネントとして分離する従来の手法と比較して,提案手法は画像とテキスト情報を組み合わせてよりリッチな属性グラフを作成する。
IQON3000データセットの予備実験により,提案手法はベースラインと比較して競争精度が向上することを示した。
論文 参考訳(メタデータ) (2025-01-06T15:31:10Z) - FiVA: Fine-grained Visual Attribute Dataset for Text-to-Image Diffusion Models [112.94440113631897]
現在の方法では、ソース画像からアイデンティティとスタイルを抽出しようとする。
スタイル」は、テクスチャ、色、芸術的要素を含む広い概念であるが、照明や動力学など他の重要な要素をカバーしていない。
画像の美学を特定の視覚属性に分解するより効果的なアプローチを定式化し、ユーザーは異なる画像から照明、テクスチャ、ダイナミックスなどの特徴を適用できる。
論文 参考訳(メタデータ) (2024-12-10T17:02:58Z) - Multi-View Photometric Stereo Revisited [100.97116470055273]
多視点測光ステレオ(MVPS)は、画像から被写体を詳細に正確に3D取得する方法として好まれる。
MVPSは異方性や光沢などの他の対象物質と同様に,等方性に対しても有効である。
提案手法は、複数のベンチマークデータセットで広範囲にテストした場合に、最先端の結果を示す。
論文 参考訳(メタデータ) (2022-10-14T09:46:15Z) - Composition and Style Attributes Guided Image Aesthetic Assessment [66.60253358722538]
本稿では,画像の美学を自動予測する手法を提案する。
提案ネットワークには,意味的特徴抽出のための事前学習ネットワーク(Backbone)と,画像属性の予測にBackbone機能に依存するマルチレイヤパーセプトロン(MLP)ネットワーク(AttributeNet)が含まれる。
画像が与えられた場合、提案するマルチネットワークは、スタイルと構成属性、および美的スコア分布を予測できる。
論文 参考訳(メタデータ) (2021-11-08T17:16:38Z) - Contextual Similarity Aggregation with Self-attention for Visual
Re-ranking [96.55393026011811]
本稿では,自己注意を伴う文脈的類似性集約による視覚的再ランク付け手法を提案する。
提案手法の汎用性と有効性を示すため,4つのベンチマークデータセットの総合的な実験を行った。
論文 参考訳(メタデータ) (2021-10-26T06:20:31Z) - Inverting Adversarially Robust Networks for Image Synthesis [37.927552662984034]
本稿では,特徴反転モデルの知覚的プリミティブとしてロバスト表現を用いることを提案する。
画像として頑健な表現を採用することにより,CNNに基づく特徴反転モデルの再構成精度が大幅に向上することを示す。
そこで本研究では,ロバストな表現に基づく符号化復号ネットワークを提案し,異常検出,スタイル転送,画像復号化などの応用にその利点を示す。
論文 参考訳(メタデータ) (2021-06-13T05:51:00Z) - Apparel Recommender System based on Bilateral image shape features [0.0]
本研究では、二重畳み込みニューラルネットワーク(CNN)をレコメンダシステムに統合する新しい確率モデルを提案する。
アパレルグッズでは、ユーザとアイテムの画像形状特徴から訓練された2つのcnnを組み合わせて、ユーザとアイテムの潜在変数を最適化する。
我々のモデルは、他の推奨モデルよりも正確な結果を予測する。
論文 参考訳(メタデータ) (2021-05-04T14:48:38Z) - Adaptive Compact Attention For Few-shot Video-to-video Translation [13.535988102579918]
本稿では,複数の参照画像からコンテキスト特徴を効率的に抽出する適応型コンパクトアテンション機構を提案する。
我々の中心となる考え方は、すべての参照画像からより高レベルな表現としてコンパクトな基底集合を抽出することである。
提案手法を大規模トーキングヘッドビデオデータセットと人間のダンスデータセットで広範囲に評価した。
論文 参考訳(メタデータ) (2020-11-30T11:19:12Z) - Saliency-driven Class Impressions for Feature Visualization of Deep
Neural Networks [55.11806035788036]
分類に欠かせないと思われる特徴を視覚化することは有利である。
既存の可視化手法は,背景特徴と前景特徴の両方からなる高信頼画像を生成する。
本研究では,あるタスクにおいて最も重要であると考えられる識別的特徴を可視化するための,サリエンシ駆動型アプローチを提案する。
論文 参考訳(メタデータ) (2020-07-31T06:11:06Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。