論文の概要: Multimodal Quasi-AutoRegression: Forecasting the visual popularity of
new fashion products
- arxiv url: http://arxiv.org/abs/2204.04014v1
- Date: Fri, 8 Apr 2022 11:53:54 GMT
- ステータス: 処理完了
- システム内更新日: 2022-04-11 16:31:06.605052
- Title: Multimodal Quasi-AutoRegression: Forecasting the visual popularity of
new fashion products
- Title(参考訳): Multimodal Quasi-AutoRegression:新しいファッション製品の視覚的人気を予測
- Authors: Stefanos I. Papadopoulos, Christos Koutlis, Symeon Papadopoulos,
Ioannis Kompatsiaris
- Abstract要約: ファッション業界の急速な変化のため、ファッションにおけるトレンド検出は難しい課題である。
コンピュータビジョンネットワークによって抽出されたマルチモーダル多層パーセプトロン処理のカテゴリと視覚的特徴であるMuQARを提案する。
VISUELLEデータセットの比較研究によると、MuQARはWAPEで2.88%、MAEで3.04%の競争力を持つ。
- 参考スコア(独自算出の注目度): 18.753508811614644
- License: http://creativecommons.org/licenses/by-sa/4.0/
- Abstract: Estimating the preferences of consumers is of utmost importance for the
fashion industry as appropriately leveraging this information can be beneficial
in terms of profit. Trend detection in fashion is a challenging task due to the
fast pace of change in the fashion industry. Moreover, forecasting the visual
popularity of new garment designs is even more demanding due to lack of
historical data. To this end, we propose MuQAR, a Multimodal
Quasi-AutoRegressive deep learning architecture that combines two modules: (1)
a multi-modal multi-layer perceptron processing categorical and visual features
extracted by computer vision networks and (2) a quasi-autoregressive neural
network modelling the time series of the product's attributes, which are used
as a proxy of temporal popularity patterns mitigating the lack of historical
data. We perform an extensive ablation analysis on two large scale image
fashion datasets, Mallzee-popularity and SHIFT15m to assess the adequacy of
MuQAR and also use the Amazon Reviews: Home and Kitchen dataset to assess
generalisability to other domains. A comparative study on the VISUELLE dataset,
shows that MuQAR is capable of competing and surpassing the domain's current
state of the art by 2.88% in terms of WAPE and 3.04% in terms of MAE.
- Abstract(参考訳): 消費者の好みを推定することはファッション業界にとって最も重要であり、この情報を適切に活用することは利益の面で有益である。
ファッション業界の変化の速さから、ファッションにおけるトレンド検出は難しい課題である。
また、歴史資料の欠如により、新しい衣料品の視覚的な人気の予測がさらに求められている。
そこで本稿では,(1)コンピュータビジョンネットワークが抽出したマルチモーダル多層パーセプトロン処理のカテゴリと視覚的特徴,(2)過去のデータ不足を緩和する時間的人気パターンのプロキシとして使用される製品属性の時系列をモデル化する準自己回帰ニューラルネットワークの2つのモジュールを組み合わせた,マルチモーダル準自己回帰型ディープラーニングアーキテクチャであるMuQARを提案する。
muqarの妥当性を評価し、他のドメインへの汎用性を評価するためにamazon reviews: home and kitchenデータセットを使用するため、2つの大規模画像ファッションデータセット、mallezee-popularityとshift15mの広範なアブレーション解析を行う。
visuelleデータセットの比較研究によれば、muqarは、wapeの面では2.88%、maeの3.4%、ドメインの現在の最先端技術と競合することができる。
関連論文リスト
- MetaTrading: An Immersion-Aware Model Trading Framework for Vehicular Metaverse Services [94.61039892220037]
本稿では,車載メタバースにおける拡張現実(AR)サービスの学習モデルを支援するために,メタバースユーザ(MU)にインセンティブを与える新しい没入型モデルトレーディングフレームワークを提案する。
動的ネットワーク条件とプライバシの懸念を考慮して、マルチエージェントマルコフ決定プロセスとしてMSPの報酬決定を定式化する。
実験により,提案フレームワークは,実AR関連車両データセット上でのARサービスにおいて,オブジェクト検出と分類のための高価値モデルを効果的に提供できることが示されている。
論文 参考訳(メタデータ) (2024-10-25T16:20:46Z) - Data Efficient Training with Imbalanced Label Sample Distribution for
Fashion Detection [5.912870746288055]
本稿では,長期データ分布を持つ多ラベル分類のためのディープニューラルネットワーク(DNN)の性能向上を目的とした,最先端の重み付き目的関数を提案する。
本実験では,ファッションアパレルのイメージに基づく属性分類を行い,新しい重み付け法に好適な性能を示した。
論文 参考訳(メタデータ) (2023-05-07T21:25:09Z) - Design-time Fashion Popularity Forecasting in VR Environments [9.621518697689128]
ファッションイメージを微調整したコンピュータビジョンパイプラインを開発し、関連する視覚特徴を抽出する。
我々は,新しい衣服の人気を予測できるマルチモーダル準自動回帰ニューラルネットワークであるMuQARを提案する。
提案されたHLSとMuQARはどちらも、主要なベンチマークデータセットの現在の最先端を越えられることを証明している。
論文 参考訳(メタデータ) (2022-12-14T12:30:03Z) - Multimodal Neural Network For Demand Forecasting [0.8602553195689513]
本稿では,ニュース記事からのリアルタイムイベントと,過去のセールスやホリデー情報といった従来のデータを組み合わせたマルチモーダルセールス予測ネットワークを提案する。
従来の販売予測手法と比較して,SMAPEの誤差測定値の平均改善率は7.37%と統計的に有意な改善を示した。
論文 参考訳(メタデータ) (2022-10-20T18:06:36Z) - Fashionformer: A simple, Effective and Unified Baseline for Human
Fashion Segmentation and Recognition [80.74495836502919]
本研究では,共同ファッションセグメンテーションと属性認識に着目した。
本稿では,セグメンテーションのためのオブジェクトクエリと属性予測のための属性クエリを紹介する。
属性ストリームのために,よりきめ細かい特徴を探索する新しいマルチレイヤレンダリングモジュールを設計する。
論文 参考訳(メタデータ) (2022-04-10T11:11:10Z) - Perceptual Score: What Data Modalities Does Your Model Perceive? [73.75255606437808]
モデルが入力特徴の異なる部分集合に依存する度合いを評価する指標である知覚スコアを導入する。
近年,視覚的質問応答に対するマルチモーダルモデルでは,前者よりも視覚的データを知覚しにくい傾向がみられた。
知覚スコアを使用することで、スコアをデータサブセットのコントリビューションに分解することで、モデルのバイアスを分析することもできる。
論文 参考訳(メタデータ) (2021-10-27T12:19:56Z) - Well Googled is Half Done: Multimodal Forecasting of New Fashion Product
Sales with Image-based Google Trends [13.873453929997776]
新しいファッション製品の売上予測は多くのビジネスダイナミクスを伴う難しい問題である。
本稿では,エンコーダが時系列の表現を学習するニューラルネットワークに基づくアプローチを提案する。
我々のモデルは非自己回帰的な方法で動作し、大きな第1ステップエラーの複合効果を避ける。
論文 参考訳(メタデータ) (2021-09-20T20:15:08Z) - Leveraging Multiple Relations for Fashion Trend Forecasting Based on
Social Media [72.06420633156479]
Relation Enhanced Attention Recurrent(REAR)ネットワークという改良モデルを提案する。
KERNと比較して、REARモデルはファッション要素間の関係だけでなく、ユーザグループ間の関係も活用する。
長期トレンド予測の性能をさらに向上させるために、REAR法はスライディング時間的注意メカニズムを考案する。
論文 参考訳(メタデータ) (2021-05-07T14:52:03Z) - Knowledge Enhanced Neural Fashion Trend Forecasting [81.2083786318119]
本研究は,特定のユーザグループを対象とした,きめ細かいファッション要素の傾向の調査に焦点をあてる。
まず、Instagramから収集した大規模なファッショントレンドデータセット(FIT)に、時系列のファッション要素の記録とユーザー情報を抽出した。
本稿では,時系列データモデリングにおける深部再帰型ニューラルネットワークの機能を利用する知識強化型ニューラルネットワークモデル(KERN)を提案する。
論文 参考訳(メタデータ) (2020-05-07T07:42:17Z) - Learning Diverse Fashion Collocation by Neural Graph Filtering [78.9188246136867]
本稿では,グラフニューラルネットワークを用いて,フレキシブルなファッションアイテムセットをモデル化する新しいファッションコロケーションフレームワークであるNeural Graph Filteringを提案する。
エッジベクトルに対称演算を適用することにより、このフレームワークは様々な入力/出力を許容し、それらの順序に不変である。
提案手法を,Polyvoreデータセット,Polyvore-Dデータセット,Amazon Fashionデータセットの3つの一般的なベンチマークで評価した。
論文 参考訳(メタデータ) (2020-03-11T16:17:08Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。