論文の概要: The multi-modal universe of fast-fashion: the Visuelle 2.0 benchmark
- arxiv url: http://arxiv.org/abs/2204.06972v1
- Date: Thu, 14 Apr 2022 13:53:46 GMT
- ステータス: 処理完了
- システム内更新日: 2022-04-15 13:11:11.699958
- Title: The multi-modal universe of fast-fashion: the Visuelle 2.0 benchmark
- Title(参考訳): 高速ファッションのマルチモーダル宇宙:Visuelle 2.0ベンチマーク
- Authors: Geri Skenderi, Christian Joppi, Matteo Denitto, Berniero Scarpa, Marco
Cristani
- Abstract要約: Visuelle 2.0は、様々な予測問題に直面するのに役立つ最初のデータセットである。
ヌナリーの6シーズン/5355の衣料品のデータを含んでいる。
このシナリオでは,コンピュータビジョンの利用がいかに重要であるかを示す。
- 参考スコア(独自算出の注目度): 6.169396536042121
- License: http://creativecommons.org/licenses/by-nc-sa/4.0/
- Abstract: We present Visuelle 2.0, the first dataset useful for facing diverse
prediction problems that a fast-fashion company has to manage routinely.
Furthermore, we demonstrate how the use of computer vision is substantial in
this scenario. Visuelle 2.0 contains data for 6 seasons / 5355 clothing
products of Nuna Lie, a famous Italian company with hundreds of shops located
in different areas within the country. In particular, we focus on a specific
prediction problem, namely short-observation new product sale forecasting
(SO-fore). SO-fore assumes that the season has started and a set of new
products is on the shelves of the different stores. The goal is to forecast the
sales for a particular horizon, given a short, available past (few weeks),
since no earlier statistics are available. To be successful, SO-fore approaches
should capture this short past and exploit other modalities or exogenous data.
To these aims, Visuelle 2.0 is equipped with disaggregated data at the
item-shop level and multi-modal information for each clothing item, allowing
computer vision approaches to come into play. The main message that we deliver
is that the use of image data with deep networks boosts performances obtained
when using the time series in long-term forecasting scenarios, ameliorating the
WAPE by 8.2% and the MAE by 7.7%. The dataset is available at:
https://humaticslab.github.io/forecasting/visuelle.
- Abstract(参考訳): Visuelle 2.0は、高速ファッション企業が日常的に管理しなければならない様々な予測問題に直面するのに役立つ最初のデータセットです。
さらに,このシナリオにおいてコンピュータビジョンの利用が重要であることを示す。
visuelle 2.0には6シーズン/5355種類の衣料品が収められており、イタリアで有名な会社であり、国内各地に数百の店舗がある。
特に,特定の予測問題,すなわち短期観察型新製品販売予測(so-fore)に注目する。
so-foreは、季節が始まって、一連の新製品がそれぞれの店舗の棚にあると仮定している。
目標は、過去の統計が入手できないため、短い期間(2週間)を想定して、特定のホライズンズの売り上げを予測することである。
成功させるためには、SO-foreアプローチはこの短い過去を捉え、他のモダリティや外生データを利用する必要がある。
これらの目的のために、visuelle 2.0はアイテムショップレベルの分散データと各衣料品のマルチモーダル情報を備えており、コンピュータビジョンのアプローチが有効になっている。
私たちが提供する主なメッセージは、ディープネットワークによる画像データの利用は、時系列を長期予測シナリオで使用する際のパフォーマンスを向上し、WAPEを8.2%改善し、MAEを7.7%改善する、ということです。
データセットは、https://humaticslab.github.io/forecasting/visuelle。
関連論文リスト
- GIFT-Eval: A Benchmark For General Time Series Forecasting Model Evaluation [90.53485251837235]
時系列基礎モデルはゼロショット予測に優れ、明示的なトレーニングなしで多様なタスクを処理する。
GIFT-Evalは、多様なデータセットに対する評価を促進するための先駆的なベンチマークである。
GIFT-Evalには、144,000の時系列と17700万のデータポイントの23のデータセットが含まれている。
論文 参考訳(メタデータ) (2024-10-14T11:29:38Z) - F-FOMAML: GNN-Enhanced Meta-Learning for Peak Period Demand Forecasting with Proxy Data [65.6499834212641]
本稿では,需要予測をメタラーニング問題として定式化し,F-FOMAMLアルゴリズムを開発した。
タスク固有のメタデータを通してドメインの類似性を考慮することにより、トレーニングタスクの数が増加するにつれて過剰なリスクが減少する一般化を改善した。
従来の最先端モデルと比較して,本手法では需要予測精度が著しく向上し,内部自動販売機データセットでは平均絶対誤差が26.24%,JD.comデータセットでは1.04%削減された。
論文 参考訳(メタデータ) (2024-06-23T21:28:50Z) - LaDe: The First Comprehensive Last-mile Delivery Dataset from Industry [44.573471568516915]
LaDeは、業界から数百万のパッケージを備えた、最初の公開ラストマイルデリバリデータセットである。
実際の運用期間は6ヶ月で、21kクーリエの10万パッケージが対象だ。
LaDeには3つの特徴がある。
論文 参考訳(メタデータ) (2023-06-19T02:30:28Z) - Forecasting Future World Events with Neural Networks [68.43460909545063]
Autocastは数千の予測質問と付随するニュースコーパスを含むデータセットである。
ニュースコーパスは日付によって整理され、人間が過去の予測を行った条件を正確にシミュレートすることができる。
予測タスクで言語モデルをテストし、パフォーマンスが人間専門家のベースラインよりはるかに低いことを確認します。
論文 参考訳(メタデータ) (2022-06-30T17:59:14Z) - Joint Forecasting of Panoptic Segmentations with Difference Attention [72.03470153917189]
シーン内の全てのオブジェクトを共同で予測する新しいパノプティックセグメンテーション予測モデルについて検討する。
提案したモデルをCityscapesとAIODriveデータセット上で評価する。
論文 参考訳(メタデータ) (2022-04-14T17:59:32Z) - Multimodal Quasi-AutoRegression: Forecasting the visual popularity of
new fashion products [18.753508811614644]
ファッション業界の急速な変化のため、ファッションにおけるトレンド検出は難しい課題である。
コンピュータビジョンネットワークによって抽出されたマルチモーダル多層パーセプトロン処理のカテゴリと視覚的特徴であるMuQARを提案する。
VISUELLEデータセットの比較研究によると、MuQARはWAPEで2.88%、MAEで3.04%の競争力を持つ。
論文 参考訳(メタデータ) (2022-04-08T11:53:54Z) - Well Googled is Half Done: Multimodal Forecasting of New Fashion Product
Sales with Image-based Google Trends [13.873453929997776]
新しいファッション製品の売上予測は多くのビジネスダイナミクスを伴う難しい問題である。
本稿では,エンコーダが時系列の表現を学習するニューラルネットワークに基づくアプローチを提案する。
我々のモデルは非自己回帰的な方法で動作し、大きな第1ステップエラーの複合効果を避ける。
論文 参考訳(メタデータ) (2021-09-20T20:15:08Z) - Predicting seasonal influenza using supermarket retail records [59.18952050885709]
我々は,スーパーマーケットの小売データを,センチネルバスケットの識別を通じてインフルエンザの代替信号とみなす。
SVR(Support Vector Regression)モデルを用いて、季節性インフルエンザ発生の予測を行います。
論文 参考訳(メタデータ) (2020-12-08T16:30:43Z) - Predicting Future Sales of Retail Products using Machine Learning [0.0]
本稿では,1C社が提供する日次販売データからなる時系列データセットについて検討する。
目標は、過去のデータから、来月のすべての製品およびストアの総売上を予測することだ。
XGBoostはこのデータセットよりもLSTMよりも優れていることが判明した。
論文 参考訳(メタデータ) (2020-08-18T07:36:14Z) - A Bayesian Approach for Predicting Food and Beverage Sales in Staff
Canteens and Restaurants [2.362412515574206]
本稿では,ポイント・オブ・セールスシステムから取得したデータのみに基づく予測手法を提案する。
幅広い評価において,カジュアルなレストランで収集された2つのデータセットと,大きなスタッフの缶詰について検討する。
提案モデルがレストランデータの特徴に適合することを示す。
論文 参考訳(メタデータ) (2020-05-26T12:05:06Z) - Spatiotemporal Relationship Reasoning for Pedestrian Intent Prediction [57.56466850377598]
視覚データに対する推論は、ロボティクスとビジョンベースのアプリケーションにとって望ましい能力である。
本稿では,歩行者の意図を推論するため,現場の異なる物体間の関係を明らかにするためのグラフ上でのフレームワークを提案する。
歩行者の意図は、通りを横切る、あるいは横断しない将来の行動として定義され、自動運転車にとって非常に重要な情報である。
論文 参考訳(メタデータ) (2020-02-20T18:50:44Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。