論文の概要: Multimodal Temporal Fusion Transformers Are Good Product Demand
Forecasters
- arxiv url: http://arxiv.org/abs/2307.02578v1
- Date: Wed, 5 Jul 2023 18:23:13 GMT
- ステータス: 処理完了
- システム内更新日: 2023-07-07 16:24:51.091349
- Title: Multimodal Temporal Fusion Transformers Are Good Product Demand
Forecasters
- Title(参考訳): マルチモーダル・テンポラル・フュージョン変換器は需要予測に優れている
- Authors: Maarten Sukel, Stevan Rudinac, Marcel Worring
- Abstract要約: マルチモーダル需要予測は, 視覚情報, テキスト情報, コンテキスト情報を用いた製品需要予測を目的とした。
本稿では,畳み込み,グラフベース,トランスフォーマーベースのアーキテクチャを用いたマルチモーダル製品需要予測手法を提案する。
- 参考スコア(独自算出の注目度): 18.52252059555198
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Multimodal demand forecasting aims at predicting product demand utilizing
visual, textual, and contextual information. This paper proposes a method for
multimodal product demand forecasting using convolutional, graph-based, and
transformer-based architectures. Traditional approaches to demand forecasting
rely on historical demand, product categories, and additional contextual
information such as seasonality and events. However, these approaches have
several shortcomings, such as the cold start problem making it difficult to
predict product demand until sufficient historical data is available for a
particular product, and their inability to properly deal with category
dynamics. By incorporating multimodal information, such as product images and
textual descriptions, our architecture aims to address the shortcomings of
traditional approaches and outperform them. The experiments conducted on a
large real-world dataset show that the proposed approach effectively predicts
demand for a wide range of products. The multimodal pipeline presented in this
work enhances the accuracy and reliability of the predictions, demonstrating
the potential of leveraging multimodal information in product demand
forecasting.
- Abstract(参考訳): マルチモーダル需要予測は, 視覚情報, テキスト情報, コンテキスト情報を用いた製品需要予測を目的とした。
本稿では,畳み込み,グラフベース,トランスベースアーキテクチャを用いたマルチモーダル製品需要予測手法を提案する。
需要予測の伝統的なアプローチは、過去の需要、製品カテゴリ、季節やイベントなどの追加のコンテキスト情報に依存する。
しかし、これらのアプローチにはいくつかの欠点があり、例えばコールドスタート問題により、特定の製品で十分な履歴データが手に入るまで製品需要を予測することが難しくなり、カテゴリーのダイナミクスを適切に扱うことができない。
製品イメージやテキスト記述といったマルチモーダルな情報を取り入れることで,従来のアプローチの欠点に対処し,それを上回ることを目指しています。
大規模実世界のデータセットで実施した実験は,提案手法が幅広い製品に対する需要を効果的に予測することを示している。
本研究で提示されたマルチモーダルパイプラインは,予測の精度と信頼性を高め,製品需要予測におけるマルチモーダル情報活用の可能性を示す。
関連論文リスト
- Context is Key: A Benchmark for Forecasting with Essential Textual Information [87.3175915185287]
コンテキスト・イズ・キー (Context is Key) (CiK) は、時系列予測ベンチマークであり、様々な種類のテキストコンテキストと数値データをペアリングする。
我々は,統計モデル,時系列基礎モデル,LLMに基づく予測モデルなど,さまざまなアプローチを評価する。
実験では、文脈情報の導入の重要性を強調し、LLMに基づく予測モデルを用いた場合の驚くべき性能を示すとともに、それらの重要な欠点を明らかにした。
論文 参考訳(メタデータ) (2024-10-24T17:56:08Z) - Context Matters: Leveraging Contextual Features for Time Series Forecasting [2.9687381456164004]
既存の予測モデルにマルチモーダルなコンテキスト情報を外科的に統合する新しいプラグイン・アンド・プレイ手法であるContextFormerを導入する。
ContextFormerは、カテゴリ、連続、時間変化、さらにはテキスト情報を含む、リッチなマルチモーダルコンテキストから予測固有の情報を効果的に蒸留する。
エネルギー、交通、環境、金融ドメインにまたがるさまざまな実世界のデータセットにおいて、SOTA予測モデルを最大30%上回ります。
論文 参考訳(メタデータ) (2024-10-16T15:36:13Z) - Inter-Series Transformer: Attending to Products in Time Series Forecasting [5.459207333107234]
我々は,共有マルチタスク毎の時系列ネットワークを用いたトランスフォーマーに基づく新しい予測手法を開発した。
医療機器製造会社における需要予測の改善に本手法を適用したケーススタディを提案する。
論文 参考訳(メタデータ) (2024-08-07T16:22:21Z) - F-FOMAML: GNN-Enhanced Meta-Learning for Peak Period Demand Forecasting with Proxy Data [65.6499834212641]
本稿では,需要予測をメタラーニング問題として定式化し,F-FOMAMLアルゴリズムを開発した。
タスク固有のメタデータを通してドメインの類似性を考慮することにより、トレーニングタスクの数が増加するにつれて過剰なリスクが減少する一般化を改善した。
従来の最先端モデルと比較して,本手法では需要予測精度が著しく向上し,内部自動販売機データセットでは平均絶対誤差が26.24%,JD.comデータセットでは1.04%削減された。
論文 参考訳(メタデータ) (2024-06-23T21:28:50Z) - Towards Unified Multi-Modal Personalization: Large Vision-Language Models for Generative Recommendation and Beyond [87.1712108247199]
我々の目標は、マルチモーダルパーソナライゼーションシステム(UniMP)のための統一パラダイムを確立することである。
我々は、幅広いパーソナライズされたニーズに対処できる汎用的でパーソナライズされた生成フレームワークを開発する。
我々の手法は、パーソナライズされたタスクのための基礎言語モデルの能力を高める。
論文 参考訳(メタデータ) (2024-03-15T20:21:31Z) - Incorporating Pre-trained Model Prompting in Multimodal Stock Volume
Movement Prediction [22.949484374773967]
本稿では,PromptをベースとしたMUltimodal Stock volumE予測モデル(ProMUSE)を提案する。
金融ニュースの理解を深めるために、事前訓練された言語モデルを使用します。
また, この問題を緩和するため, 核融合ヘッドの横にある一方向の頭部を保ちながら, 新たな異方性コントラストアライメントを提案する。
論文 参考訳(メタデータ) (2023-09-11T16:47:01Z) - Deep Learning based Forecasting: a case study from the online fashion
industry [7.694480564850072]
本稿では,この予測問題に対するデータとモデリング手法の詳細と実験結果について述べる。
本稿では,この予測問題に対するデータとモデリング手法の詳細と実験結果について述べる。
論文 参考訳(メタデータ) (2023-05-23T13:30:35Z) - Multimodal Neural Network For Demand Forecasting [0.8602553195689513]
本稿では,ニュース記事からのリアルタイムイベントと,過去のセールスやホリデー情報といった従来のデータを組み合わせたマルチモーダルセールス予測ネットワークを提案する。
従来の販売予測手法と比較して,SMAPEの誤差測定値の平均改善率は7.37%と統計的に有意な改善を示した。
論文 参考訳(メタデータ) (2022-10-20T18:06:36Z) - Perceptual Score: What Data Modalities Does Your Model Perceive? [73.75255606437808]
モデルが入力特徴の異なる部分集合に依存する度合いを評価する指標である知覚スコアを導入する。
近年,視覚的質問応答に対するマルチモーダルモデルでは,前者よりも視覚的データを知覚しにくい傾向がみられた。
知覚スコアを使用することで、スコアをデータサブセットのコントリビューションに分解することで、モデルのバイアスを分析することもできる。
論文 参考訳(メタデータ) (2021-10-27T12:19:56Z) - Product1M: Towards Weakly Supervised Instance-Level Product Retrieval
via Cross-modal Pretraining [108.86502855439774]
弱教師付きマルチモーダル・インスタンスレベルの製品検索を目的とした,より現実的な設定について検討する。
実世界のインスタンスレベルの検索において,最も大規模なマルチモーダル化粧品データセットであるProduct1Mをコントリビュートする。
ケースレベルの予測検索(CAPTURE)のためのクロスモーダル・コントラサシブ・プロダクト・トランスフォーマーという新しいモデルを提案する。
論文 参考訳(メタデータ) (2021-07-30T12:11:24Z) - Pre-training Graph Transformer with Multimodal Side Information for
Recommendation [82.4194024706817]
本稿では,項目側情報とその関連性を考慮した事前学習戦略を提案する。
我々はMCNSamplingという新しいサンプリングアルゴリズムを開発し、各項目のコンテキスト近傍を選択する。
The proposed Pre-trained Multimodal Graph Transformer (PMGT) learns item representations with two objectives: 1) graph structure reconstruction, 2) masked node feature reconstruction。
論文 参考訳(メタデータ) (2020-10-23T10:30:24Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。