論文の概要: Challenges and opportunities in applying Neural Temporal Point Processes
to large scale industry data
- arxiv url: http://arxiv.org/abs/2208.08623v1
- Date: Thu, 18 Aug 2022 03:55:08 GMT
- ステータス: 処理完了
- システム内更新日: 2022-08-19 13:50:54.392843
- Title: Challenges and opportunities in applying Neural Temporal Point Processes
to large scale industry data
- Title(参考訳): 大規模産業データにニューラルテンポラリポイントプロセスを適用するための挑戦と機会
- Authors: Dominykas \v{S}eputis, Jevgenij Gamper, Remigijus Paulavi\v{c}ius
- Abstract要約: NTPPモデルを,NTPPベンチマークの2倍の大きさの,新しい実世界の消費者行動データセットに適用する。
NTPPモデルは、理論上は魅力的であり、文献ベンチマークにおける主要な性能にもかかわらず、大規模データに対して容易にスケールできない。
コールドスタート問題に対処するため、静的ユーザ機能に基づくパラメータ化であるNTPPモデルへの新たな追加について検討する。
- 参考スコア(独自算出の注目度): 3.222802562733787
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: In this work, we identify open research opportunities in applying Neural
Temporal Point Process (NTPP) models to industry scale customer behavior data
by carefully reproducing NTPP models published up to date on known literature
benchmarks as well as applying NTPP models to a novel, real world consumer
behavior dataset that is twice as large as the largest publicly available NTPP
benchmark. We identify the following challenges. First, NTPP models, albeit
their generative nature, remain vulnerable to dataset imbalances and cannot
forecast rare events. Second, NTPP models based on stochastic differential
equations, despite their theoretical appeal and leading performance on
literature benchmarks, do not scale easily to large industry-scale data. The
former is in light of previously made observations on deep generative models.
Additionally, to combat a cold-start problem, we explore a novel addition to
NTPP models - a parametrization based on static user features.
- Abstract(参考訳): 本研究では,Nural Temporal Point Process (NTPP) モデルを産業規模の顧客行動データに適用するオープンリサーチの機会を,既知の文献ベンチマークで公表されているNTPPモデルを慎重に再現し,また,NTPP モデルを用いた新たな消費者行動データセットを提案する。
以下に示す課題を特定する。
まず、NTPPモデルは、その生成性にもかかわらず、データセットの不均衡に弱いままであり、稀な事象を予測できない。
第2に、統計的微分方程式に基づくNTPPモデルは、理論上の魅力と文献ベンチマークにおける主要な性能にもかかわらず、大規模データに容易にスケールできない。
前者は、前述した深層生成モデルに関する観測に照らしている。
さらに、コールドスタート問題に対処するために、静的ユーザ機能に基づいたパラメトリゼーションであるNTPPモデルへの新たな追加を検討します。
関連論文リスト
- F-FOMAML: GNN-Enhanced Meta-Learning for Peak Period Demand Forecasting with Proxy Data [65.6499834212641]
本稿では,需要予測をメタラーニング問題として定式化し,F-FOMAMLアルゴリズムを開発した。
タスク固有のメタデータを通してドメインの類似性を考慮することにより、トレーニングタスクの数が増加するにつれて過剰なリスクが減少する一般化を改善した。
従来の最先端モデルと比較して,本手法では需要予測精度が著しく向上し,内部自動販売機データセットでは平均絶対誤差が26.24%,JD.comデータセットでは1.04%削減された。
論文 参考訳(メタデータ) (2024-06-23T21:28:50Z) - Synthesizing Multimodal Electronic Health Records via Predictive Diffusion Models [69.06149482021071]
EHRPDと呼ばれる新しいEHRデータ生成モデルを提案する。
時間間隔推定を組み込んだ拡散モデルである。
我々は2つの公開データセットで実験を行い、忠実さ、プライバシー、実用性の観点からEPHPDを評価する。
論文 参考訳(メタデータ) (2024-06-20T02:20:23Z) - Cumulative Distribution Function based General Temporal Point Processes [49.758080415846884]
CuFunモデルは、累積分布関数(CDF)を中心に回転するTPPに対する新しいアプローチを表す
提案手法は従来のTPPモデリングに固有のいくつかの重要な問題に対処する。
コントリビューションには、先駆的なCDFベースのTPPモデルの導入、過去の事象情報を将来の事象予測に組み込む方法論の開発が含まれている。
論文 参考訳(メタデータ) (2024-02-01T07:21:30Z) - A PAC-Bayesian Perspective on the Interpolating Information Criterion [54.548058449535155]
補間系の性能に影響を及ぼす要因を特徴付ける一般モデルのクラスに対して,PAC-Bayes境界がいかに得られるかを示す。
オーバーパラメータ化モデルに対するテスト誤差が、モデルとパラメータの初期化スキームの組み合わせによって課される暗黙の正規化の品質に依存するかの定量化を行う。
論文 参考訳(メタデータ) (2023-11-13T01:48:08Z) - Does Synthetic Data Make Large Language Models More Efficient? [0.0]
本稿では,NLPにおける合成データ生成のニュアンスについて考察する。
データ拡張の可能性や構造化品種の導入など、その利点を強調します。
テンプレートベースの合成データが現代の変圧器モデルの性能に与える影響を実証する。
論文 参考訳(メタデータ) (2023-10-11T19:16:09Z) - On the Predictive Accuracy of Neural Temporal Point Process Models for
Continuous-time Event Data [3.13468877208035]
時間的ポイントプロセス(TPP)は、非同期イベントシーケンスを連続的にモデル化するための標準的な数学的フレームワークとして機能する。
ニューラルネットワークのパラメトリゼーションを活用し、より柔軟で効率的なモデリングを提供するNeural TPPを提案する。
本研究では,最先端のニューラルTPPモデルの予測精度を系統的に評価する。
論文 参考訳(メタデータ) (2023-06-29T16:14:43Z) - Exploring Generative Neural Temporal Point Process [37.1875644118684]
拡散モデルやスコアマッチングモデルのような生成モデルは、画像生成タスクにおいて大きな進歩を遂げた。
textbfneural textbftemporal textbfpoint textbfprocess に統一された textbfgenerative framework を設計することによって,このギャップを埋めようとしている。
論文 参考訳(メタデータ) (2022-08-03T06:56:28Z) - Back2Future: Leveraging Backfill Dynamics for Improving Real-time
Predictions in Future [73.03458424369657]
公衆衛生におけるリアルタイム予測では、データ収集は簡単で要求の多いタスクである。
過去の文献では「バックフィル」現象とそのモデル性能への影響についてはほとんど研究されていない。
我々は、与えられたモデルの予測をリアルタイムで洗練することを目的とした、新しい問題とニューラルネットワークフレームワークBack2Futureを定式化する。
論文 参考訳(メタデータ) (2021-06-08T14:48:20Z) - Neural Temporal Point Processes For Modelling Electronic Health Records [2.1836918611973366]
EHRを時間的ポイントプロセスによって生成されるサンプルとして扱う。
本稿では、TPPのニューラルネットワークパラメータ化を提案し、これを総合的にNeural TPPと呼ぶ。
以上の結果から,TPP は EHR において非TPP よりも有意に優れていた。
論文 参考訳(メタデータ) (2020-07-27T18:16:54Z) - Rethinking Generalization of Neural Models: A Named Entity Recognition
Case Study [81.11161697133095]
NERタスクをテストベッドとして、異なる視点から既存モデルの一般化挙動を分析する。
詳細な分析による実験は、既存のニューラルNERモデルのボトルネックを診断する。
本論文の副産物として,最近のNER論文の包括的要約を含むプロジェクトをオープンソース化した。
論文 参考訳(メタデータ) (2020-01-12T04:33:53Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。