論文の概要: Profiling Television Watching Behaviour Using Bayesian Hierarchical
Joint Models for Time-to-Event and Count Data
- arxiv url: http://arxiv.org/abs/2209.02626v1
- Date: Tue, 6 Sep 2022 16:29:15 GMT
- ステータス: 処理完了
- システム内更新日: 2022-09-07 14:49:07.698064
- Title: Profiling Television Watching Behaviour Using Bayesian Hierarchical
Joint Models for Time-to-Event and Count Data
- Title(参考訳): ベイズ階層ジョイントモデルを用いたテレビ視聴行動の時間・カウントデータへの適用
- Authors: Rafael A. Moral, Zhi Chen, Shuai Zhang, Sally McClean, Gabriel R.
Palma, Brahim Allan, Ian Kegel
- Abstract要約: 本稿では,テレビ視聴におけるイベント数に基づいて,顧客プロファイルを特徴付ける新しいベイズ階層型ジョイントモデルを提案する。
このモデルは、顧客毎の何千もの観測結果から、11の顧客レベルのパラメータ推定とランダムな影響まで、データの次元を大幅に削減します。
提案手法は,高記述性と予測能力を維持しながら,データの次元性を低減する効率的な方法である。
- 参考スコア(独自算出の注目度): 9.33192719245965
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Customer churn prediction is a valuable task in many industries. In
telecommunications it presents great challenges, given the high dimensionality
of the data, and how difficult it is to identify underlying frustration
signatures, which may represent an important driver regarding future churn
behaviour. Here, we propose a novel Bayesian hierarchical joint model that is
able to characterise customer profiles based on how many events take place
within different television watching journeys, and how long it takes between
events. The model drastically reduces the dimensionality of the data from
thousands of observations per customer to 11 customer-level parameter estimates
and random effects. We test our methodology using data from 40 BT customers (20
active and 20 who eventually cancelled their subscription) whose TV watching
behaviours were recorded from October to December 2019, totalling approximately
half a million observations. Employing different machine learning techniques
using the parameter estimates and random effects from the Bayesian hierarchical
model as features yielded up to 92\% accuracy predicting churn, associated with
100\% true positive rates and false positive rates as low as 14\% on a
validation set. Our proposed methodology represents an efficient way of
reducing the dimensionality of the data, while at the same time maintaining
high descriptive and predictive capabilities. We provide code to implement the
Bayesian model at https://github.com/rafamoral/profiling_tv_watching_behaviour.
- Abstract(参考訳): 顧客チャーン予測は多くの業界で貴重なタスクである。
通信において、データの高次元化と、将来のチャーン行動において重要な要因となるフラストレーションシグネチャの特定がいかに難しいかを考えると、これは大きな課題となる。
そこで本研究では,テレビ視聴の異なる旅の中でのイベント数とイベント間の時間とに基づいて,顧客プロファイルを特徴付ける新しいベイズ階層ジョイントモデルを提案する。
このモデルは、顧客毎の何千もの観測結果から、11の顧客レベルのパラメータ推定とランダムな影響まで、データの次元を大幅に削減します。
我々は,2019年10月から12月までにテレビ視聴行動を記録した40 BTユーザ(アクティブ20名,最終的にサブスクリプションをキャンセルした20名)のデータを用いて,方法論を検証した。
パラメータ推定とベイズ階層モデルによるランダム効果を特徴として用いた異なる機械学習手法を用いることで、チャーン予測の精度は最大 92\% となり、検証セット上での真正率 100\% と偽正率 14\% に関連づけられた。
提案手法は,高記述性と予測能力を維持しながら,データの次元性を低減する効率的な方法である。
ベイズモデルをhttps://github.com/rafamoral/profiling_tv_watching_behaviourで実装するためのコードを提供します。
関連論文リスト
- KODA: A Data-Driven Recursive Model for Time Series Forecasting and Data Assimilation using Koopman Operators [14.429071321401953]
非線形力学系における予測とデータ同化を統合したクープマン演算子に基づく手法を提案する。
特に、Fourierドメインフィルタを使用してデータを物理的コンポーネントに切り離し、そのダイナミクスはクープマン演算子によって正確に表現できる。
複数の時系列ベンチマークにおいて,KODAが既存の手法よりも優れていることを示す。
論文 参考訳(メタデータ) (2024-09-29T02:25:48Z) - PeFAD: A Parameter-Efficient Federated Framework for Time Series Anomaly Detection [51.20479454379662]
私たちはaを提案します。
フェデレートされた異常検出フレームワークであるPeFADは、プライバシーの懸念が高まっている。
我々は、4つの実際のデータセットに対して広範な評価を行い、PeFADは既存の最先端ベースラインを最大28.74%上回っている。
論文 参考訳(メタデータ) (2024-06-04T13:51:08Z) - Distance Matters For Improving Performance Estimation Under Covariate
Shift [18.68533487971233]
データセットのシフトの下では、サンプルがトレーニング分布から遠すぎると、信頼性スコアが低下する可能性がある。
実験結果から期待するトレーニング分布までの距離を考慮に入れれば,性能評価が大幅に向上することを示す。
本研究では, 自然分布と合成分布の広範にわたる13の画像分類課題に対する本手法の有効性を実証する。
論文 参考訳(メタデータ) (2023-08-14T15:49:19Z) - Data-OOB: Out-of-bag Estimate as a Simple and Efficient Data Value [17.340091573913316]
本研究では,バッジモデルのためのデータ評価手法であるData-OOBを提案する。
Data-OOBは、評価に106ドルのサンプルがあり、入力寸法が100である場合、1つのCPUプロセッサで2.25時間未満である。
提案手法は,誤ラベル付きデータを識別し,有用な(あるいは有害な)データポイントの集合を見出すことで,既存の最先端データ評価手法を著しく上回ることを示す。
論文 参考訳(メタデータ) (2023-04-16T08:03:58Z) - A Meta-Learning Approach to Predicting Performance and Data Requirements [163.4412093478316]
本稿では,モデルが目標性能に達するために必要なサンプル数を推定する手法を提案する。
モデル性能を推定するデファクト原理であるパワー法則が,小さなデータセットを使用する場合の誤差が大きいことが判明した。
本稿では,2つのデータを異なる方法で処理するPPL法について紹介する。
論文 参考訳(メタデータ) (2023-03-02T21:48:22Z) - The future is different: Large pre-trained language models fail in
prediction tasks [2.9005223064604078]
WALLSTREETBETS, ASKSCIENCE, THE DONALD, POLITICSの4つの新しいREDDITデータセットを紹介した。
まず,トピック分布が時間とともに変化するサブレディットからのポストの人気を予測した場合,LPLMは平均88%の性能低下を示すことを実証的に実証した。
次に、ニューラル変動動的トピックモデルとアテンションメカニズムを利用して、回帰タスクの時間的言語モデル表現を推論する簡単な手法を提案する。
論文 参考訳(メタデータ) (2022-11-01T11:01:36Z) - FitVid: Overfitting in Pixel-Level Video Prediction [117.59339756506142]
われわれはFitVidという新しいアーキテクチャを導入し、一般的なベンチマークに厳しいオーバーフィッティングを行えるようにした。
FitVidは、4つの異なるメトリクスで4つの異なるビデオ予測ベンチマークで現在の最先端モデルを上回っている。
論文 参考訳(メタデータ) (2021-06-24T17:20:21Z) - Back2Future: Leveraging Backfill Dynamics for Improving Real-time
Predictions in Future [73.03458424369657]
公衆衛生におけるリアルタイム予測では、データ収集は簡単で要求の多いタスクである。
過去の文献では「バックフィル」現象とそのモデル性能への影響についてはほとんど研究されていない。
我々は、与えられたモデルの予測をリアルタイムで洗練することを目的とした、新しい問題とニューラルネットワークフレームワークBack2Futureを定式化する。
論文 参考訳(メタデータ) (2021-06-08T14:48:20Z) - Variational Bayes survival analysis for unemployment modelling [0.0]
このモデルは、スロベニアの公共雇用サービスによって提供される2011年から2020年までのタイム・ツー・雇用データに基づいて評価される。
同様のモデルは、検閲されたレコードを含む多次元、高次のカテゴリデータで他の問題に適用することができる。
論文 参考訳(メタデータ) (2021-02-03T21:06:54Z) - Meta-Learned Confidence for Few-shot Learning [60.6086305523402]
数ショットのメトリックベースのアプローチのための一般的なトランスダクティブ推論手法は、最も確実なクエリ例の平均で、各クラスのプロトタイプを更新することである。
本稿では,各クエリの信頼度をメタラーニングして,ラベルのないクエリに最適な重みを割り当てる手法を提案する。
4つのベンチマークデータセットに対してメタ学習の信頼度で、少数ショットの学習モデルを検証した。
論文 参考訳(メタデータ) (2020-02-27T10:22:17Z) - A Multi-Channel Neural Graphical Event Model with Negative Evidence [76.51278722190607]
イベントデータセットは、タイムライン上で不規則に発生するさまざまなタイプのイベントのシーケンスである。
基礎となる強度関数を推定するために,非パラメトリックディープニューラルネットワーク手法を提案する。
論文 参考訳(メタデータ) (2020-02-21T23:10:50Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。