論文の概要: Beyond Point Estimate: Inferring Ensemble Prediction Variation from
Neuron Activation Strength in Recommender Systems
- arxiv url: http://arxiv.org/abs/2008.07032v1
- Date: Mon, 17 Aug 2020 00:08:27 GMT
- ステータス: 処理完了
- システム内更新日: 2022-10-28 02:59:01.325921
- Title: Beyond Point Estimate: Inferring Ensemble Prediction Variation from
Neuron Activation Strength in Recommender Systems
- Title(参考訳): 点推定を超えて:リコメンダ系におけるニューロン活性化強度からのアンサンブル予測の変動を推定する
- Authors: Zhe Chen, Yuyan Wang, Dong Lin, Derek Zhiyuan Cheng, Lichan Hong, Ed
H. Chi, Claire Cui
- Abstract要約: Ensemble Methodは、予測不確実性推定のための最先端のベンチマークである。
予測のバリエーションは、様々なランダム性源から生じることを観察する。
本稿では,ニューロンの活性化強度の予測変動を推定し,活性化強度の特徴から強い予測力を示す。
- 参考スコア(独自算出の注目度): 21.392694985689083
- License: http://creativecommons.org/licenses/by-nc-sa/4.0/
- Abstract: Despite deep neural network (DNN)'s impressive prediction performance in
various domains, it is well known now that a set of DNN models trained with the
same model specification and the same data can produce very different
prediction results. Ensemble method is one state-of-the-art benchmark for
prediction uncertainty estimation. However, ensembles are expensive to train
and serve for web-scale traffic.
In this paper, we seek to advance the understanding of prediction variation
estimated by the ensemble method. Through empirical experiments on two widely
used benchmark datasets MovieLens and Criteo in recommender systems, we observe
that prediction variations come from various randomness sources, including
training data shuffling, and parameter random initialization. By introducing
more randomness into model training, we notice that ensemble's mean predictions
tend to be more accurate while the prediction variations tend to be higher.
Moreover, we propose to infer prediction variation from neuron activation
strength and demonstrate the strong prediction power from activation strength
features. Our experiment results show that the average R squared on MovieLens
is as high as 0.56 and on Criteo is 0.81. Our method performs especially well
when detecting the lowest and highest variation buckets, with 0.92 AUC and 0.89
AUC respectively. Our approach provides a simple way for prediction variation
estimation, which opens up new opportunities for future work in many
interesting areas (e.g.,model-based reinforcement learning) without relying on
serving expensive ensemble models.
- Abstract(参考訳): ディープニューラルネットワーク(DNN)の様々な領域における印象的な予測性能にもかかわらず、同じモデル仕様でトレーニングされたDNNモデルのセットと、同じデータが全く異なる予測結果を生成することはよく知られている。
Ensemble法は予測不確実性推定のための最先端のベンチマークである。
しかし、アンサンブルは訓練に費用がかかり、webスケールのトラフィックに対応している。
本稿では,アンサンブル法により推定される予測変動の理解を推し進める。
レコメンダシステムで広く使われている2つのベンチマークデータセットである movielens と criteo の実験を通して、予測の変動はトレーニングデータシャッフルやパラメータのランダム初期化など、様々なランダムなソースから生じることを観察する。
モデルの学習にさらにランダム性を導入することで、アンサンブルの平均予測はより正確になりがちであるが、予測のばらつきはより高くなることが分かる。
さらに,ニューロンの活性化強度からの予測変動を推定し,活性化強度の特徴から強い予測力を示す。
実験の結果,MovieLensでは平均Rが0.56,Criteoでは0.81であった。
本手法は, 最低変量バケットと最高変量バケットをそれぞれ0.92AUCと0.89AUCで検出した場合, 特に良好に機能する。
提案手法は,多くの興味深い分野(例えば,モデルに基づく強化学習)において,高価なアンサンブルモデルの提供に頼ることなく,将来の作業の新たな機会を開放する。
関連論文リスト
- Deep Limit Model-free Prediction in Regression [0.0]
本稿では,DNN(Deep Neural Network)に基づくモデルフリーアプローチにより,一般的な回帰条件下での点予測と予測間隔を実現する。
提案手法は,特に最適点予測において,他のDNN法に比べて安定かつ正確である。
論文 参考訳(メタデータ) (2024-08-18T16:37:53Z) - Awareness of uncertainty in classification using a multivariate model and multi-views [1.3048920509133808]
提案モデルでは,不確かさ予測を正規化し,予測と不確かさ推定の両方を計算する訓練を行う。
複数ビュー予測と不確かさと信頼度を考慮し、最終的な予測を計算する方法をいくつか提案した。
提案手法はクリーンでノイズの多いラベル付きCIFAR-10データセットを用いて検証した。
論文 参考訳(メタデータ) (2024-04-16T06:40:51Z) - From Reactive to Proactive Volatility Modeling with Hemisphere Neural Networks [0.0]
我々は,新しいニューラルネットワークアーキテクチャを用いて,マクロ経済密度予測のための最大推定値(MLE)を再活性化する。
ヘミスフィアニューラルネットワーク(HNN)は、可能時の主指標に基づく積極的なボラティリティ予測と、必要時の過去の予測誤差の大きさに基づく反応性ボラティリティ予測を提供する。
論文 参考訳(メタデータ) (2023-11-27T21:37:50Z) - Human Trajectory Forecasting with Explainable Behavioral Uncertainty [63.62824628085961]
人間の軌道予測は人間の行動を理解し予測し、社会ロボットから自動運転車への応用を可能にする。
モデルフリー手法は予測精度が優れているが説明可能性に欠ける一方、モデルベース手法は説明可能性を提供するが、よく予測できない。
BNSP-SFMは,11種類の最先端手法と比較して,予測精度を最大50%向上することを示す。
論文 参考訳(メタデータ) (2023-07-04T16:45:21Z) - ASPEST: Bridging the Gap Between Active Learning and Selective
Prediction [56.001808843574395]
選択予測は、不確実な場合の予測を棄却する信頼性のあるモデルを学ぶことを目的としている。
アクティブラーニングは、最も有意義な例を問うことで、ラベリングの全体、すなわち人間の依存度を下げることを目的としている。
本研究では,移動対象領域からより情報のあるサンプルを検索することを目的とした,新たな学習パラダイムである能動的選択予測を導入する。
論文 参考訳(メタデータ) (2023-04-07T23:51:07Z) - Confidence and Dispersity Speak: Characterising Prediction Matrix for
Unsupervised Accuracy Estimation [51.809741427975105]
この研究は、ラベルを使わずに、分散シフト下でのモデルの性能を評価することを目的としている。
我々は、両方の特性を特徴付けるのに有効であることが示されている核規範を用いる。
核の基準は既存の手法よりも正確で堅牢であることを示す。
論文 参考訳(メタデータ) (2023-02-02T13:30:48Z) - Dropout Prediction Variation Estimation Using Neuron Activation Strength [6.625915508197312]
ドロップアウトは様々なアプリケーションで予測のバリエーションを定量化するためによく使われてきた。
資源効率のよい方法で降雨予測変動を推定する方法を示す。
論文 参考訳(メタデータ) (2021-10-13T01:40:33Z) - Dense Uncertainty Estimation [62.23555922631451]
本稿では,ニューラルネットワークと不確実性推定手法について検討し,正確な決定論的予測と確実性推定の両方を実現する。
本研究では,アンサンブルに基づく手法と生成モデルに基づく手法の2つの不確実性推定法について検討し,それらの長所と短所を,完全/半端/弱度に制御されたフレームワークを用いて説明する。
論文 参考訳(メタデータ) (2021-10-13T01:23:48Z) - Test-time Collective Prediction [73.74982509510961]
マシンラーニングの複数のパーティは、将来のテストポイントを共同で予測したいと考えています。
エージェントは、すべてのエージェントの集合の集合的な専門知識の恩恵を受けることを望んでいるが、データやモデルパラメータを解放する意思はないかもしれない。
我々は、各エージェントの事前学習モデルを利用して、テスト時に集合的な予測を行う分散型メカニズムを探索する。
論文 参考訳(メタデータ) (2021-06-22T18:29:58Z) - Double Robust Representation Learning for Counterfactual Prediction [68.78210173955001]
そこで本稿では, 対実予測のための2次ロバスト表現を学習するための, スケーラブルな新しい手法を提案する。
我々は、個々の治療効果と平均的な治療効果の両方に対して、堅牢で効率的な対実的予測を行う。
このアルゴリズムは,実世界の最先端技術と合成データとの競合性能を示す。
論文 参考訳(メタデータ) (2020-10-15T16:39:26Z) - Stochastic Optimization for Performative Prediction [31.876692592395777]
モデルパラメータを単に更新することと、新しいモデルをデプロイすることの違いについて検討する。
各更新後にモデルを厳格にデプロイし、再デプロイする前に数回の更新を行うための収束率を証明する。
彼らは、パフォーマンス効果の強さによって、どちらのアプローチも他方よりも優れる体制が存在することを説明している。
論文 参考訳(メタデータ) (2020-06-12T00:31:16Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。