論文の概要: On the Generalizability and Predictability of Recommender Systems
- arxiv url: http://arxiv.org/abs/2206.11886v1
- Date: Thu, 23 Jun 2022 17:51:42 GMT
- ステータス: 処理完了
- システム内更新日: 2022-06-24 13:10:20.721765
- Title: On the Generalizability and Predictability of Recommender Systems
- Title(参考訳): リコメンダシステムの一般化可能性と予測可能性について
- Authors: Duncan McElfresh, Sujay Khandagale, Jonathan Valverde, John P.
Dickerson, Colin White
- Abstract要約: 推奨システムアプローチに関する大規模な研究を初めて行った。
Reczillaは、レコメンデーションシステムのためのメタラーニングアプローチです。
- 参考スコア(独自算出の注目度): 33.46314108814183
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: While other areas of machine learning have seen more and more automation,
designing a high-performing recommender system still requires a high level of
human effort. Furthermore, recent work has shown that modern recommender system
algorithms do not always improve over well-tuned baselines. A natural follow-up
question is, "how do we choose the right algorithm for a new dataset and
performance metric?" In this work, we start by giving the first large-scale
study of recommender system approaches by comparing 18 algorithms and 100 sets
of hyperparameters across 85 datasets and 315 metrics. We find that the best
algorithms and hyperparameters are highly dependent on the dataset and
performance metric, however, there are also strong correlations between the
performance of each algorithm and various meta-features of the datasets.
Motivated by these findings, we create RecZilla, a meta-learning approach to
recommender systems that uses a model to predict the best algorithm and
hyperparameters for new, unseen datasets. By using far more meta-training data
than prior work, RecZilla is able to substantially reduce the level of human
involvement when faced with a new recommender system application. We not only
release our code and pretrained RecZilla models, but also all of our raw
experimental results, so that practitioners can train a RecZilla model for
their desired performance metric: https://github.com/naszilla/reczilla.
- Abstract(参考訳): 機械学習の他の分野はますます自動化されているが、ハイパフォーマンスなレコメンデーションシステムの設計には高いレベルの人的努力が必要だ。
さらに、最近の研究により、現代のレコメンデータシステムアルゴリズムは、よく調整されたベースラインよりも常に改善されるとは限らないことが示されている。
自然なフォローアップの質問は、“新しいデータセットとパフォーマンスメトリクスの適切なアルゴリズムをどのように選択すればよいか?
本研究では,85のデータセットと315のメトリクスにまたがる18のアルゴリズムと100のハイパーパラメータを比較し,推奨システムアプローチに関する大規模な研究から始める。
最適なアルゴリズムとハイパーパラメータはデータセットと性能指標に大きく依存するが、各アルゴリズムのパフォーマンスとデータセットの様々なメタ機能との間には強い相関関係がある。
これらの発見に触発されたRecZillaは、モデルを使用して最適なアルゴリズムとハイパーパラメータを予測し、新しい未知のデータセットを推薦するメタ学習アプローチです。
以前の作業よりもはるかに多くのメタトレーニングデータを使用することで、RecZillaは、新しいレコメンデータシステムアプリケーションに直面した際の人間の関与レベルを大幅に削減することができる。
コードとプリトレーニングされたreczillaモデルのリリースだけでなく、すべての生の実験結果も公開しているので、実践者は望ましいパフォーマンスメトリクスのためにreczillaモデルをトレーニングすることができます。
関連論文リスト
- Monte Carlo Tree Search Boosts Reasoning via Iterative Preference Learning [55.96599486604344]
本稿では,Large Language Models (LLMs) の推論能力向上を目的とした,反復的な選好学習プロセスによるアプローチを提案する。
我々は、MCTS(Monte Carlo Tree Search)を用いて好みデータを反復的に収集し、そのルックアヘッド機能を利用して、インスタンスレベルの報酬をよりきめ細かいステップレベルの信号に分解する。
提案アルゴリズムはDPO(Direct Preference Optimization)を用いて,新たに生成されたステップレベルの優先度データを用いてLCMポリシーを更新する。
論文 参考訳(メタデータ) (2024-05-01T11:10:24Z) - Back to Basics: A Simple Recipe for Improving Out-of-Domain Retrieval in
Dense Encoders [63.28408887247742]
得られたモデルにおいて,より優れた一般化能力を得るために,トレーニング手順の改善が可能であるかを検討する。
我々は、高密度エンコーダをトレーニングするための簡単なレシピを推奨する: LoRAのようなパラメータ効率のよいMSMARCOのトレーニング。
論文 参考訳(メタデータ) (2023-11-16T10:42:58Z) - RPLKG: Robust Prompt Learning with Knowledge Graph [11.893917358053004]
知識グラフ(RPLKG)を用いた頑健な学習手法を提案する。
知識グラフに基づいて,多種多様な解釈可能かつ有意義なプロンプトセットを自動設計する。
RPLKGはゼロショット学習に比べてパフォーマンスが大幅に向上した。
論文 参考訳(メタデータ) (2023-04-21T08:22:58Z) - Making Look-Ahead Active Learning Strategies Feasible with Neural
Tangent Kernels [6.372625755672473]
本稿では,仮説的ラベル付き候補データを用いた再学習に基づく,能動的学習獲得戦略の近似手法を提案する。
通常、これはディープ・ネットワークでは実現できないが、我々はニューラル・タンジェント・カーネルを用いて再トレーニングの結果を近似する。
論文 参考訳(メタデータ) (2022-06-25T06:13:27Z) - HyperImpute: Generalized Iterative Imputation with Automatic Model
Selection [77.86861638371926]
カラムワイズモデルを適応的かつ自動的に構成するための一般化反復計算フレームワークを提案する。
既製の学習者,シミュレータ,インターフェースを備えた具体的な実装を提供する。
論文 参考訳(メタデータ) (2022-06-15T19:10:35Z) - Adaptive Optimization with Examplewise Gradients [23.504973357538418]
本稿では,機械学習のための勾配に基づく最適化手法の設計に対して,より汎用的なアプローチを提案する。
この新しいフレームワークでは、イテレーションは単一の見積もりではなく、パラメータごとの見積もりのバッチへのアクセスを前提としています。
これは、典型的な機械学習のセットアップで実際に利用できる情報を反映している。
論文 参考訳(メタデータ) (2021-11-30T23:37:01Z) - ALT-MAS: A Data-Efficient Framework for Active Testing of Machine
Learning Algorithms [58.684954492439424]
少量のラベル付きテストデータのみを用いて機械学習モデルを効率的にテストする新しいフレームワークを提案する。
ベイズニューラルネットワーク(bnn)を用いたモデルアンダーテストの関心指標の推定が目的である。
論文 参考訳(メタデータ) (2021-04-11T12:14:04Z) - MatRec: Matrix Factorization for Highly Skewed Dataset [4.658166900129066]
本稿では,行列分解の枠組みにおける問題を解く新しいアルゴリズムを提案する。
提案手法は,一般的なレコメンデータシステムアルゴリズムを用いて,好意的な結果を生成する。
論文 参考訳(メタデータ) (2020-11-09T12:55:38Z) - How much progress have we made in neural network training? A New
Evaluation Protocol for Benchmarking Optimizers [86.36020260204302]
本稿では、エンドツーエンドの効率とデータ付加訓練の効率を評価するための新しいベンチマークプロトコルを提案する。
評価プロトコルは, ランダム探索よりも, 人間のチューニング行動とよく一致していることを示すために, 人間の実験を行った。
次に,提案したベンチマークフレームワークをコンピュータビジョン,自然言語処理,強化学習,グラフマイニングなどのタスクに適用する。
論文 参考訳(メタデータ) (2020-10-19T21:46:39Z) - Optimization for Supervised Machine Learning: Randomized Algorithms for
Data and Parameters [10.279748604797911]
機械学習とデータサイエンスの主な問題は、最適化問題として日常的にモデル化され、最適化アルゴリズムによって解決される。
データ量の増加と、これらの不条件最適化タスクを定式化するために使用される統計モデルのサイズと複雑さにより、これらの課題に対処できる新しい効率的なアルゴリズムが必要である。
この論文では,これらの課題をそれぞれ異なる方法で処理する。ビッグデータ問題に効率的に対処するために,各イテレーションでトレーニングデータの小さなランダムサブセットのみを検査する新しい手法を開発する。
大きなモデル問題に対処するために、イテレーション毎に更新されるメソッドを開発します。
論文 参考訳(メタデータ) (2020-08-26T21:15:18Z) - S^3-Rec: Self-Supervised Learning for Sequential Recommendation with
Mutual Information Maximization [104.87483578308526]
本稿では,シーケンスレコメンデーションのための自己改善学習のためのモデルS3-Recを提案する。
そこで本稿では,属性,項目,サブシーケンス,シーケンス間の相関関係を学習するために,4つの補助的自己教師対象を考案する。
6つの実世界のデータセットで実施された大規模な実験は、既存の最先端手法よりも提案手法が優れていることを示す。
論文 参考訳(メタデータ) (2020-08-18T11:44:10Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。