論文の概要: Learning-to-Rank at the Speed of Sampling: Plackett-Luce Gradient
Estimation With Minimal Computational Complexity
- arxiv url: http://arxiv.org/abs/2204.10872v1
- Date: Fri, 22 Apr 2022 18:01:33 GMT
- ステータス: 処理完了
- システム内更新日: 2022-04-28 08:04:09.871768
- Title: Learning-to-Rank at the Speed of Sampling: Plackett-Luce Gradient
Estimation With Minimal Computational Complexity
- Title(参考訳): サンプリング速度での学習-ランク付け--計算量最小のplacett-luce勾配推定
- Authors: Harrie Oosterhuis
- Abstract要約: 本稿では,最良ソートアルゴリズムに匹敵する計算量で非バイアス勾配推定を行うPL-Rank-3アルゴリズムを提案する。
実験結果から,性能を損なうことなく,最適化に要する時間が大きく向上することが示唆された。
- 参考スコア(独自算出の注目度): 13.579420996461439
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Plackett-Luce gradient estimation enables the optimization of stochastic
ranking models within feasible time constraints through sampling techniques.
Unfortunately, the computational complexity of existing methods does not scale
well with the length of the rankings, i.e. the ranking cutoff, nor with the
item collection size. In this paper, we introduce the novel PL-Rank-3 algorithm
that performs unbiased gradient estimation with a computational complexity
comparable to the best sorting algorithms. As a result, our novel
learning-to-rank method is applicable in any scenario where standard sorting is
feasible in reasonable time. Our experimental results indicate large gains in
the time required for optimization, without any loss in performance. For the
field, our contribution could potentially allow state-of-the-art
learning-to-rank methods to be applied to much larger scales than previously
feasible.
- Abstract(参考訳): Plackett-Luceグラデーション推定により,サンプリング手法による確率的ランキングモデルの時間制約内での最適化が可能となる。
残念なことに、既存のメソッドの計算の複雑さは、ランキングの長さ、すなわちランキングのカットオフ、あるいはアイテムの収集サイズではうまくスケールしない。
本稿では,最良ソートアルゴリズムに匹敵する計算量で非バイアス勾配推定を行うPL-Rank-3アルゴリズムを提案する。
その結果,本手法は標準ソートが妥当な時間で実現可能なシナリオに適用できることがわかった。
実験結果から,性能を損なうことなく,最適化に要する時間が大きく向上することが示唆された。
この分野では、我々の貢献により、最先端の学習 to ランクの手法が以前実現可能だったよりもはるかに大きなスケールに適用できる可能性がある。
関連論文リスト
- Ordering for Non-Replacement SGD [7.11967773739707]
我々は,アルゴリズムの非置換形式に対する収束率を改善する順序付けを求める。
我々は,強い凸関数と凸関数のステップサイズを一定かつ小さくするための最適順序付けを開発する。
さらに、注文とミニバッチを組み合わせることで、より複雑なニューラルネットワークにも適用できます。
論文 参考訳(メタデータ) (2023-06-28T00:46:58Z) - Optimal Algorithms for Stochastic Complementary Composite Minimization [55.26935605535377]
統計学と機械学習における正規化技術に触発され,補完的な複合化の最小化について検討した。
予測と高い確率で、新しい過剰なリスク境界を提供する。
我々のアルゴリズムはほぼ最適であり、このクラスの問題に対して、新しいより低い複雑性境界によって証明する。
論文 参考訳(メタデータ) (2022-11-03T12:40:24Z) - Fast Offline Policy Optimization for Large Scale Recommendation [74.78213147859236]
我々は、カタログサイズと対数的にスケールするこれらのポリシー学習アルゴリズムの近似を導出する。
私たちの貢献は3つの新しいアイデアの組み合わせに基づいている。
我々の推定器は、単純なアプローチよりも桁違いに速いが、等しく良いポリシーを生成する。
論文 参考訳(メタデータ) (2022-08-08T11:54:11Z) - Local policy search with Bayesian optimization [73.0364959221845]
強化学習は、環境との相互作用によって最適な政策を見つけることを目的としている。
局所探索のための政策勾配は、しばしばランダムな摂動から得られる。
目的関数の確率モデルとその勾配を用いたアルゴリズムを開発する。
論文 参考訳(メタデータ) (2021-06-22T16:07:02Z) - Estimating leverage scores via rank revealing methods and randomization [50.591267188664666]
任意のランクの正方形密度あるいはスパース行列の統計レバレッジスコアを推定するアルゴリズムについて検討した。
提案手法は,高密度およびスパースなランダム化次元性還元変換の合成と階調明細化法を組み合わせることに基づく。
論文 参考訳(メタデータ) (2021-05-23T19:21:55Z) - PiRank: Learning To Rank via Differentiable Sorting [85.28916333414145]
ランク付けのための新しい分類可能なサロゲートであるPiRankを提案する。
ピランクは所望の指標をゼロ温度の限界で正確に回収する。
論文 参考訳(メタデータ) (2020-12-12T05:07:36Z) - Effective Proximal Methods for Non-convex Non-smooth Regularized
Learning [27.775096437736973]
独立サンプリング方式は、一般に使用されている一様サンプリング方式の性能を向上させる傾向にあることを示す。
我々の新しい分析は、サンプリングの速度が今までで最高のものより速いことも示しています。
論文 参考訳(メタデータ) (2020-09-14T16:41:32Z) - Beyond Worst-Case Analysis in Stochastic Approximation: Moment
Estimation Improves Instance Complexity [58.70807593332932]
近似問題に対する勾配に基づく手法のオラクル複雑性について検討する。
最悪のケースの複雑さではなく、インスタンス依存の複雑さに焦点を当てます。
提案アルゴリズムとその解析はモーメント推定の成功を理論的に正当化する。
論文 参考訳(メタデータ) (2020-06-08T09:25:47Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。