論文の概要: Optimizing Ranking Systems Online as Bandits
- arxiv url: http://arxiv.org/abs/2110.05807v1
- Date: Tue, 12 Oct 2021 08:07:46 GMT
- ステータス: 処理完了
- システム内更新日: 2021-10-13 15:38:05.556974
- Title: Optimizing Ranking Systems Online as Bandits
- Title(参考訳): オンラインランキングシステムの最適化
- Authors: Chang Li
- Abstract要約: オンラインでランキングシステムを最適化する4つの課題について検討し,提案する。
この効果は、アルゴリズムが相互作用からどれだけ速く学習するかに関係している。
第二に、デプロイされたアルゴリズムは安全でなければならない。つまり、アルゴリズムはユーザ要求に対して適切なコンテンツのみを表示する。
第三に、ユーザーが常に好みを変えるとき、アルゴリズムは非定常性を扱うべきである。
- 参考スコア(独自算出の注目度): 2.282430531490685
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Ranking system is the core part of modern retrieval and recommender systems,
where the goal is to rank candidate items given user contexts. Optimizing
ranking systems online means that the deployed system can serve user requests,
e.g., queries in the web search, and optimize the ranking policy by learning
from user interactions, e.g., clicks. Bandit is a general online learning
framework and can be used in our optimization task. However, due to the unique
features of ranking, there are several challenges in designing bandit
algorithms for ranking system optimization. In this dissertation, we study and
propose solutions for four challenges in optimizing ranking systems online:
effectiveness, safety, nonstationarity, and diversification. First, the
effectiveness is related to how fast the algorithm learns from interactions. We
study the effective online ranker evaluation task and propose the MergeDTS
algorithm to solve the problem effectively. Second, the deployed algorithm
should be safe, which means the algorithm only displays reasonable content to
user requests. To solve the safe online learning to rank problem, we propose
the BubbleRank algorithm. Third, as users change their preferences constantly,
the algorithm should handle the nonstationarity. We formulate this
nonstationary online learning to rank problem as cascade non-stationary bandits
and propose CascadeDUCB and CascadeSWUCB algorithms to solve the problem.
Finally, the contents in ranked lists should be diverse. We consider the
results diversification task and propose the CascadeHybird algorithm that
considers both the item relevance and results diversification when learning
from user interactions.
- Abstract(参考訳): ランキングシステムは現代の検索とレコメンデーションシステムの中核部分であり、ユーザのコンテキストに応じて候補項目をランク付けすることを目的としている。
オンラインでランキングシステムを最適化することは、デプロイされたシステムがユーザの要求、例えばウェブ検索でのクエリ、クリックなどのユーザーインタラクションから学習することでランキングポリシーを最適化できることを意味する。
banditは一般的なオンライン学習フレームワークで、最適化タスクで使用できます。
しかし,ランキングのユニークな特徴から,ランキングシステム最適化のためのバンドイットアルゴリズムの設計にはいくつかの課題がある。
本論文では,オンラインランキングシステムを最適化する上で,有効性,安全性,非定常性,多様化という4つの課題について検討し,提案する。
まず、効果はアルゴリズムが相互作用からどれだけ速く学習するかに関係している。
本稿では,オンラインランサー評価を効果的に行うために,MergeDTSアルゴリズムを提案する。
第二に、デプロイされたアルゴリズムは安全でなければならない。つまり、アルゴリズムはユーザ要求に対して適切なコンテンツのみを表示する。
安全なオンライン学習のランク付けを実現するために,BubbleRankアルゴリズムを提案する。
第三に、ユーザーが常に好みを変えるとき、アルゴリズムは非定常性を扱うべきである。
我々は、この非定常オンライン学習をカスケード非定常帯域としてランク付けし、その問題を解決するためにカスケードDUCBおよびカスケードSWUCBアルゴリズムを提案する。
最後に、ランクリストの内容は多様であるべきである。
本研究では,ユーザインタラクションから学習する場合に,項目の関連度と結果の多様化度を考慮したカスケードハイバードアルゴリズムを提案する。
関連論文リスト
- Adaptively Learning to Select-Rank in Online Platforms [34.258659206323664]
本研究は、異種ユーザの候補プールからアイテムを適応的にランク付けすることの課題に対処する。
本研究では,多様なユーザの好みや項目位置の影響を考慮に入れたユーザ応答モデルを構築した。
シミュレーションと実世界の両方のデータセットで実施された実験は、アルゴリズムがベースラインを上回っていることを示している。
論文 参考訳(メタデータ) (2024-06-07T15:33:48Z) - Bipartite Ranking Fairness through a Model Agnostic Ordering Adjustment [54.179859639868646]
本稿では,二部類ランキングにおける公平性を実現するためのモデルに依存しない後処理フレームワークxOrderを提案する。
xOrderは、教師なしおよび教師なしの公正度メトリックを含む、さまざまな分類モデルとランキングフェアネスメトリクスと互換性がある。
提案アルゴリズムを,4つのベンチマークデータセットと2つの実世界の患者電子健康記録リポジトリ上で評価した。
論文 参考訳(メタデータ) (2023-07-27T07:42:44Z) - HARRIS: Hybrid Ranking and Regression Forests for Algorithm Selection [75.84584400866254]
両アプローチの強みを両アプローチの弱さを緩和しつつ組み合わせ, 特殊林を利用した新しいアルゴリズムセレクタを提案する。
HARRISの決定は、ハイブリッドランキングと回帰損失関数に基づいて最適化された木を作成する森林モデルに基づいている。
論文 参考訳(メタデータ) (2022-10-31T14:06:11Z) - Fast online ranking with fairness of exposure [29.134493256287072]
このアルゴリズムは計算が高速で、ソート演算が支配的であり、メモリ効率が良く、理論的な保証も強いことを示します。
ユーザ側のパフォーマンスを最大化する基本方針と比較して,提案アルゴリズムは,計算オーバーヘッドが無視できるような推奨事項に,露出基準の複雑な公平性を組み込むことができる。
論文 参考訳(メタデータ) (2022-09-13T12:35:36Z) - Which Tricks Are Important for Learning to Rank? [32.38701971636441]
勾配型決定木(GBDT)に基づく最先端の学習 to ランク法
本稿では,複数のGBDTに基づくランキングアルゴリズムを統一的に解析する。
その結果、学習からランクまでの手法の洞察を得て、新しい最先端のアルゴリズムを得ることができた。
論文 参考訳(メタデータ) (2022-04-04T13:59:04Z) - Heuristic Search for Rank Aggregation with Application to Label Ranking [16.275063634853584]
本稿では,階層化問題を解くために,効果的なハイブリッド進化的ランキングアルゴリズムを提案する。
このアルゴリズムは、コンコーダントペアに基づくセマンティッククロスオーバーと、効率的な漸進的評価手法によって強化された遅延受容局所探索を特徴とする。
アルゴリズムを評価するために実験が行われ、ベンチマークインスタンス上での高い競争性能を示す。
論文 参考訳(メタデータ) (2022-01-11T11:43:17Z) - Machine Learning for Online Algorithm Selection under Censored Feedback [71.6879432974126]
オンラインアルゴリズム選択(OAS)では、アルゴリズム問題クラスのインスタンスがエージェントに次々に提示され、エージェントは、固定された候補アルゴリズムセットから、おそらく最高のアルゴリズムを迅速に選択する必要がある。
SAT(Satisfiability)のような決定問題に対して、品質は一般的にアルゴリズムのランタイムを指す。
本研究では,OASのマルチアームバンディットアルゴリズムを再検討し,この問題に対処する能力について議論する。
ランタイム指向の損失に適応し、時間的地平線に依存しない空間的・時間的複雑さを維持しながら、部分的に検閲されたデータを可能にする。
論文 参考訳(メタデータ) (2021-09-13T18:10:52Z) - PiRank: Learning To Rank via Differentiable Sorting [85.28916333414145]
ランク付けのための新しい分類可能なサロゲートであるPiRankを提案する。
ピランクは所望の指標をゼロ温度の限界で正確に回収する。
論文 参考訳(メタデータ) (2020-12-12T05:07:36Z) - Exploration in two-stage recommender systems [79.50534282841618]
2段階のレコメンデータシステムは、スケーラビリティと保守性のために業界で広く採用されている。
このセットアップの鍵となる課題は、各ステージの最適性能が最適なグローバルパフォーマンスを暗示していないことである。
そこで本研究では,ランクとノミネーター間の探索戦略を同期させる手法を提案する。
論文 参考訳(メタデータ) (2020-09-01T16:52:51Z) - Extreme Algorithm Selection With Dyadic Feature Representation [78.13985819417974]
我々は,数千の候補アルゴリズムの固定セットを考慮に入れた,極端なアルゴリズム選択(XAS)の設定を提案する。
我々は、XAS設定に対する最先端のAS技術の適用性を評価し、Dyadic特徴表現を利用したアプローチを提案する。
論文 参考訳(メタデータ) (2020-01-29T09:40:58Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。