論文の概要: Ranking In Generalized Linear Bandits
- arxiv url: http://arxiv.org/abs/2207.00109v2
- Date: Mon, 1 Jan 2024 21:27:44 GMT
- ステータス: 処理完了
- システム内更新日: 2024-01-03 20:24:35.586443
- Title: Ranking In Generalized Linear Bandits
- Title(参考訳): 一般線形帯域におけるランク付け
- Authors: Amitis Shidani, George Deligiannidis, Arnaud Doucet
- Abstract要約: 一般化線形帯域におけるランク問題について検討する。
レコメンデーションシステムでは、最も魅力的なアイテムの順序リストを表示することが必ずしも最適とは限らない。
- 参考スコア(独自算出の注目度): 38.567816347428774
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: We study the ranking problem in generalized linear bandits. At each time, the
learning agent selects an ordered list of items and observes stochastic
outcomes. In recommendation systems, displaying an ordered list of the most
attractive items is not always optimal as both position and item dependencies
result in a complex reward function. A very naive example is the lack of
diversity when all the most attractive items are from the same category. We
model the position and item dependencies in the ordered list and design UCB and
Thompson Sampling type algorithms for this problem. Our work generalizes
existing studies in several directions, including position dependencies where
position discount is a particular case, and connecting the ranking problem to
graph theory.
- Abstract(参考訳): 一般化線形バンディットにおけるランキング問題について検討する。
学習エージェントは、各時間に順序づけられた項目のリストを選択し、確率的結果を監視する。
推薦システムでは、最も魅力的なアイテムの順序リストを表示することは、位置とアイテム依存の両方が複雑な報酬関数をもたらすため、必ずしも最適ではない。
非常に単純な例は、最も魅力的なアイテムがすべて同じカテゴリからのものである場合の多様性の欠如である。
順序付きリストにおける位置と項目の依存関係をモデル化し、この問題に対して UCB と Thompson Sampling 型アルゴリズムを設計する。
本研究は,位置割引が特定の場合である位置依存や,ランキング問題をグラフ理論に結びつけるなど,既存の研究を様々な方向に一般化する。
関連論文リスト
- A consensus set for the aggregation of partial rankings: the case of the Optimal Set of Bucket Orders Problem [46.752018687842344]
ランクアグリゲーション問題(RAP)では、解は通常、一連の入力順序を一般化するコンセンサスランキングである。
我々は、RAPの解決策として、入力順序に表される嗜好をよりよく説明するためのランキングのセットを提案する。
論文 参考訳(メタデータ) (2025-02-19T14:32:16Z) - Found in the Middle: Permutation Self-Consistency Improves Listwise Ranking in Large Language Models [63.714662435555674]
大規模言語モデル(LLM)は、文脈の使い方に位置バイアスを示す。
我々は,ブラックボックスLLMのランキングリスト出力に対して,自己整合性(permutation self-consistency)を提案する。
LLaMA v2 (70B) では GPT-3.5 では 7-18% , LLaMA v2 (70B) では 8-16% である。
論文 参考訳(メタデータ) (2023-10-11T17:59:02Z) - Learning to Select and Rank from Choice-Based Feedback: A Simple Nested Approach [10.293894471295205]
本研究では、動的アソートによる選択に基づくフィードバックから学習する際のランク付けと選択の問題について検討する。
両学習目標に対して,新しい,シンプルなアルゴリズムを提案する。
論文 参考訳(メタデータ) (2023-07-13T05:05:30Z) - Learning List-Level Domain-Invariant Representations for Ranking [59.3544317373004]
リストレベルのアライメント -- より高いレベルのリストでドメイン不変表現を学習する。
利点は2つある: これは、ランク付けに縛られる最初のドメイン適応の一般化をもたらし、その結果、提案法に対する理論的支援を提供する。
論文 参考訳(メタデータ) (2022-12-21T04:49:55Z) - Online Learning of Optimally Diverse Rankings [63.62764375279861]
ユーザのフィードバックのみに基づいて最適なリストを効率よく学習するアルゴリズムを提案する。
我々は、$T$クエリの後に、LDRの後悔は$O((N-L)log(T))$としてスケールする。
論文 参考訳(メタデータ) (2021-09-13T12:13:20Z) - Aggregating Incomplete and Noisy Rankings [13.267203883254087]
我々は、ほとんど不完全でノイズの多いランキングから、一組の代替品の真の順序付けを学ぶことの問題を考察する。
我々の選択的なMallowsモデルは、任意の選択肢の任意の部分集合におけるノイズの多いランクを出力する。
選抜されたMallowsランキングから、最適極大ランキングを効率的に計算する方法を示す。
論文 参考訳(メタデータ) (2020-11-02T08:18:33Z) - Distance-based Positive and Unlabeled Learning for Ranking [13.339237388350043]
階級の学習は一般的な関心の問題である。
整数線形プログラムを用いた表現の組み合わせによるランク付け学習は,「興味のある項目に類似する項目は少ない」ほど軽快な場合には有効であることを示す。
論文 参考訳(メタデータ) (2020-05-20T01:53:58Z) - SetRank: A Setwise Bayesian Approach for Collaborative Ranking from
Implicit Feedback [50.13745601531148]
提案手法は,提案システムにおける暗黙的フィードバックの特性に対応するために,協調的ランキング(SeetRank)のためのセッティングワイドベイズ的手法を提案する。
具体的には、SetRankは、新しい設定された選好比較の後方確率を最大化することを目的としている。
また、SetRankの理論解析により、余剰リスクの境界が$sqrtM/N$に比例できることを示す。
論文 参考訳(メタデータ) (2020-02-23T06:40:48Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。