論文の概要: A Map of Bandits for E-commerce
- arxiv url: http://arxiv.org/abs/2107.00680v1
- Date: Thu, 1 Jul 2021 18:08:16 GMT
- ステータス: 処理完了
- システム内更新日: 2021-07-06 05:24:15.726147
- Title: A Map of Bandits for E-commerce
- Title(参考訳): 電子商取引のためのバンディットの地図
- Authors: Yi Liu and Lihong Li
- Abstract要約: アプリケーションから適切なBanditアルゴリズムへのマッピングにはギャップがある。
包括的な概要を提供する代わりに、報酬、アクション、機能に関連する重要な決定ポイントに焦点を合わせます。
- 参考スコア(独自算出の注目度): 14.313096700514382
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: The rich body of Bandit literature not only offers a diverse toolbox of
algorithms, but also makes it hard for a practitioner to find the right
solution to solve the problem at hand. Typical textbooks on Bandits focus on
designing and analyzing algorithms, and surveys on applications often present a
list of individual applications. While these are valuable resources, there
exists a gap in mapping applications to appropriate Bandit algorithms. In this
paper, we aim to reduce this gap with a structured map of Bandits to help
practitioners navigate to find relevant and practical Bandit algorithms.
Instead of providing a comprehensive overview, we focus on a small number of
key decision points related to reward, action, and features, which often affect
how Bandit algorithms are chosen in practice.
- Abstract(参考訳): Banditの豊富な文献は、多様なアルゴリズムのツールボックスを提供するだけでなく、実践者が目の前の問題を解決する適切なソリューションを見つけるのを難しくしている。
Banditsの典型的な教科書はアルゴリズムの設計と分析に重点を置いており、アプリケーションに関する調査はしばしば個々のアプリケーションのリストを提示する。
これらは貴重なリソースだが、アプリケーションと適切なBanditアルゴリズムのマッピングにはギャップがある。
本稿では,このギャップをバンドイットの構造化マップを用いて低減し,実践者が関連するバンドイットアルゴリズムを見つけるための支援を行う。
包括的概要を提供する代わりに、報酬、アクション、機能に関連するいくつかの重要な決定ポイントに焦点を当てます。
関連論文リスト
- Forced Exploration in Bandit Problems [12.13966146283641]
マルチアームバンディット(MAB)は古典的なシーケンシャルな決定問題である。
本稿では,報酬分布に関する情報を使わずに実装可能なマルチアームバンディットアルゴリズムを設計することを目的とする。
論文 参考訳(メタデータ) (2023-12-12T14:00:29Z) - Nearest Neighbour with Bandit Feedback [4.9094025705644695]
我々のアルゴリズムは、データ生成プロセスに関する仮定が全くなされていない完全に逆向きな設定を処理します。
ユークリッド空間におけるバンドイト問題に適用した場合,アルゴリズムに対する一般的な後悔と解析を行う。
論文 参考訳(メタデータ) (2023-06-23T20:09:01Z) - A Gold Standard Dataset for the Reviewer Assignment Problem [117.59690218507565]
類似度スコア(Similarity score)とは、論文のレビューにおいて、レビュアーの専門知識を数値で見積もるものである。
私たちのデータセットは、58人の研究者による477の自己申告された専門知識スコアで構成されています。
2つの論文をレビュアーに関連付けるタスクは、簡単なケースでは12%~30%、ハードケースでは36%~43%である。
論文 参考訳(メタデータ) (2023-03-23T16:15:03Z) - Incentivizing Combinatorial Bandit Exploration [87.08827496301839]
自己関心のあるユーザに対してレコメンデーションシステムでアクションを推奨するバンディットアルゴリズムを考える。
ユーザーは他のアクションを自由に選択でき、アルゴリズムの推奨に従うためにインセンティブを得る必要がある。
ユーザは悪用を好むが、アルゴリズムは、前のユーザから収集した情報を活用することで、探索にインセンティブを与えることができる。
論文 参考訳(メタデータ) (2022-06-01T13:46:25Z) - A Metaheuristic Algorithm for Large Maximum Weight Independent Set
Problems [58.348679046591265]
ノード重み付きグラフが与えられたとき、ノード重みが最大となる独立した(相互に非隣接な)ノードの集合を見つける。
このアプリケーションで放送されるグラフの中には、数十万のノードと数億のエッジを持つ大きなものもあります。
我々は,不規則なランダム化適応検索フレームワークにおいてメタヒューリスティックな新しい局所探索アルゴリズムを開発した。
論文 参考訳(メタデータ) (2022-03-28T21:34:16Z) - Machine Learning for Online Algorithm Selection under Censored Feedback [71.6879432974126]
オンラインアルゴリズム選択(OAS)では、アルゴリズム問題クラスのインスタンスがエージェントに次々に提示され、エージェントは、固定された候補アルゴリズムセットから、おそらく最高のアルゴリズムを迅速に選択する必要がある。
SAT(Satisfiability)のような決定問題に対して、品質は一般的にアルゴリズムのランタイムを指す。
本研究では,OASのマルチアームバンディットアルゴリズムを再検討し,この問題に対処する能力について議論する。
ランタイム指向の損失に適応し、時間的地平線に依存しない空間的・時間的複雑さを維持しながら、部分的に検閲されたデータを可能にする。
論文 参考訳(メタデータ) (2021-09-13T18:10:52Z) - Metadata-based Multi-Task Bandits with Bayesian Hierarchical Models [7.458639397686894]
効果的に探索する方法は、多腕バンディットにおける中心的な問題である。
メタデータに基づくマルチタスクバンディット問題を導入する。
ベイズ階層モデルのレンズを通してタスク関係を捉えることを提案する。
論文 参考訳(メタデータ) (2021-08-13T22:45:05Z) - Top-m identification for linear bandits [0.0]
薬物再購入への適用を動機として, 線形バンディットモデルにおける最大平均のm $ge$ 1アームの同定に取り組むための最初のアルゴリズムを提案する。
これらのアルゴリズムはgap-indexフォーカスアルゴリズム(gifa)のジェネリックファミリーに属し、線形バンドイットにおけるトップm識別に導入する。
論文 参考訳(メタデータ) (2021-03-18T08:04:45Z) - Generalization in portfolio-based algorithm selection [97.74604695303285]
ポートフォリオベースのアルゴリズム選択に関する最初の証明可能な保証を提供する。
ポートフォリオが大きければ、非常に単純なアルゴリズムセレクタであっても、過剰適合は避けられないことを示す。
論文 参考訳(メタデータ) (2020-12-24T16:33:17Z) - Multi-armed Bandits with Cost Subsidy [1.6631602844999724]
本稿では、インテリジェントSMSルーティング問題と広告オーディエンス最適化問題という2つのアプリケーションを提案する。
既存のMABアルゴリズムの素早い一般化は、この問題に対してうまく機能しないことを示す。
また,このアルゴリズムに対して,探索定理の簡単な変種を提示し,ほぼ最適な後悔境界を定めている。
論文 参考訳(メタデータ) (2020-11-03T05:38:42Z) - Optimal Clustering from Noisy Binary Feedback [75.17453757892152]
本稿では,二元的ユーザフィードバックから一組のアイテムをクラスタリングする問題について検討する。
最小クラスタ回復誤差率のアルゴリズムを考案する。
適応選択のために,情報理論的誤差下界の導出にインスパイアされたアルゴリズムを開発する。
論文 参考訳(メタデータ) (2019-10-14T09:18:26Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。