論文の概要: Competing Bandits: The Perils of Exploration Under Competition
- arxiv url: http://arxiv.org/abs/2007.10144v6
- Date: Tue, 14 Jun 2022 08:11:10 GMT
- ステータス: 処理完了
- システム内更新日: 2022-11-08 14:51:38.189343
- Title: Competing Bandits: The Perils of Exploration Under Competition
- Title(参考訳): 競合するバンド:競争中の探索の危険性
- Authors: Guy Aridor and Yishay Mansour and Aleksandrs Slivkins and Zhiwei
Steven Wu
- Abstract要約: オンラインプラットフォーム上での探索と競争の相互作用について検討する。
私たちは、スタークコンペティションが企業に対して、低福祉につながる「欲張り」バンディットアルゴリズムにコミットするよう促すことに気付きました。
競争を弱めるための2つのチャンネルについて検討する。
- 参考スコア(独自算出の注目度): 119.39607854637798
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Most online platforms strive to learn from interactions with users, and many
engage in exploration: making potentially suboptimal choices for the sake of
acquiring new information. We study the interplay between exploration and
competition: how such platforms balance the exploration for learning and the
competition for users. Here users play three distinct roles: they are customers
that generate revenue, they are sources of data for learning, and they are
self-interested agents which choose among the competing platforms.
We consider a stylized duopoly model in which two firms face the same
multi-armed bandit problem. Users arrive one by one and choose between the two
firms, so that each firm makes progress on its bandit problem only if it is
chosen. Through a mix of theoretical results and numerical simulations, we
study whether and to what extent competition incentivizes the adoption of
better bandit algorithms, and whether it leads to welfare increases for users.
We find that stark competition induces firms to commit to a "greedy" bandit
algorithm that leads to low welfare. However, weakening competition by
providing firms with some "free" users incentivizes better exploration
strategies and increases welfare. We investigate two channels for weakening the
competition: relaxing the rationality of users and giving one firm a
first-mover advantage. Our findings are closely related to the "competition vs.
innovation" relationship, and elucidate the first-mover advantage in the
digital economy.
- Abstract(参考訳): ほとんどのオンラインプラットフォームは、ユーザとのインタラクションから学ぶことに努めており、多くが探索に携わっている。
このようなプラットフォームが,学習のための探索とユーザのための競争のバランスをとる方法について,探索と競争の相互作用について検討する。
ユーザは3つの異なる役割を担っている: 彼らは収益を生み出す顧客であり、学習のためのデータソースであり、彼らは競合プラットフォームの中から選択する利己的なエージェントである。
我々は、2つの企業が同じマルチアームバンディット問題に直面しているスタイル化されたデュポリーモデルを考える。
ユーザーは1人ずつ到着し、2つの会社を選択すれば、それぞれの会社が、選択された場合にのみ、その盗賊問題に進展する。
理論的結果と数値シミュレーションの混合により,コンペティションがより優れたバンディットアルゴリズムの採用を動機づけるかどうか,また,それがユーザの福祉向上につながるかどうかを検討する。
過激な競争によって企業は「欲深い」バンディットのアルゴリズムにコミットし、低福祉に繋がる。
しかし、一部の「無料」ユーザーを企業に提供することで競争を弱め、より良い探索戦略を奨励し、福祉を高める。
我々は,競争を弱めるための2つのチャネルについて検討する。
本研究は,「競争対イノベーション」の関係と密接に関連し,デジタル経済における初歩的な優位性を明らかにする。
関連論文リスト
- Defection-Free Collaboration between Competitors in a Learning System [61.22540496065961]
協力によって収益を失うと、参加者がシステムから外れる競合相手となる協調学習システムについて検討する。
我々は、両社が利益を失わずに相互に共有する、より公平で*欠陥のない*スキームを提案する。
論文 参考訳(メタデータ) (2024-06-22T17:29:45Z) - A Competition-based Pricing Strategy in Cloud Markets using Regret
Minimization Techniques [0.0]
本研究は,後悔最小化アルゴリズムに関連する価格ポリシーを提案し,不完全情報ゲームに適用する。
クラウドの競合ベースのマーケットプレースに基づいて、プロバイダは経験豊富な後悔を使って戦略の配布を更新する。
実験の結果は、他の価格政策と比較して、プロバイダの利益が大幅に増加したことを示している。
論文 参考訳(メタデータ) (2023-09-20T13:38:43Z) - Improving Fairness in Adaptive Social Exergames via Shapley Bandits [7.215807283769683]
フェアネスを意識したマルチアームバンディットShapley Banditsを提案する。
グループ全体のアウトプットではなく、プレーヤ全体の参加と介入の定着を高めるために、Shapley Valueを使用する。
以上の結果から,我々のShapley BanditsはGreedy Bandit Problemを効果的に媒介し,参加者間のユーザ維持とモチベーションの向上を実現していることがわかった。
論文 参考訳(メタデータ) (2023-02-18T11:34:02Z) - Bandit Social Learning: Exploration under Myopic Behavior [58.75758600464338]
オンラインプラットフォーム上でのレビューによって動機付けられた社会学習のダイナミクスについて検討する。
エージェントはまとめて単純なマルチアームのバンディットプロトコルに従うが、各エージェントは探索を伴わずにミオプティカルに振る舞う。
このような振る舞いに対して,スターク学習の失敗を導出し,好意的な結果を提供する。
論文 参考訳(メタデータ) (2023-02-15T01:57:57Z) - How Bad is Top-$K$ Recommendation under Competing Content Creators? [43.2268992294178]
我々は,アナーキー価格のレンズによるユーザ福祉保証について検討する。
創造者競争によるユーザ福祉損失のごく一部は、ユーザ決定におけるKドルとランダム性に応じて、常に小さな一定値で上限づけられていることが示される。
論文 参考訳(メタデータ) (2023-02-03T19:37:35Z) - Incentive-Aware Recommender Systems in Two-Sided Markets [49.692453629365204]
最適性能を達成しつつエージェントのインセンティブと整合する新しいレコメンデータシステムを提案する。
我々のフレームワークは、このインセンティブを意識したシステムを、両側市場におけるマルチエージェントバンディット問題としてモデル化する。
どちらのアルゴリズムも、エージェントが過剰な露出から保護する、ポストフェアネス基準を満たす。
論文 参考訳(メタデータ) (2022-11-23T22:20:12Z) - Competition, Alignment, and Equilibria in Digital Marketplaces [97.03797129675951]
プラットフォームアクションがバンディットアルゴリズムであり,両プラットフォームがユーザ参加を競うデュオポリー市場について検討する。
私たちの主な発見は、この市場における競争は、市場の結果をユーザーユーティリティと完全に一致させるものではないということです。
論文 参考訳(メタデータ) (2022-08-30T17:43:58Z) - Invitation in Crowdsourcing Contests [9.860944032009847]
本研究では,クラウドソーシングコンテストにおけるエージェントのインセンティブのモデル化と設計において,人々の社会的結びつきが重要な要素であると考えている。
我々は,依頼者が近隣住民を招待してタスクに貢献させる,新たなコンテスト機構を確立する。
我々の均衡分析によると、ベイズ・ナッシュの均衡エージェントの行動は、本質的な能力に加えて、エージェント間の社会的関係も意思決定において中心的な役割を果たす。
論文 参考訳(メタデータ) (2021-12-06T09:18:18Z) - Maximizing Social Welfare in a Competitive Diffusion Model [19.18481967353127]
UIC(IM)は、バイラルマーケティングや感染封じ込めなどの応用により、多くの注目を集めている。
少数のシードユーザを選択して採用することで,ネットワーク内の多数のユーザに普及させることを目指している。
既存の競合IMの研究にはいくつかの制限がある。
論文 参考訳(メタデータ) (2020-12-06T19:09:12Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。