論文の概要: Competing Bandits: The Perils of Exploration Under Competition
- arxiv url: http://arxiv.org/abs/2007.10144v8
- Date: Sat, 12 Oct 2024 14:24:30 GMT
- ステータス: 翻訳完了
- システム内更新日: 2024-10-15 17:54:08.339297
- Title: Competing Bandits: The Perils of Exploration Under Competition
- Title(参考訳): 競合するバンド:競争中の探索の危険性
- Authors: Guy Aridor, Yishay Mansour, Aleksandrs Slivkins, Zhiwei Steven Wu,
- Abstract要約: オンラインプラットフォーム上での探索と競争の相互作用について検討する。
私たちは、スタークコンペティションが企業に対して、低福祉につながる「欲張り」バンディットアルゴリズムにコミットするよう促すことに気付きました。
競争を弱めるための2つのチャンネルについて検討する。
- 参考スコア(独自算出の注目度): 99.68537519404727
- License:
- Abstract: Most online platforms strive to learn from interactions with users, and many engage in exploration: making potentially suboptimal choices for the sake of acquiring new information. We study the interplay between exploration and competition: how such platforms balance the exploration for learning and the competition for users. Here users play three distinct roles: they are customers that generate revenue, they are sources of data for learning, and they are self-interested agents which choose among the competing platforms. We consider a stylized duopoly model in which two firms face the same multi-armed bandit problem. Users arrive one by one and choose between the two firms, so that each firm makes progress on its bandit problem only if it is chosen. Through a mix of theoretical results and numerical simulations, we study whether and to what extent competition incentivizes the adoption of better bandit algorithms, and whether it leads to welfare increases for users. We find that stark competition induces firms to commit to a "greedy" bandit algorithm that leads to low welfare. However, weakening competition by providing firms with some "free" users incentivizes better exploration strategies and increases welfare. We investigate two channels for weakening the competition: relaxing the rationality of users and giving one firm a first-mover advantage. Our findings are closely related to the "competition vs. innovation" relationship, and elucidate the first-mover advantage in the digital economy.
- Abstract(参考訳): ほとんどのオンラインプラットフォームは,ユーザとのインタラクションから学ぶことを目指している。
このようなプラットフォームが,学習のための探索とユーザのための競争のバランスをとる方法について,探索と競争の相互作用について検討する。
ここでユーザーは3つの異なる役割を演じている。彼らは収益を生み出す顧客であり、学習のためのデータ源であり、競合するプラットフォームの中から選択される自己関心のエージェントである。
我々は、2つの企業が同じマルチアームバンディット問題に直面しているスタイル化されたデュポリーモデルを考える。
ユーザーは1人ずつ到着し、2つの会社を選択すれば、それぞれの企業が、選択された場合にのみ、その盗賊問題に進展する。
理論的結果と数値シミュレーションの混合により,コンペティションがより優れたバンディットアルゴリズムの採用を動機づけるかどうか,また,それがユーザの福祉向上につながるかどうかを検討する。
私たちは、スタークコンペティションが企業に対して、低福祉につながる「欲張り」バンディットアルゴリズムにコミットするよう促すことに気付きました。
しかし、一部の「無料」ユーザを企業に提供することで競争が弱まり、より良い探索戦略のインセンティブが与えられ、福祉が増大する。
競争を弱めるための2つのチャンネルについて検討する。
我々の発見は「競争対イノベーション」の関係と密接に関連しており、デジタル経済における第一の優位性を解明している。
関連論文リスト
- Defection-Free Collaboration between Competitors in a Learning System [61.22540496065961]
協力によって収益を失うと、参加者がシステムから外れる競合相手となる協調学習システムについて検討する。
我々は、両社が利益を失わずに相互に共有する、より公平で*欠陥のない*スキームを提案する。
論文 参考訳(メタデータ) (2024-06-22T17:29:45Z) - User Welfare Optimization in Recommender Systems with Competing Content Creators [65.25721571688369]
本研究では,コンテンツ制作者間での競争ゲーム環境下で,システム側ユーザ福祉の最適化を行う。
本稿では,推奨コンテンツの満足度に基づいて,各ユーザの重みの列を動的に計算する,プラットフォームのためのアルゴリズムソリューションを提案する。
これらの重みはレコメンデーションポリシーやポストレコメンデーション報酬を調整するメカニズムの設計に利用され、それによってクリエイターのコンテンツ制作戦略に影響を与える。
論文 参考訳(メタデータ) (2024-04-28T21:09:52Z) - A Competition-based Pricing Strategy in Cloud Markets using Regret
Minimization Techniques [0.0]
本研究は,後悔最小化アルゴリズムに関連する価格ポリシーを提案し,不完全情報ゲームに適用する。
クラウドの競合ベースのマーケットプレースに基づいて、プロバイダは経験豊富な後悔を使って戦略の配布を更新する。
実験の結果は、他の価格政策と比較して、プロバイダの利益が大幅に増加したことを示している。
論文 参考訳(メタデータ) (2023-09-20T13:38:43Z) - Improving Fairness in Adaptive Social Exergames via Shapley Bandits [7.215807283769683]
フェアネスを意識したマルチアームバンディットShapley Banditsを提案する。
グループ全体のアウトプットではなく、プレーヤ全体の参加と介入の定着を高めるために、Shapley Valueを使用する。
以上の結果から,我々のShapley BanditsはGreedy Bandit Problemを効果的に媒介し,参加者間のユーザ維持とモチベーションの向上を実現していることがわかった。
論文 参考訳(メタデータ) (2023-02-18T11:34:02Z) - Bandit Social Learning: Exploration under Myopic Behavior [58.75758600464338]
オンラインプラットフォーム上でのレビューによって動機付けられた社会学習のダイナミクスについて検討する。
エージェントはまとめて単純なマルチアームのバンディットプロトコルに従うが、各エージェントは探索を伴わずにミオプティカルに振る舞う。
このような振る舞いに対して,スターク学習の失敗を導出し,好意的な結果を提供する。
論文 参考訳(メタデータ) (2023-02-15T01:57:57Z) - How Bad is Top-$K$ Recommendation under Competing Content Creators? [43.2268992294178]
我々は,アナーキー価格のレンズによるユーザ福祉保証について検討する。
創造者競争によるユーザ福祉損失のごく一部は、ユーザ決定におけるKドルとランダム性に応じて、常に小さな一定値で上限づけられていることが示される。
論文 参考訳(メタデータ) (2023-02-03T19:37:35Z) - Incentive-Aware Recommender Systems in Two-Sided Markets [49.692453629365204]
最適性能を達成しつつエージェントのインセンティブと整合する新しいレコメンデータシステムを提案する。
我々のフレームワークは、このインセンティブを意識したシステムを、両側市場におけるマルチエージェントバンディット問題としてモデル化する。
どちらのアルゴリズムも、エージェントが過剰な露出から保護する、ポストフェアネス基準を満たす。
論文 参考訳(メタデータ) (2022-11-23T22:20:12Z) - Competition, Alignment, and Equilibria in Digital Marketplaces [97.03797129675951]
プラットフォームアクションがバンディットアルゴリズムであり,両プラットフォームがユーザ参加を競うデュオポリー市場について検討する。
私たちの主な発見は、この市場における競争は、市場の結果をユーザーユーティリティと完全に一致させるものではないということです。
論文 参考訳(メタデータ) (2022-08-30T17:43:58Z) - Invitation in Crowdsourcing Contests [9.860944032009847]
本研究では,クラウドソーシングコンテストにおけるエージェントのインセンティブのモデル化と設計において,人々の社会的結びつきが重要な要素であると考えている。
我々は,依頼者が近隣住民を招待してタスクに貢献させる,新たなコンテスト機構を確立する。
我々の均衡分析によると、ベイズ・ナッシュの均衡エージェントの行動は、本質的な能力に加えて、エージェント間の社会的関係も意思決定において中心的な役割を果たす。
論文 参考訳(メタデータ) (2021-12-06T09:18:18Z) - Maximizing Social Welfare in a Competitive Diffusion Model [19.18481967353127]
UIC(IM)は、バイラルマーケティングや感染封じ込めなどの応用により、多くの注目を集めている。
少数のシードユーザを選択して採用することで,ネットワーク内の多数のユーザに普及させることを目指している。
既存の競合IMの研究にはいくつかの制限がある。
論文 参考訳(メタデータ) (2020-12-06T19:09:12Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。