論文の概要: Naive Algorithmic Collusion: When Do Bandit Learners Cooperate and When Do They Compete?
- arxiv url: http://arxiv.org/abs/2411.16574v1
- Date: Mon, 25 Nov 2024 16:58:07 GMT
- ステータス: 翻訳完了
- システム内更新日: 2024-11-26 14:18:23.968431
- Title: Naive Algorithmic Collusion: When Do Bandit Learners Cooperate and When Do They Compete?
- Title(参考訳): Naive Algorithmic Collusion:バンド学習者はいつ協力し、いつ競合するか?
- Authors: Connor Douglas, Foster Provost, Arun Sundararajan,
- Abstract要約: アルゴリズムエージェントは、さまざまな競争上の決定設定で使用される。
エージェントが競合する状況で使用されるマルチアーム帯域幅機械学習アルゴリズムの動作について検討する。
これらの文脈自由な盗賊は、相手の選択や結果の知識がないまま、相変わらず共謀行動を学ぶことを示している。
- 参考スコア(独自算出の注目度): 0.0
- License:
- Abstract: Algorithmic agents are used in a variety of competitive decision settings, notably in making pricing decisions in contexts that range from online retail to residential home rentals. Business managers, algorithm designers, legal scholars, and regulators alike are all starting to consider the ramifications of "algorithmic collusion." We study the emergent behavior of multi-armed bandit machine learning algorithms used in situations where agents are competing, but they have no information about the strategic interaction they are engaged in. Using a general-form repeated Prisoner's Dilemma game, agents engage in online learning with no prior model of game structure and no knowledge of competitors' states or actions (e.g., no observation of competing prices). We show that these context-free bandits, with no knowledge of opponents' choices or outcomes, still will consistently learn collusive behavior - what we call "naive collusion." We primarily study this system through an analytical model and examine perturbations to the model through simulations. Our findings have several notable implications for regulators. First, calls to limit algorithms from conditioning on competitors' prices are insufficient to prevent algorithmic collusion. This is a direct result of collusion arising even in the naive setting. Second, symmetry in algorithms can increase collusion potential. This highlights a new, simple mechanism for "hub-and-spoke" algorithmic collusion. A central distributor need not imbue its algorithm with supra-competitive tendencies for apparent collusion to arise; it can simply arise by using certain (common) machine learning algorithms. Finally, we highlight that collusive outcomes depend starkly on the specific algorithm being used, and we highlight market and algorithmic conditions under which it will be unknown a priori whether collusion occurs.
- Abstract(参考訳): アルゴリズムエージェントは、オンライン小売店から住宅賃貸まで、さまざまな競争上の意思決定設定で使用される。
ビジネスマネージャ、アルゴリズムデザイナ、法学者、そして規制当局も同様に、"アルゴリズム的共謀"の影響について検討し始めている。
エージェントが競合する状況で使用されるマルチアームバンディット機械学習アルゴリズムの創発的動作について検討するが、それらが関与する戦略的相互作用に関する情報は得られない。
一般的な形で繰り返される囚人のジレンマゲームを用いて、エージェントはゲーム構造の事前モデルがなく、競合する状態や行動の知識もないオンライン学習を行う(例えば、競合する価格の観察は行わない)。
我々は、これらの文脈自由な盗賊が、相手の選択や結果の知識がないまま、常に結束行動("naive collusion"と呼ばれるもの)を学ぶことを示した。
本システムは主に解析モデルを用いて研究し,シミュレーションによりモデルに対する摂動について検討する。
我々の発見は、規制当局にいくつかの顕著な意味を持つ。
第一に、アルゴリズムが競合者の価格を条件付けすることを制限する呼び出しは、アルゴリズムの衝突を防ぐには不十分である。
これは、ナイーブな環境でも起こる共謀の直接的な結果である。
第二に、アルゴリズムの対称性は衝突ポテンシャルを増加させる。
これは、"hub-and-spoke"アルゴリズムの共謀の、新しくてシンプルなメカニズムを強調している。
中央のディストリビュータは、そのアルゴリズムに、明らかな共謀が起こるための超競合的な傾向を持たせる必要はない。
最後に、衝突の結果が使用される特定のアルゴリズムに大きく依存していることを強調し、衝突が起こるかどうかの先入観として、それが未知の市場条件とアルゴリズム条件を強調した。
関連論文リスト
- PageRank Bandits for Link Prediction [72.61386754332776]
リンク予測は、リコメンダシステムやナレッジグラフ補完といった幅広いアプリケーションを用いたグラフ学習において重要な問題である。
本稿では,リンク予測を逐次的意思決定プロセスとして再構成し,各リンク予測インタラクションを逐次的に行う。
本稿では,PageRankとコンテキスト的帯域を結合した新しい融合アルゴリズム PRB (PageRank Bandits) を提案する。
論文 参考訳(メタデータ) (2024-11-03T02:39:28Z) - Artificial Intelligence and Algorithmic Price Collusion in Two-sided Markets [9.053163124987535]
両市場において,Qラーニングを用いたAIエージェントが暗黙の共謀にどのように関与するかを検討する。
我々の実験によると、AI駆動プラットフォームはBertrandの競合よりも高いコラシオンレベルを実現している。
ネットワークの外部性の向上は、共謀を著しく向上させ、AIアルゴリズムがそれらを活用して利益を最大化することを示唆している。
論文 参考訳(メタデータ) (2024-07-04T17:57:56Z) - Tacit algorithmic collusion in deep reinforcement learning guided price competition: A study using EV charge pricing game [0.0]
複雑な構造を持つゲームの価格設定のプレイヤーは、人工知能(AI)による学習アルゴリズムの採用が増えている。
正準形式のゲームに関する最近の研究は、無から高レベルの暗黙の共謀まで、対照的な主張を示している。
EV充電ハブが価格を動的に変動させることで競争する現実的なゲームを考える。
数値ケーススタディの結果,0.14~0.45の衝突指数値が得られた。
論文 参考訳(メタデータ) (2024-01-25T16:51:52Z) - Bandit Social Learning: Exploration under Myopic Behavior [58.75758600464338]
オンラインプラットフォーム上でのレビューによって動機付けられた社会学習のダイナミクスについて検討する。
エージェントはまとめて単純なマルチアームのバンディットプロトコルに従うが、各エージェントは探索を伴わずにミオプティカルに振る舞う。
このような振る舞いに対して,スターク学習の失敗を導出し,好意的な結果を提供する。
論文 参考訳(メタデータ) (2023-02-15T01:57:57Z) - Incentivizing Combinatorial Bandit Exploration [87.08827496301839]
自己関心のあるユーザに対してレコメンデーションシステムでアクションを推奨するバンディットアルゴリズムを考える。
ユーザーは他のアクションを自由に選択でき、アルゴリズムの推奨に従うためにインセンティブを得る必要がある。
ユーザは悪用を好むが、アルゴリズムは、前のユーザから収集した情報を活用することで、探索にインセンティブを与えることができる。
論文 参考訳(メタデータ) (2022-06-01T13:46:25Z) - Artificial Intelligence and Spontaneous Collusion [0.0]
我々は,学習アルゴリズム間の戦略的相互作用を研究するための抽出可能なモデルを開発した。
アルゴリズム的共謀の出現の原因となるメカニズムを明らかにする。
自然結合は、価格と市場シェアの共謀を持続できることを示す。
論文 参考訳(メタデータ) (2022-02-12T00:50:15Z) - Algorithmic collusion: A critical review [0.0]
本稿では,アルゴリズムの共謀に関する文献をレビューし,それを計算機科学の成果に結びつける。
反トラスト法を適用して、実際の市場で衝突する自己学習アルゴリズムを扱うのは時期尚早だが、他のアルゴリズムによる共謀は、すでに法的措置を義務付けているかもしれない。
論文 参考訳(メタデータ) (2021-10-10T09:14:16Z) - Learning Equilibria in Matching Markets from Bandit Feedback [139.29934476625488]
不確実性の下で安定した市場成果を学習するためのフレームワークとアルゴリズムを開発する。
私たちの研究は、大規模なデータ駆動の市場において、いつ、どのように安定したマッチングが生じるかを明らかにするための第一歩を踏み出します。
論文 参考訳(メタデータ) (2021-08-19T17:59:28Z) - Understanding algorithmic collusion with experience replay [0.0]
無限に繰り返される価格ゲームでは、人工知能(q-learning)に基づく価格アルゴリズムは、一貫して超競合価格を課金することを学ぶかもしれない。
アルゴリズムの共謀に関する懸念は生じたが、根本的な要因についてはほとんど知られていない。
論文 参考訳(メタデータ) (2021-02-18T03:28:41Z) - Optimal Robustness-Consistency Trade-offs for Learning-Augmented Online
Algorithms [85.97516436641533]
機械学習予測を取り入れたオンラインアルゴリズムの性能向上の課題について検討する。
目標は、一貫性と堅牢性の両方を備えたアルゴリズムを設計することだ。
機械学習予測を用いた競合解析のための非自明な下界の最初のセットを提供する。
論文 参考訳(メタデータ) (2020-10-22T04:51:01Z) - Adversarial Attacks on Linear Contextual Bandits [87.08004581867537]
悪意のあるエージェントは、望ましい行動を実行するためにバンディットアルゴリズムを攻撃するインセンティブを持つ可能性がある。
悪意のあるエージェントは、線形コンテキストのバンドイットアルゴリズムに任意のアーム$T - o(T)$倍を$T$ステップで引き出すように強制することができる。
また,悪意のあるエージェントが単一コンテキストにおける帯域幅アルゴリズムの動作に影響を与えることに関心がある場合についても検討する。
論文 参考訳(メタデータ) (2020-02-10T15:04:09Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。