論文の概要: Artificial Intelligence and Spontaneous Collusion
- arxiv url: http://arxiv.org/abs/2202.05946v5
- Date: Tue, 19 Sep 2023 17:51:34 GMT
- ステータス: 処理完了
- システム内更新日: 2023-09-20 20:51:45.413943
- Title: Artificial Intelligence and Spontaneous Collusion
- Title(参考訳): 人工知能と自発衝突
- Authors: Martino Banchio, Giacomo Mantegazza
- Abstract要約: 我々は,学習アルゴリズム間の戦略的相互作用を研究するための抽出可能なモデルを開発した。
アルゴリズム的共謀の出現の原因となるメカニズムを明らかにする。
自然結合は、価格と市場シェアの共謀を持続できることを示す。
- 参考スコア(独自算出の注目度): 0.0
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: We develop a tractable model for studying strategic interactions between
learning algorithms. We uncover a mechanism responsible for the emergence of
algorithmic collusion. We observe that algorithms periodically coordinate on
actions that are more profitable than static Nash equilibria. This novel
collusive channel relies on an endogenous statistical linkage in the
algorithms' estimates which we call spontaneous coupling. The model's
parameters predict whether the statistical linkage will appear, and what market
structures facilitate algorithmic collusion. We show that spontaneous coupling
can sustain collusion in prices and market shares, complementing experimental
findings in the literature. Finally, we apply our results to design algorithmic
markets.
- Abstract(参考訳): 学習アルゴリズム間の戦略的相互作用を研究するための扱いやすいモデルを開発した。
アルゴリズム的共謀の出現の原因となるメカニズムを明らかにする。
我々は,静的ナッシュ平衡よりも利益の高い行動に対して,アルゴリズムが定期的に協調するのを観察した。
この新たな畳み込みチャネルは、自然結合と呼ばれるアルゴリズムの推定における内因性統計リンクに依存している。
モデルのパラメータは、統計的な連鎖が現れるかどうかを予測し、どの市場構造がアルゴリズム的結束を促進するかを予測する。
自発的結合が価格と市場シェアの結束を持続し,文献における実験的知見を補完することを示した。
最後に、アルゴリズム市場の設計に結果を適用します。
関連論文リスト
- Contractual Reinforcement Learning: Pulling Arms with Invisible Hands [68.77645200579181]
本稿では,契約設計によるオンライン学習問題において,利害関係者の経済的利益を整合させる理論的枠組みを提案する。
計画問題に対して、遠目エージェントに対する最適契約を決定するための効率的な動的プログラミングアルゴリズムを設計する。
学習問題に対して,契約の堅牢な設計から探索と搾取のバランスに至るまでの課題を解き放つために,非回帰学習アルゴリズムの汎用設計を導入する。
論文 参考訳(メタデータ) (2024-07-01T16:53:00Z) - Independent Learning in Constrained Markov Potential Games [19.083595175045073]
制約付きマルコフゲームは、マルチエージェント強化学習問題をモデル化するための正式なフレームワークを提供する。
近似的制約付きナッシュ平衡を学習するための独立ポリシー勾配アルゴリズムを提案する。
論文 参考訳(メタデータ) (2024-02-27T20:57:35Z) - Multi-Agent Dynamic Relational Reasoning for Social Robot Navigation [55.65482030032804]
社会ロボットナビゲーションは、日常生活の様々な状況において有用であるが、安全な人間とロボットの相互作用と効率的な軌道計画が必要である。
本稿では, 動的に進化する関係構造を明示的に推論した系統的関係推論手法を提案する。
提案手法は,軌道予測器が将来の状態を生成するために使用する関係の進化を捉えるために,動的に進化する関係グラフとハイパーグラフを推論する。
論文 参考訳(メタデータ) (2024-01-22T18:58:22Z) - Distributed Multi-Task Learning for Stochastic Bandits with Context Distribution and Stage-wise Constraints [0.0]
本稿では,分散上信頼度境界(UCB)アルゴリズム,関連UCBを提案する。
提案アルゴリズムは,各ラウンドにおいて,制約を満たすためにプルーニングされた動作セットを構築する。
合成データと実世界のMovielens-100Kデータに対するアルゴリズムの性能を実証的に検証した。
論文 参考訳(メタデータ) (2024-01-21T18:43:55Z) - Provable Guarantees for Generative Behavior Cloning: Bridging Low-Level
Stability and High-Level Behavior [51.60683890503293]
生成モデルを用いた複雑な専門家による実演の行動クローニングに関する理論的枠組みを提案する。
任意の専門的軌跡の時間ごとのステップ分布に一致するトラジェクトリを生成することができることを示す。
論文 参考訳(メタデータ) (2023-07-27T04:27:26Z) - Asynchronous Bayesian Learning over a Network [18.448653247778143]
本稿では,ネットワーク化されたエージェントが生データを共有せずに分散ベイズ学習を行うための非同期データ融合モデルを提案する。
アルゴリズムは、ランダムに選択されたエージェントのペアがパラメータサンプリングのために調整されていないランゲヴィンダイナミクスを使用するゴシップベースのアプローチを用いる。
本稿では,ゴシップエージェント間の通信をさらに削減するイベントトリガー機構を提案する。
論文 参考訳(メタデータ) (2022-11-16T01:21:36Z) - Towards Multi-Agent Reinforcement Learning driven Over-The-Counter
Market Simulations [16.48389671789281]
オーバー・ザ・カウンタ市場において,流動性提供者と流動性取扱業者が相互作用するゲームについて検討した。
互いに対戦することで、深層強化学習主体のエージェントは創発的な行動を学ぶ。
遷移性仮定の下で,多エージェントポリシー勾配アルゴリズムの収束率を示す。
論文 参考訳(メタデータ) (2022-10-13T17:06:08Z) - Learn to Match with No Regret: Reinforcement Learning in Markov Matching
Markets [151.03738099494765]
我々は、市場の両側でプランナーと戦略エージェントのセットを含むマルコフマッチング市場について検討する。
本稿では,楽観的な値反復と最大重みマッチングを組み合わせた強化学習フレームワークを提案する。
我々は,アルゴリズムがサブ線形後悔を実現することを証明した。
論文 参考訳(メタデータ) (2022-03-07T19:51:25Z) - Robustification of Online Graph Exploration Methods [59.50307752165016]
我々は、古典的で有名なオンライングラフ探索問題の学習強化版について研究する。
本稿では,予測をよく知られたNearest Neighbor(NN)アルゴリズムに自然に統合するアルゴリズムを提案する。
論文 参考訳(メタデータ) (2021-12-10T10:02:31Z) - Scalable Intervention Target Estimation in Linear Models [52.60799340056917]
因果構造学習への現在のアプローチは、既知の介入目標を扱うか、仮説テストを使用して未知の介入目標を発見する。
本稿では、全ての介入対象を一貫して識別するスケーラブルで効率的なアルゴリズムを提案する。
提案アルゴリズムは、与えられた観測マルコフ同値クラスを介入マルコフ同値クラスに更新することも可能である。
論文 参考訳(メタデータ) (2021-11-15T03:16:56Z) - Towards Model Agnostic Federated Learning Using Knowledge Distillation [9.947968358822951]
本研究では,モデル非依存通信プロトコルの理論的研究を開始する。
我々は,2つのエージェントが異なるカーネルを用いてカーネルレグレッションを実行しようとする設定に焦点を当てる。
我々の研究は驚くべき結果をもたらします -- 交互知識蒸留(AKD)を用いる最も自然なアルゴリズムは、過度に強い正則化を課します。
論文 参考訳(メタデータ) (2021-10-28T15:27:51Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。