論文の概要: Games of Artificial Intelligence: A Continuous-Time Approach
- arxiv url: http://arxiv.org/abs/2202.05946v1
- Date: Sat, 12 Feb 2022 00:50:15 GMT
- ステータス: 処理完了
- システム内更新日: 2022-02-18 12:11:53.245389
- Title: Games of Artificial Intelligence: A Continuous-Time Approach
- Title(参考訳): ゲーム・オブ・人工知能:連続時間アプローチ
- Authors: Martino Banchio, Giacomo Mantegazza
- Abstract要約: 学習アルゴリズムが最高の戦略を追求しながら互いに対戦するゲームを分析する。
アルゴリズムが支配的な戦略を学習できない可能性を説明する新しい現象であるコーディネーションバイアスを発見しました。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: This paper studies the strategic interaction of algorithms in economic games.
We analyze games where learning algorithms play against each other while
searching for the best strategy. We first establish a fluid approximation
technique that enables us to characterize the learning outcomes in continuous
time. This tool allows to identify the equilibria of games played by Artificial
Intelligence algorithms and perform comparative statics analysis. Thus, our
results bridge a gap between traditional learning theory and applied models,
allowing quantitative analysis of traditionally experimental systems. We
describe the outcomes of a social dilemma, and we provide analytical guidance
for the design of pricing algorithms in a Bertrand game. We uncover a new
phenomenon, the coordination bias, which explains how algorithms may fail to
learn dominant strategies.
- Abstract(参考訳): 本稿では,経済ゲームにおけるアルゴリズムの戦略的相互作用について考察する。
学習アルゴリズムが最高の戦略を追求しながら互いに対戦するゲームを分析する。
まず,連続時間における学習成果を特徴付ける流体近似手法を確立した。
このツールは、人工知能アルゴリズムがプレイするゲームの平衡を識別し、比較静的解析を行う。
その結果,従来の学習理論と応用モデルとのギャップを橋渡しし,従来の実験システムの定量的解析を可能にした。
本稿では,ソーシャルジレンマの結果を述べるとともに,Bertrandゲームにおける価格アルゴリズムの設計に関する分析ガイダンスを提供する。
アルゴリズムが支配的な戦略を学習できない可能性を説明する新しい現象、コーディネーションバイアスを明らかにする。
関連論文リスト
- Naive Algorithmic Collusion: When Do Bandit Learners Cooperate and When Do They Compete? [0.0]
アルゴリズムエージェントは、さまざまな競争上の決定設定で使用される。
エージェントが競合する状況で使用されるマルチアーム帯域幅機械学習アルゴリズムの動作について検討する。
これらの文脈自由な盗賊は、相手の選択や結果の知識がないまま、相変わらず共謀行動を学ぶことを示している。
論文 参考訳(メタデータ) (2024-11-25T16:58:07Z) - Contractual Reinforcement Learning: Pulling Arms with Invisible Hands [68.77645200579181]
本稿では,契約設計によるオンライン学習問題において,利害関係者の経済的利益を整合させる理論的枠組みを提案する。
計画問題に対して、遠目エージェントに対する最適契約を決定するための効率的な動的プログラミングアルゴリズムを設計する。
学習問題に対して,契約の堅牢な設計から探索と搾取のバランスに至るまでの課題を解き放つために,非回帰学習アルゴリズムの汎用設計を導入する。
論文 参考訳(メタデータ) (2024-07-01T16:53:00Z) - Independent Learning in Constrained Markov Potential Games [19.083595175045073]
制約付きマルコフゲームは、マルチエージェント強化学習問題をモデル化するための正式なフレームワークを提供する。
近似的制約付きナッシュ平衡を学習するための独立ポリシー勾配アルゴリズムを提案する。
論文 参考訳(メタデータ) (2024-02-27T20:57:35Z) - Multi-Agent Dynamic Relational Reasoning for Social Robot Navigation [50.01551945190676]
社会ロボットナビゲーションは、日常生活の様々な状況において有用であるが、安全な人間とロボットの相互作用と効率的な軌道計画が必要である。
本稿では, 動的に進化する関係構造を明示的に推論した系統的関係推論手法を提案する。
マルチエージェント軌道予測とソーシャルロボットナビゲーションの有効性を実証する。
論文 参考訳(メタデータ) (2024-01-22T18:58:22Z) - Provable Guarantees for Generative Behavior Cloning: Bridging Low-Level
Stability and High-Level Behavior [51.60683890503293]
生成モデルを用いた複雑な専門家による実演の行動クローニングに関する理論的枠組みを提案する。
任意の専門的軌跡の時間ごとのステップ分布に一致するトラジェクトリを生成することができることを示す。
論文 参考訳(メタデータ) (2023-07-27T04:27:26Z) - Asynchronous Bayesian Learning over a Network [18.448653247778143]
本稿では,ネットワーク化されたエージェントが生データを共有せずに分散ベイズ学習を行うための非同期データ融合モデルを提案する。
アルゴリズムは、ランダムに選択されたエージェントのペアがパラメータサンプリングのために調整されていないランゲヴィンダイナミクスを使用するゴシップベースのアプローチを用いる。
本稿では,ゴシップエージェント間の通信をさらに削減するイベントトリガー機構を提案する。
論文 参考訳(メタデータ) (2022-11-16T01:21:36Z) - Towards Multi-Agent Reinforcement Learning driven Over-The-Counter
Market Simulations [16.48389671789281]
オーバー・ザ・カウンタ市場において,流動性提供者と流動性取扱業者が相互作用するゲームについて検討した。
互いに対戦することで、深層強化学習主体のエージェントは創発的な行動を学ぶ。
遷移性仮定の下で,多エージェントポリシー勾配アルゴリズムの収束率を示す。
論文 参考訳(メタデータ) (2022-10-13T17:06:08Z) - Learn to Match with No Regret: Reinforcement Learning in Markov Matching
Markets [151.03738099494765]
我々は、市場の両側でプランナーと戦略エージェントのセットを含むマルコフマッチング市場について検討する。
本稿では,楽観的な値反復と最大重みマッチングを組み合わせた強化学習フレームワークを提案する。
我々は,アルゴリズムがサブ線形後悔を実現することを証明した。
論文 参考訳(メタデータ) (2022-03-07T19:51:25Z) - Robustification of Online Graph Exploration Methods [59.50307752165016]
我々は、古典的で有名なオンライングラフ探索問題の学習強化版について研究する。
本稿では,予測をよく知られたNearest Neighbor(NN)アルゴリズムに自然に統合するアルゴリズムを提案する。
論文 参考訳(メタデータ) (2021-12-10T10:02:31Z) - Scalable Intervention Target Estimation in Linear Models [52.60799340056917]
因果構造学習への現在のアプローチは、既知の介入目標を扱うか、仮説テストを使用して未知の介入目標を発見する。
本稿では、全ての介入対象を一貫して識別するスケーラブルで効率的なアルゴリズムを提案する。
提案アルゴリズムは、与えられた観測マルコフ同値クラスを介入マルコフ同値クラスに更新することも可能である。
論文 参考訳(メタデータ) (2021-11-15T03:16:56Z) - Towards Model Agnostic Federated Learning Using Knowledge Distillation [9.947968358822951]
本研究では,モデル非依存通信プロトコルの理論的研究を開始する。
我々は,2つのエージェントが異なるカーネルを用いてカーネルレグレッションを実行しようとする設定に焦点を当てる。
我々の研究は驚くべき結果をもたらします -- 交互知識蒸留(AKD)を用いる最も自然なアルゴリズムは、過度に強い正則化を課します。
論文 参考訳(メタデータ) (2021-10-28T15:27:51Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。