論文の概要: Contextual Games: Multi-Agent Learning with Side Information
- arxiv url: http://arxiv.org/abs/2107.06327v1
- Date: Tue, 13 Jul 2021 18:37:37 GMT
- ステータス: 処理完了
- システム内更新日: 2021-07-15 14:09:46.050667
- Title: Contextual Games: Multi-Agent Learning with Side Information
- Title(参考訳): コンテキストゲーム:サイド情報によるマルチエージェント学習
- Authors: Pier Giuseppe Sessa, Ilija Bogunovic, Andreas Krause, Maryam
Kamgarpour
- Abstract要約: 各ラウンドでコンテキスト情報によって駆動されるコンテキストゲームの新しいクラスを定式化する。
カーネルベースの規則性仮定を用いて、異なるコンテキストとゲーム結果の相関関係をモデル化する。
本研究では,個々のプレイヤーの文脈的後悔を最小限に抑えるために,そのような相関を利用した新しいオンライン(メタ)アルゴリズムを提案する。
- 参考スコア(独自算出の注目度): 57.76996806603094
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: We formulate the novel class of contextual games, a type of repeated games
driven by contextual information at each round. By means of kernel-based
regularity assumptions, we model the correlation between different contexts and
game outcomes and propose a novel online (meta) algorithm that exploits such
correlations to minimize the contextual regret of individual players. We define
game-theoretic notions of contextual Coarse Correlated Equilibria (c-CCE) and
optimal contextual welfare for this new class of games and show that c-CCEs and
optimal welfare can be approached whenever players' contextual regrets vanish.
Finally, we empirically validate our results in a traffic routing experiment,
where our algorithm leads to better performance and higher welfare compared to
baselines that do not exploit the available contextual information or the
correlations present in the game.
- Abstract(参考訳): 各ラウンドでコンテキスト情報によって駆動される繰り返しゲームであるコンテキストゲームの新しいクラスを定式化する。
カーネルに基づく正則性仮定を用いて、異なる文脈とゲーム結果の相関をモデル化し、そのような相関を利用して個々のプレイヤーの文脈的後悔を最小限に抑える新しいオンライン(メタ)アルゴリズムを提案する。
c-cce(contextual correlationd equilibria)のゲーム理論的概念と,この新しいゲーム群における最適文脈福祉の概念を定義し,プレイヤーの文脈的後悔が消えてしまえば,c-ccesと最適福祉がアプローチできることを示す。
最後に,我々のアルゴリズムは,使用可能なコンテキスト情報やゲーム内に存在する相関を利用していないベースラインと比較して,より優れた性能と高い福祉をもたらす,トラフィックルーティング実験の成果を実証的に検証する。
関連論文リスト
- Revisiting the Roles of "Text" in Text Games [102.22750109468652]
本稿では,強化学習におけるテキストの役割について検討する。
本稿では,関連するコンテキスト情報を近似状態ハッシュに抽出する簡単な手法を提案する。
このような軽量なプラグインは最先端のテキストエージェントとの競合性能を実現する。
論文 参考訳(メタデータ) (2022-10-15T21:52:39Z) - Contextual Model Aggregation for Fast and Robust Federated Learning in
Edge Computing [88.76112371510999]
フェデレーション学習は、ネットワークエッジにおける分散機械学習の第一候補である。
既存のアルゴリズムは、性能の緩やかな収束や堅牢性の問題に直面している。
そこで本稿では,損失低減に対する最適コンテキスト依存境界を実現するためのコンテキストアグリゲーション手法を提案する。
論文 参考訳(メタデータ) (2022-03-23T21:42:31Z) - Hindsight and Sequential Rationality of Correlated Play [18.176128899338433]
私たちは、修正された振る舞いで達成できたことに対して、強いパフォーマンスを後見で保証するアルゴリズムを検討します。
我々は,学習の隠れた枠組みを,逐次的な意思決定の場で開発し,提唱する。
本稿では,それぞれの平衡の強さと弱さを文献に示す例を示す。
論文 参考訳(メタデータ) (2020-12-10T18:30:21Z) - Deep Reinforcement Learning with Stacked Hierarchical Attention for
Text-based Games [64.11746320061965]
自然言語の文脈におけるインタラクティブなシミュレーションであるテキストベースゲームの強化学習について検討する。
エージェントの動作が解釈可能な推論手順によって生成され、支援されるように、意思決定のための知識グラフを用いた明示的な推論を行うことを目指している。
提案手法を多数の人為的ベンチマークゲームで広範囲に評価し,本手法が既存のテキストベースエージェントよりも優れていることを示す実験結果を得た。
論文 参考訳(メタデータ) (2020-10-22T12:40:22Z) - Interactive Fiction Game Playing as Multi-Paragraph Reading
Comprehension with Reinforcement Learning [94.50608198582636]
対話型フィクション(IF)ゲームと実際の自然言語テキストは、言語理解技術に対する新たな自然な評価を提供する。
IFゲーム解決の新たな視点を捉え,MPRC(Multi-Passage Reading)タスクとして再フォーマットする。
論文 参考訳(メタデータ) (2020-10-05T23:09:20Z) - Faster Algorithms for Optimal Ex-Ante Coordinated Collusive Strategies
in Extensive-Form Zero-Sum Games [123.76716667704625]
我々は,不完全情報ゼロサム拡張形式ゲームにおいて,対戦相手と対決する2人の選手のチームにとって最適な戦略を見つけることの課題に焦点をあてる。
この設定では、チームができる最善のことは、ゲーム開始時の関節(つまり相関した)確率分布から潜在的にランダム化された戦略(プレイヤー1人)のプロファイルをサンプリングすることである。
各プロファイルにランダム化されるのはチームメンバーの1人だけであるプロファイルのみを用いることで、そのような最適な分布を計算するアルゴリズムを提供する。
論文 参考訳(メタデータ) (2020-09-21T17:51:57Z) - Predicting Strategic Behavior from Free Text [38.506665373140876]
我々は,ゲームとしてモデル化された経済状況下でのメッセージと行動の関連性について検討する。
本研究では,個人が提供した自由テキストに基づくワンショットゲームにおいて,個人の行動予測に関する研究を紹介する。
これらの属性に基づいたワンショットゲームにおいて,これらの個人が行う行動を予測するために,トランスダクティブ・ラーニング(transductive learning)を採用している。
論文 参考訳(メタデータ) (2020-04-06T20:05:30Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。