論文の概要: Dealing with Adversarial Player Strategies in the Neural Network Game
iNNk through Ensemble Learning
- arxiv url: http://arxiv.org/abs/2107.02052v1
- Date: Mon, 5 Jul 2021 14:25:44 GMT
- ステータス: 処理完了
- システム内更新日: 2021-07-06 15:16:23.211728
- Title: Dealing with Adversarial Player Strategies in the Neural Network Game
iNNk through Ensemble Learning
- Title(参考訳): アンサンブル学習によるニューラルネットワークゲームiNNkにおける対戦者戦略への対処
- Authors: Mathias L\"owe, Jennifer Villareale, Evan Freed, Aleksanteri Sladek,
Jichen Zhu, Sebastian Risi
- Abstract要約: 本稿では,iNNkにおける対戦型プレイヤー戦略に焦点をあてる。
転送学習とアンサンブル法を組み合わせて,これらの戦略へのデータ効率の適応を求める手法を提案する。
本稿では,NNゲームが急速に発展する分野において,本手法が有用であると期待する。
- 参考スコア(独自算出の注目度): 10.30864720221571
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Applying neural network (NN) methods in games can lead to various new and
exciting game dynamics not previously possible. However, they also lead to new
challenges such as the lack of large, clean datasets, varying player skill
levels, and changing gameplay strategies. In this paper, we focus on the
adversarial player strategy aspect in the game iNNk, in which players try to
communicate secret code words through drawings with the goal of not being
deciphered by a NN. Some strategies exploit weaknesses in the NN that
consistently trick it into making incorrect classifications, leading to
unbalanced gameplay. We present a method that combines transfer learning and
ensemble methods to obtain a data-efficient adaptation to these strategies.
This combination significantly outperforms the baseline NN across all
adversarial player strategies despite only being trained on a limited set of
adversarial examples. We expect the methods developed in this paper to be
useful for the rapidly growing field of NN-based games, which will require new
approaches to deal with unforeseen player creativity.
- Abstract(参考訳): ニューラルネットワーク(nn)メソッドをゲームに適用することは、これまで不可能だったさまざまな新しいエキサイティングなゲームダイナミクスにつながる可能性がある。
しかし、これはまた、大規模でクリーンなデータセットの欠如、プレイヤースキルのレベルの変化、ゲームプレイ戦略の変更など、新しい課題にもつながる。
本稿では,ゲームinnkにおける敵対的プレイヤ戦略の側面に注目し,プレイヤーがnnに解読されないことを目標として,ドローイングを通じて秘密コードワードを伝達しようとする。
一部の戦略はNNの弱点を利用しており、常に不正な分類をし、不均衡なゲームプレイにつながる。
転送学習とアンサンブル法を組み合わせて,これらの戦略へのデータ効率の適応を求める手法を提案する。
この組み合わせは、限られた敵の例でのみ訓練されているにもかかわらず、全ての敵のプレイヤー戦略のベースラインNNよりも大幅に優れている。
本研究で開発された手法は,NNベースのゲーム分野の急速な発展に有効であり,未知のプレイヤーの創造性に対処するためには,新たなアプローチが必要であると期待する。
関連論文リスト
- In-Context Exploiter for Extensive-Form Games [38.24471816329584]
In-Context Exploiter (ICE) という新しい手法を導入し、ゲーム内の任意のプレイヤーとして動作し、コンテキスト内学習によって完全に対戦相手を適応的に活用できる単一モデルを訓練する。
我々のICEアルゴリズムは、多様な相手戦略の生成、強化学習アルゴリズムによる対話的履歴データの収集、そしてよく設計されたカリキュラム学習フレームワークにおけるトランスフォーマーベースのエージェントの訓練を含む。
論文 参考訳(メタデータ) (2024-08-10T14:59:09Z) - Neural Population Learning beyond Symmetric Zero-sum Games [52.20454809055356]
我々はNuPL-JPSROという,スキルの伝達学習の恩恵を受けるニューラル集団学習アルゴリズムを導入し,ゲームの粗相関(CCE)に収束する。
本研究は, 均衡収束型集団学習を大規模かつ汎用的に実施可能であることを示す。
論文 参考訳(メタデータ) (2024-01-10T12:56:24Z) - All by Myself: Learning Individualized Competitive Behaviour with a
Contrastive Reinforcement Learning optimization [57.615269148301515]
競争ゲームのシナリオでは、エージェントのセットは、彼らの目標を最大化し、敵の目標を同時に最小化する決定を学習する必要があります。
本稿では,競争ゲームの表現を学習し,特定の相手の戦略をどうマップするか,それらを破壊するかを学習する3つのニューラルネットワーク層からなる新しいモデルを提案する。
我々の実験は、オフライン、オンライン、競争特化モデル、特に同じ対戦相手と複数回対戦した場合に、我々のモデルがより良いパフォーマンスを達成することを示した。
論文 参考訳(メタデータ) (2023-10-02T08:11:07Z) - Mastering Percolation-like Games with Deep Learning [0.0]
ネットワークを破壊しようとする攻撃者の論理を模倣した格子上にシングルプレイヤーゲームを作成する。
ゲームの目的は、最も少ないステップ数で全てのノードを無効にすることである。
私たちは、堅牢性の異なる定義でエージェントを訓練し、学習した戦略を比較します。
論文 参考訳(メタデータ) (2023-05-12T15:37:45Z) - Finding mixed-strategy equilibria of continuous-action games without
gradients using randomized policy networks [83.28949556413717]
グラデーションへのアクセスを伴わない連続アクションゲームのナッシュ平衡を近似的に計算する問題について検討する。
ニューラルネットワークを用いてプレイヤーの戦略をモデル化する。
本論文は、制約のない混合戦略と勾配情報のない一般的な連続アクションゲームを解決する最初の方法である。
論文 参考訳(メタデータ) (2022-11-29T05:16:41Z) - Game Theoretic Rating in N-player general-sum games with Equilibria [26.166859475522106]
そこで我々は,N-playerに適した新しいアルゴリズムを提案する。
これにより、平衡のような確立された解の概念を利用でき、複雑な戦略的相互作用を持つゲームにおける戦略を効率的に評価することができる。
論文 参考訳(メタデータ) (2022-10-05T12:33:03Z) - Learning Generative Deception Strategies in Combinatorial Masking Games [27.2744631811653]
詐欺の1つの方法は、システムがどのように構成されているかに関する情報を隠蔽したり、マスキングしたりすることである。
本稿では,攻撃者側がマスクする属性のサブセットを選択するのに対して,攻撃者は攻撃を行うエクスプロイトを選択することで応答する,結果として生じるディフェンダー・アタックラー相互作用のゲーム理論モデルを提案する。
両プレイヤーの戦略をニューラルネットワークとして表現することにより,そのようなゲームを概ね解くための,新しい高度にスケーラブルなアプローチを提案する。
論文 参考訳(メタデータ) (2021-09-23T20:42:44Z) - Generating Diverse and Competitive Play-Styles for Strategy Games [58.896302717975445]
ターン型戦略ゲーム(Tribes)のためのプログレッシブアンプランによるPortfolio Monte Carlo Tree Searchを提案する。
品質分散アルゴリズム(MAP-Elites)を使用して異なるプレイスタイルを実現し、競争レベルを維持しながらパラメータ化する方法を示します。
その結果,このアルゴリズムは,トレーニングに用いるレベルを超えて,幅広いゲームレベルにおいても,これらの目標を達成できることが示された。
論文 参考訳(メタデータ) (2021-04-17T20:33:24Z) - L2E: Learning to Exploit Your Opponent [66.66334543946672]
本稿では,暗黙的対向モデリングのための新しい学習フレームワークを提案する。
L2Eは、トレーニング中に異なる相手との対話によって、相手を悪用する能力を取得する。
本稿では, 対戦相手を自動的に生成する新しい対戦相手戦略生成アルゴリズムを提案する。
論文 参考訳(メタデータ) (2021-02-18T14:27:59Z) - iNNk: A Multi-Player Game to Deceive a Neural Network [9.996299325641939]
iNNKは、NNと対戦するマルチプレイヤーの描画ゲームである。
プレイヤーは、NNによって解読されることなく、図面を通して秘密のコードワードを相互に通信する必要がある。
論文 参考訳(メタデータ) (2020-07-17T18:25:10Z) - Learning to Play Sequential Games versus Unknown Opponents [93.8672371143881]
学習者が最初にプレーするゲームと、選択した行動に反応する相手との連続的なゲームについて考察する。
対戦相手の対戦相手列と対戦する際,学習者に対して新しいアルゴリズムを提案する。
我々の結果には、相手の反応の正則性に依存するアルゴリズムの後悔の保証が含まれている。
論文 参考訳(メタデータ) (2020-07-10T09:33:05Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。