論文の概要: CEN : Cooperatively Evolving Networks
- arxiv url: http://arxiv.org/abs/2207.02192v1
- Date: Tue, 5 Jul 2022 17:48:54 GMT
- ステータス: 処理完了
- システム内更新日: 2022-07-06 15:26:40.585537
- Title: CEN : Cooperatively Evolving Networks
- Title(参考訳): CEN : 協調進化型ネットワーク
- Authors: Sobhan Babu, Ravindra Guravannavar
- Abstract要約: GANのトレーニング手順は、各モジュールが同時ゲームの各インスタンスでエラーを最適化しようとする、有限繰り返しゲームである。
同時ゲームの各インスタンスにおいて、より強力なモジュールがより弱いモジュールと協力し、より弱いモジュールだけがエラーを最適化する。
- 参考スコア(独自算出の注目度): 0.0
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: A finitely repeated game is a dynamic game in which a simultaneous game is
played finitely many times. GANs contain two competing modules: the generator
module is trained to generate new examples, and the discriminator module is
trained to discriminate real examples from generated examples. Training
procedure of GAN is a finitely repeated game in which each module tries to
optimize it's error at every instance of simultaneous game in a non-cooperative
manner. We observed that we can achieve more accurate training, if at each
instance of simultaneous game the stronger module cooperate with weaker module
and only weaker module only optimize it's error.
- Abstract(参考訳): 有限反復ゲーム(英: finitely repeat game)は、同時ゲームを有限回行う動的ゲームである。
GANには2つの競合するモジュールが含まれている。ジェネレータモジュールは新しい例を生成するために訓練され、差別化モジュールは生成された例から実例を識別するために訓練される。
GANのトレーニング手順は、各モジュールが同時ゲームの各インスタンスにおけるエラーを非協調的に最適化しようとする、有限繰り返しゲームである。
我々は、同時ゲームの各インスタンスにおいてより強力なモジュールが弱いモジュールと協調し、より弱いモジュールだけがエラーを最適化するだけであれば、より正確なトレーニングを達成することができると観察した。
関連論文リスト
- Denoising Opponents Position in Partial Observation Environment [0.4660328753262075]
サッカーシミュレーション2D (SS2D) では、11人の選手と1人のコーチを含む2チームが対戦する。
我々は,Long Short-Term Memory Model (LSTM) とDeep Neural Networks (DNN) を用いた位置予測のアイデアを説明する。
論文 参考訳(メタデータ) (2023-10-23T04:16:52Z) - Domain Generalization via Balancing Training Difficulty and Model
Capability [61.053202176230904]
ドメイン一般化(Domain Generalization, DG)は、1つまたは複数のソースドメインからドメイン一般化可能なモデルを学習することを目的としている。
最近の進歩にもかかわらず、既存の作業の多くは、トレーニングサンプルの難易度と、現代的に訓練されたモデルの能力の相違に悩まされている。
我々は、モデルの能力とサンプルの難易度の間のシーソーのバランスをとることで、ミスアライメントに対処するMomentum DifficultyフレームワークであるMoDifyを設計する。
論文 参考訳(メタデータ) (2023-09-02T07:09:23Z) - Decouple Graph Neural Networks: Train Multiple Simple GNNs Simultaneously Instead of One [60.5818387068983]
グラフニューラルネットワーク(GNN)は、深刻な非効率性に悩まされている。
我々は,より効率的なトレーニングを行うために,多層GNNを複数の単純なモジュールとして分離することを提案する。
提案するフレームワークは,合理的な性能で高い効率性を示す。
論文 参考訳(メタデータ) (2023-04-20T07:21:32Z) - Mastering Asymmetrical Multiplayer Game with Multi-Agent
Asymmetric-Evolution Reinforcement Learning [8.628547849796615]
非対称マルチプレイヤーゲーム (AMP game) は、ゲーム内で複数の種類のエージェントが競合したり協力したりする人気ゲームジャンルである。
非対称な環境下での非バランス性のため、AMPゲームでトップの人間プレイヤーを倒すことのできる強力なエージェントを、典型的なセルフプレイトレーニング手法で訓練することは困難である。
AMPゲームにおいて,複数種類のエージェントを同時に学習できる新しいマルチエージェント強化学習フレームワークである非対称進化学習(AET)を提案する。
論文 参考訳(メタデータ) (2023-04-20T07:14:32Z) - Multi-Game Decision Transformers [49.257185338595434]
そこで本研究では,1つのトランスフォーマーモデルを用いて,最大46個のAtariゲーム群を,人間に近いパフォーマンスで同時にプレイ可能であることを示す。
オンラインやオフラインのRL手法や行動クローンなど,マルチゲーム設定におけるいくつかのアプローチを比較した。
マルチゲーム決定変換モデルは、最高のスケーラビリティとパフォーマンスを提供します。
論文 参考訳(メタデータ) (2022-05-30T16:55:38Z) - An Instance-Dependent Analysis for the Cooperative Multi-Player
Multi-Armed Bandit [93.97385339354318]
マルチプレイヤーマルチアーマッドバンドにおける情報共有と協調の課題について検討する。
まず, プレイヤーの最適度差を推定するために, 逐次的除去戦略への簡単な修正が可能であることを示す。
第2に,第1の結果を利用して,衝突の小さな報奨をプレイヤー間の協調に役立てる通信プロトコルを設計する。
論文 参考訳(メタデータ) (2021-11-08T23:38:47Z) - Discovering Multi-Agent Auto-Curricula in Two-Player Zero-Sum Games [31.97631243571394]
明示的な人間設計なしに更新ルールの発見を自動化するフレームワークであるLMACを導入する。
意外なことに、人間のデザインがなくても、発見されたMARLアルゴリズムは競争力や性能が向上する。
LMAC は,例えば Kuhn Poker のトレーニングやPSRO の成績など,小型ゲームから大規模ゲームへの一般化が可能であることを示す。
論文 参考訳(メタデータ) (2021-06-04T22:30:25Z) - Complex Momentum for Learning in Games [42.081050296353574]
我々は、微分可能なゲームにおいて学習する運動量を伴う勾配降下を複素数値運動量を持つように一般化する。
我々は、複雑な値の運動量によってゲーム内の収束性が改善できることを実証する。
我々はまた、CIFAR-10のより良いスコアにBigGANを訓練するために使用する複素値アダム変種への実用的な一般化を示す。
論文 参考訳(メタデータ) (2021-02-16T19:55:27Z) - Fever Basketball: A Complex, Flexible, and Asynchronized Sports Game
Environment for Multi-agent Reinforcement Learning [38.4742699455284]
バスケットボールの試合をエージェントが訓練する新しい強化学習環境であるFever Basketballゲームを紹介した。
複数の文字、複数の位置、シングルエージェントとマルチエージェントのプレイヤー制御モードをサポートする複雑で困難な環境である。
現実のバスケットボールの試合をより良くシミュレートするために、アクションの実行時間が異なるため、Fever Basketballは新しい非同期環境となる。
論文 参考訳(メタデータ) (2020-12-06T07:51:59Z) - Multi-Agent Collaboration via Reward Attribution Decomposition [75.36911959491228]
本稿では,StarCraftのマルチエージェントチャレンジにおいて,最先端のパフォーマンスを実現するコラボレーション型Q-ラーニング(CollaQ)を提案する。
CollaQは様々なStarCraft属性マップで評価され、既存の最先端技術よりも優れていることを示す。
論文 参考訳(メタデータ) (2020-10-16T17:42:11Z) - Model-Based Reinforcement Learning for Atari [89.3039240303797]
エージェントがモデルフリーの手法よりも少ないインタラクションでAtariゲームを解くことができることを示す。
本実験は,エージェントと環境間の100kの相互作用の少ないデータ構造における,AtariゲームにおけるSimPLeの評価である。
論文 参考訳(メタデータ) (2019-03-01T15:40:19Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。