Fugu-MT 論文翻訳(概要): CEN : Cooperatively Evolving Networks

論文の概要: CEN : Cooperatively Evolving Networks

arxiv url: http://arxiv.org/abs/2207.02192v1
Date: Tue, 5 Jul 2022 17:48:54 GMT
ステータス: 翻訳完了
システム内更新日: 2022-07-06 15:26:40.585537
Title: CEN : Cooperatively Evolving Networks
Title（参考訳）: CEN : 協調進化型ネットワーク
Authors: Sobhan Babu, Ravindra Guravannavar
Abstract要約: GANのトレーニング手順は、各モジュールが同時ゲームの各インスタンスでエラーを最適化しようとする、有限繰り返しゲームである。同時ゲームの各インスタンスにおいて、より強力なモジュールがより弱いモジュールと協力し、より弱いモジュールだけがエラーを最適化する。
参考スコア（独自算出の注目度）: 0.0
License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
Abstract: A finitely repeated game is a dynamic game in which a simultaneous game is played finitely many times. GANs contain two competing modules: the generator module is trained to generate new examples, and the discriminator module is trained to discriminate real examples from generated examples. Training procedure of GAN is a finitely repeated game in which each module tries to optimize it's error at every instance of simultaneous game in a non-cooperative manner. We observed that we can achieve more accurate training, if at each instance of simultaneous game the stronger module cooperate with weaker module and only weaker module only optimize it's error.
Abstract（参考訳）: 有限反復ゲーム(英: finitely repeat game)は、同時ゲームを有限回行う動的ゲームである。 GANには2つの競合するモジュールが含まれている。ジェネレータモジュールは新しい例を生成するために訓練され、差別化モジュールは生成された例から実例を識別するために訓練される。 GANのトレーニング手順は、各モジュールが同時ゲームの各インスタンスにおけるエラーを非協調的に最適化しようとする、有限繰り返しゲームである。我々は、同時ゲームの各インスタンスにおいてより強力なモジュールが弱いモジュールと協調し、より弱いモジュールだけがエラーを最適化するだけであれば、より正確なトレーニングを達成することができると観察した。

関連論文リスト

Fly, Fail, Fix: Iterative Game Repair with Reinforcement Learning and Large Multimodal Models [7.989185500830854]
ゲームデザインは、静的なルールとコンテンツが動的プレイヤーの振る舞いにどのように変換されるかを理解することに焦点を当てている。ゲームをプレイする強化学習(RL)エージェントと,大規模なマルチモーダルモデル(LMM)を組み合わせて,このギャップを埋める自動設計フレームワークを提案する。 LMMデザイナは、ゲームプレイ目標と現在のゲーム設定を受信し、プレイトレースを分析し、その設定を編集して、目標に向けた将来の行動を判断する。
論文参考訳（メタデータ） (2025-07-16T22:45:40Z)
Divide-Fuse-Conquer: Eliciting "Aha Moments" in Multi-Scenario Games [36.162843233798455]
大規模言語モデル(LLM)は、強化学習(RL)中に突然高度な推論能力を示すことが観察されている。マルチシナリオRLにおける一般化を促進するためのフレームワークであるDivide-Fuse-Conquerを提案する。
論文参考訳（メタデータ） (2025-05-22T08:52:21Z)
Model as a Game: On Numerical and Spatial Consistency for Generative Games [117.36098212829766]
本稿では,モデル・アズ・ア・ゲーム(MaaG)のメカニズムを十分に構築した上で,モデル・アズ・ア・ゲーム(MaaG)を真に構成するものを探るため,生成ゲームのパラダイムを再考する。 DiTアーキテクチャに基づいて,(1) LogicNetを統合してイベントトリガを決定する数値モジュール,(2) 探索領域のマップを維持する空間モジュール,(2) 生成中の位置情報を検索して連続性を確保する,という2つの特殊なモジュールを設計する。
論文参考訳（メタデータ） (2025-03-27T05:46:15Z)
Checkmating One, by Using Many: Combining Mixture of Experts with MCTS to Improve in Chess [17.101742121345648]
ゲームフェーズに基づいて戦略を動的に適応するモジュール型フレームワークであるM2CTSを紹介する。各フェーズでトレーニングされた特殊なニューラルネットワークを通じて決定をルーティングすることで、M2CTSは計算効率と演奏強度の両方を改善する。チェスの実験では、M2CTSは標準の単一モデルベースラインよりも最大+122 Eloを達成する。
論文参考訳（メタデータ） (2024-01-30T09:55:14Z)
Denoising Opponents Position in Partial Observation Environment [0.4660328753262075]
サッカーシミュレーション2D (SS2D) では、11人の選手と1人のコーチを含む2チームが対戦する。我々は,Long Short-Term Memory Model (LSTM) とDeep Neural Networks (DNN) を用いた位置予測のアイデアを説明する。
論文参考訳（メタデータ） (2023-10-23T04:16:52Z)
Domain Generalization via Balancing Training Difficulty and Model Capability [61.053202176230904]
ドメイン一般化(Domain Generalization, DG)は、1つまたは複数のソースドメインからドメイン一般化可能なモデルを学習することを目的としている。最近の進歩にもかかわらず、既存の作業の多くは、トレーニングサンプルの難易度と、現代的に訓練されたモデルの能力の相違に悩まされている。我々は、モデルの能力とサンプルの難易度の間のシーソーのバランスをとることで、ミスアライメントに対処するMomentum DifficultyフレームワークであるMoDifyを設計する。
論文参考訳（メタデータ） (2023-09-02T07:09:23Z)
Decouple Graph Neural Networks: Train Multiple Simple GNNs Simultaneously Instead of One [60.5818387068983]
グラフニューラルネットワーク(GNN)は、深刻な非効率性に悩まされている。我々は,より効率的なトレーニングを行うために,多層GNNを複数の単純なモジュールとして分離することを提案する。提案するフレームワークは,合理的な性能で高い効率性を示す。
論文参考訳（メタデータ） (2023-04-20T07:21:32Z)
Mastering Asymmetrical Multiplayer Game with Multi-Agent Asymmetric-Evolution Reinforcement Learning [8.628547849796615]
非対称マルチプレイヤーゲーム (AMP game) は、ゲーム内で複数の種類のエージェントが競合したり協力したりする人気ゲームジャンルである。非対称な環境下での非バランス性のため、AMPゲームでトップの人間プレイヤーを倒すことのできる強力なエージェントを、典型的なセルフプレイトレーニング手法で訓練することは困難である。 AMPゲームにおいて,複数種類のエージェントを同時に学習できる新しいマルチエージェント強化学習フレームワークである非対称進化学習(AET)を提案する。
論文参考訳（メタデータ） (2023-04-20T07:14:32Z)
Multi-Game Decision Transformers [49.257185338595434]
そこで本研究では,1つのトランスフォーマーモデルを用いて,最大46個のAtariゲーム群を,人間に近いパフォーマンスで同時にプレイ可能であることを示す。オンラインやオフラインのRL手法や行動クローンなど,マルチゲーム設定におけるいくつかのアプローチを比較した。マルチゲーム決定変換モデルは、最高のスケーラビリティとパフォーマンスを提供します。
論文参考訳（メタデータ） (2022-05-30T16:55:38Z)
An Instance-Dependent Analysis for the Cooperative Multi-Player Multi-Armed Bandit [93.97385339354318]
マルチプレイヤーマルチアーマッドバンドにおける情報共有と協調の課題について検討する。まず, プレイヤーの最適度差を推定するために, 逐次的除去戦略への簡単な修正が可能であることを示す。第2に,第1の結果を利用して,衝突の小さな報奨をプレイヤー間の協調に役立てる通信プロトコルを設計する。
論文参考訳（メタデータ） (2021-11-08T23:38:47Z)
Discovering Multi-Agent Auto-Curricula in Two-Player Zero-Sum Games [31.97631243571394]
明示的な人間設計なしに更新ルールの発見を自動化するフレームワークであるLMACを導入する。意外なことに、人間のデザインがなくても、発見されたMARLアルゴリズムは競争力や性能が向上する。 LMAC は,例えば Kuhn Poker のトレーニングやPSRO の成績など,小型ゲームから大規模ゲームへの一般化が可能であることを示す。
論文参考訳（メタデータ） (2021-06-04T22:30:25Z)
Complex Momentum for Learning in Games [42.081050296353574]
我々は、微分可能なゲームにおいて学習する運動量を伴う勾配降下を複素数値運動量を持つように一般化する。我々は、複雑な値の運動量によってゲーム内の収束性が改善できることを実証する。我々はまた、CIFAR-10のより良いスコアにBigGANを訓練するために使用する複素値アダム変種への実用的な一般化を示す。
論文参考訳（メタデータ） (2021-02-16T19:55:27Z)
Fever Basketball: A Complex, Flexible, and Asynchronized Sports Game Environment for Multi-agent Reinforcement Learning [38.4742699455284]
バスケットボールの試合をエージェントが訓練する新しい強化学習環境であるFever Basketballゲームを紹介した。複数の文字、複数の位置、シングルエージェントとマルチエージェントのプレイヤー制御モードをサポートする複雑で困難な環境である。現実のバスケットボールの試合をより良くシミュレートするために、アクションの実行時間が異なるため、Fever Basketballは新しい非同期環境となる。
論文参考訳（メタデータ） (2020-12-06T07:51:59Z)
Multi-Agent Collaboration via Reward Attribution Decomposition [75.36911959491228]
本稿では,StarCraftのマルチエージェントチャレンジにおいて,最先端のパフォーマンスを実現するコラボレーション型Q-ラーニング(CollaQ)を提案する。 CollaQは様々なStarCraft属性マップで評価され、既存の最先端技術よりも優れていることを示す。
論文参考訳（メタデータ） (2020-10-16T17:42:11Z)
Model-Based Reinforcement Learning for Atari [89.3039240303797]
エージェントがモデルフリーの手法よりも少ないインタラクションでAtariゲームを解くことができることを示す。本実験は,エージェントと環境間の100kの相互作用の少ないデータ構造における,AtariゲームにおけるSimPLeの評価である。
論文参考訳（メタデータ） (2019-03-01T15:40:19Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。