論文の概要: Evolutionary and Coevolutionary Multi-Agent Design Choices and Dynamics
- arxiv url: http://arxiv.org/abs/2507.05534v1
- Date: Mon, 07 Jul 2025 23:14:51 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-07-09 16:34:37.446124
- Title: Evolutionary and Coevolutionary Multi-Agent Design Choices and Dynamics
- Title(参考訳): 進化的・共進化的多エージェント設計選択とダイナミクス
- Authors: Erik Hemberg, Eric Liu, Lucille Fuller, Stephen Moskal, Una-May O'Reilly,
- Abstract要約: エージェント学習は、一方が進化しない側と、他方が互いに共進化する側とを競うように訓練されたときに評価される。
コードライクなロジックでコントローラを表現できる文法を用いた文法進化アルゴリズムの我々のバージョンは、最高のチームパフォーマンスを達成することができる。
アルゴリズムと表現の全体にわたって、共進化は両面のパフォーマンス高や低を減少させ、一方、両面のゆらぎを誘発する。
- 参考スコア(独自算出の注目度): 4.180148451363464
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: We investigate two representation alternatives for the controllers of teams of cyber agents. We combine these controller representations with different evolutionary algorithms, one of which introduces a novel LLM-supported mutation operator. Using a cyber security scenario, we evaluate agent learning when one side is trained to compete against a side that does not evolve and when two sides coevolve with each other. This allows us to quantify the relative merits and tradeoffs of representation and algorithm combinations in terms of team performance. Our versions of grammatical evolution algorithms using grammars that allow a controller to be expressed in code-like logic can achieve the best team performance. The scenario also allows us to compare the performance impact and dynamics of coevolution versus evolution under different combinations. Across the algorithms and representations, we observe that coevolution reduces the performance highs and lows of both sides while it induces fluctuations on both sides. In contrast, when only one-side is optimized, performance peaks are higher and is more sustained than when both sides are optimized with coevolution.
- Abstract(参考訳): サイバーエージェントチームにおける2つの代替手段について検討する。
これらのコントローラ表現と異なる進化的アルゴリズムを組み合わせることで、新しいLSM支援突然変異演算子を導入する。
サイバーセキュリティシナリオを用いて、一方の側が進化しない側と、他方の側が互いに共進化する側とを競うように訓練された場合のエージェント学習を評価する。
これにより、チームパフォーマンスの観点から、表現とアルゴリズムの組み合わせの相対的なメリットとトレードオフを定量化できます。
コードライクなロジックでコントローラを表現できる文法を用いた文法進化アルゴリズムの我々のバージョンは、最高のチームパフォーマンスを達成することができる。
このシナリオでは、異なる組み合わせの下での共進化と進化のパフォーマンスへの影響とダイナミクスを比較することもできます。
アルゴリズムと表現の全体にわたって、共進化は両面のパフォーマンス高や低さを減少させ、一方、両面のゆらぎを誘発する。
対照的に、一方だけが最適化されている場合、性能ピークは高く、双方が共進化で最適化されている場合よりも持続性が高い。
関連論文リスト
- Dynamic Context-oriented Decomposition for Task-aware Low-rank Adaptation with Less Forgetting and Faster Convergence [131.41894248194995]
タスク認識方式でアダプタを初期化する新しい手法であるコンテキスト指向分解適応(CorDA)を提案する。
本手法は,タスク認識により,知識保存モード (KPM) と命令レビューモード (IPM) の2つのオプション適応モードを実現する。
論文 参考訳(メタデータ) (2025-06-16T07:55:14Z) - Some Optimizers are More Equal: Understanding the Role of Optimizers in Group Fairness [26.49261268883266]
提案アルゴリズムがディープニューラルネットワークにおけるグループフェアネスにどう影響するかについて検討する。
最適化の選択は、特に厳密な不均衡の下での公正な結果に実際に影響を及ぼすことを示す。
本研究は,公正な成果を促進するための重要なメカニズムとして,適応的更新の役割を強調した。
論文 参考訳(メタデータ) (2025-04-21T06:20:50Z) - Strategies for optimizing double-bracket quantum algorithms [0.050257374758179374]
ダブルブラケット進化の選択を最適化するための戦略を提案する。
また,CNOTやシングルキュービット回転ゲートに直接コンパイル可能な対角展開パラメトリゼーションも提案する。
論文 参考訳(メタデータ) (2024-08-14T10:07:54Z) - CompetEvo: Towards Morphological Evolution from Competition [60.69068909395984]
エージェントの設計と戦術を共進化させる競争進化(CompetEvo)を提案する。
その結果,エージェントがより適切な設計と戦略を進化させることができることがわかった。
論文 参考訳(メタデータ) (2024-05-28T15:53:02Z) - Evolution Transformer: In-Context Evolutionary Optimization [6.873777465945062]
本稿では、進化戦略のファミリーを柔軟に特徴付けることができる因果トランスフォーマーアーキテクチャである進化トランスフォーマーを紹介する。
進化的アルゴリズム蒸留(Evolutionary Algorithm Distillation)を用いてモデルの重み付けを訓練する。
進化変換器の動作特性を解析し,進化変換器を自己参照的に学習する手法を提案する。
論文 参考訳(メタデータ) (2024-03-05T14:04:13Z) - DARLEI: Deep Accelerated Reinforcement Learning with Evolutionary
Intelligence [77.78795329701367]
本稿では,進化アルゴリズムと並列化強化学習を組み合わせたフレームワークであるDARLEIを提案する。
我々はDARLEIの性能を様々な条件で特徴付け、進化形態の多様性に影響を与える要因を明らかにした。
今後DARLEIを拡張して、よりリッチな環境における多様な形態素間の相互作用を取り入れていきたいと考えています。
論文 参考訳(メタデータ) (2023-12-08T16:51:10Z) - Bidirectional Looking with A Novel Double Exponential Moving Average to
Adaptive and Non-adaptive Momentum Optimizers [109.52244418498974]
我々は,新しいtextscAdmeta(textbfADouble指数textbfMov averagtextbfE textbfAdaptiveおよび非適応運動量)フレームワークを提案する。
我々は、textscAdmetaR と textscAdmetaS の2つの実装を提供し、前者は RAdam を、後者は SGDM をベースとしています。
論文 参考訳(メタデータ) (2023-07-02T18:16:06Z) - Pareto Actor-Critic for Equilibrium Selection in Multi-Agent
Reinforcement Learning [18.20664209675016]
この研究は、競合しないマルチエージェントゲームにおける平衡選択に焦点を当てている。
Pareto Actor-Critic (Pareto-AC)は、すべてのエージェントのリターンを最大化するアクター批判アルゴリズムである。
論文 参考訳(メタデータ) (2022-09-28T18:14:34Z) - X-volution: On the unification of convolution and self-attention [52.80459687846842]
本稿では,畳み込み操作と自己注意操作の両方からなるマルチブランチ基本モジュールを提案する。
提案したX-進化は、非常に競争力のある視覚的理解の改善を実現する。
論文 参考訳(メタデータ) (2021-06-04T04:32:02Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。