論文の概要: Lifelong Evolution of Swarms
- arxiv url: http://arxiv.org/abs/2503.17763v1
- Date: Sat, 22 Mar 2025 13:08:31 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-03-25 14:39:49.297238
- Title: Lifelong Evolution of Swarms
- Title(参考訳): 群れの生涯進化
- Authors: Lorenzo Leuzzi, Simon Jones, Sabine Hauert, Davide Bacciu, Andrea Cossu,
- Abstract要約: 以前の知識を忘れずにタスクの変更に適応することは、インテリジェントシステムにとって重要なスキルである。
本研究では,Swarmコントローラの個体群が動的環境下で進化する,生涯にわたるSwarmの進化的枠組みを紹介する。
人口は過去の課題に関する情報を本質的に保存しており、それを再利用して適応を促進し、忘れを和らげることができる。
- 参考スコア(独自算出の注目度): 14.759766700116723
- License:
- Abstract: Adapting to task changes without forgetting previous knowledge is a key skill for intelligent systems, and a crucial aspect of lifelong learning. Swarm controllers, however, are typically designed for specific tasks, lacking the ability to retain knowledge across changing tasks. Lifelong learning, on the other hand, focuses on individual agents with limited insights into the emergent abilities of a collective like a swarm. To address this gap, we introduce a lifelong evolutionary framework for swarms, where a population of swarm controllers is evolved in a dynamic environment that incrementally presents novel tasks. This requires evolution to find controllers that quickly adapt to new tasks while retaining knowledge of previous ones, as they may reappear in the future. We discover that the population inherently preserves information about previous tasks, and it can reuse it to foster adaptation and mitigate forgetting. In contrast, the top-performing individual for a given task catastrophically forgets previous tasks. To mitigate this phenomenon, we design a regularization process for the evolutionary algorithm, reducing forgetting in top-performing individuals. Evolving swarms in a lifelong fashion raises fundamental questions on the current state of deep lifelong learning and on the robustness of swarm controllers in dynamic environments.
- Abstract(参考訳): 以前の知識を忘れずにタスクの変更に適応することは、インテリジェントシステムにとって重要なスキルであり、生涯学習の重要な側面である。
しかし、Swarmコントローラは一般的に特定のタスクのために設計されており、タスクの変更に関する知識を保持する能力が欠如している。
一方、生涯学習は、群れのような集団の創発的能力についての限られた洞察を持つ個々のエージェントに焦点を当てている。
このギャップに対処するために、スワムコントローラの個体群が新しいタスクを漸進的に提示する動的環境の中で進化する、スワムの生涯進化的枠組みを導入する。
これは、将来再び現れる可能性のある、以前のタスクの知識を維持しながら、新しいタスクに迅速に適応するコントローラを見つけるための進化を必要とする。
我々は,従来の課題に関する情報を自然に保存し,それを再利用して適応を促進し,忘れを和らげることを発見した。
対照的に、与えられたタスクのトップパフォーマンスの個人は、以前のタスクを破滅的に忘れる。
この現象を緩和するために、進化アルゴリズムの正規化プロセスを設計し、トップパフォーマンスの個人の忘れを少なくする。
生涯にわたって群れを進化させることは、深層学習の現状と動的環境における群れ制御の堅牢性に関する根本的な疑問を提起する。
関連論文リスト
- Memento No More: Coaching AI Agents to Master Multiple Tasks via Hints Internalization [56.674356045200696]
本稿では,複雑なメモシステムや事前の高品質な実演データを必要としない,複数のタスクに対する知識とスキルを取り入れたAIエージェントの訓練手法を提案する。
このアプローチでは,エージェントが新たな経験を収集し,ヒントの形で人間から補正フィードバックを受け取り,このフィードバックを重みに組み込む,反復的なプロセスを採用している。
Llama-3 をベースとしたエージェントに実装することで,提案手法の有効性を実証し,数ラウンドのフィードバックの後,高度なモデル GPT-4o と DeepSeek-V3 をタスクセットで向上させる。
論文 参考訳(メタデータ) (2025-02-03T17:45:46Z) - Flexible task abstractions emerge in linear networks with fast and bounded units [47.11054206483159]
重みとゲートが勾配降下によって協調的に最適化される線形ゲートネットワークを解析する。
その結果,タスクの抽象化はタスクとサブタスクの合成による一般化を支援することがわかった。
我々の研究は、シナプス的および神経的ゲーティングにおける関節勾配降下から生じる動物の認知的柔軟性の理論を提供する。
論文 参考訳(メタデータ) (2024-11-06T11:24:02Z) - Continual Diffuser (CoD): Mastering Continual Offline Reinforcement Learning with Experience Rehearsal [54.93261535899478]
強化学習のロボット制御のような現実世界の応用では、タスクが変化し、新しいタスクが順次発生する。
この状況は、タスクの変更に適応し、獲得した知識を保持するエージェントを訓練する上で、可塑性-安定トレードオフという新たな課題を生じさせる。
本研究では,連続拡散器(Continuous diffuser,CoD)と呼ばれるリハーサルに基づく連続拡散モデルを提案する。
論文 参考訳(メタデータ) (2024-09-04T08:21:47Z) - The Empirical Impact of Forgetting and Transfer in Continual Visual Odometry [4.704582238028159]
本研究は, ニューラルネットワークにおける破滅的記憶の影響と知識伝達の有効性を, 具体的環境下で連続的に学習したニューラルネットワークを用いて検討した。
環境間の高い伝達性を有する初期満足度性能を観察し,その後に特殊化相を呈する。
これらの知見は、生涯のロボット工学における適応と記憶保持のバランスをとることのオープンな課題を強調している。
論文 参考訳(メタデータ) (2024-06-03T21:32:50Z) - Lifelong Sequence Generation with Dynamic Module Expansion and
Adaptation [39.886149621730915]
寿命シーケンス生成(LSG)は、連続した世代タスクに基づいてモデルを継続的に訓練し、常に新しい世代パターンを学ぶことを目的としている。
人間の学習パラダイムにヒントを得て,動的モジュール拡張適応(DMEA)を提案する。
DMEAにより、タスク相関に基づいて新しい知識を取得するためのアーキテクチャを動的に決定し、最も類似したタスクを選択して、新しいタスクへの適応を容易にすることができる。
論文 参考訳(メタデータ) (2023-10-15T16:51:11Z) - Towards Robust Continual Learning with Bayesian Adaptive Moment Regularization [51.34904967046097]
継続的な学習は、モデルが以前に学習した情報を忘れてしまう破滅的な忘れ込みの課題を克服しようとする。
本稿では,パラメータ成長の制約を緩和し,破滅的な忘れを減らし,新しい事前手法を提案する。
以上の結果から, BAdamは, 単頭クラスインクリメンタル実験に挑戦する先行手法に対して, 最先端の性能を達成できることが示唆された。
論文 参考訳(メタデータ) (2023-09-15T17:10:51Z) - When to be critical? Performance and evolvability in different regimes
of neural Ising agents [18.536813548129878]
臨界状態に近い状態での操作は、自然、人工的およびそれらの進化システムにとって有益である、という仮説は長年にわたって仮説化されてきた。
我々はこの仮説を、ニューラルネットワークによって制御される進化的捕食エージェントのシステムでテストする。
驚くべきことに、ソリューションを発見するすべての人口は、亜臨界状態へと進化する。
論文 参考訳(メタデータ) (2023-03-28T17:57:57Z) - Learning Options via Compression [62.55893046218824]
そこで本研究では,スキル記述長に対するペナルティと,最大限の目標を組み合わさった新たな目的を提案する。
我々の目的は、最大化可能性のみから学んだスキルと比較して、下流のタスクを少ないサンプルで解くスキルを学ぶことである。
論文 参考訳(メタデータ) (2022-12-08T22:34:59Z) - Collective motion emerging from evolving swarm controllers in different
environments using gradient following task [2.7402733069181]
センサと通信能力に制限のあるロボットが環境特性の勾配に従わなければならないという課題を考察する。
我々は、ディファレンシャル進化を用いて、Thymio IIロボットのシミュレーションのためのニューラルネットワークコントローラを進化させる。
進化したロボットコントローラは、タスクを解決したSwarm動作を誘導する。
論文 参考訳(メタデータ) (2022-03-22T10:08:50Z) - Hierarchical Skills for Efficient Exploration [70.62309286348057]
強化学習において、事前訓練された低レベルスキルは、探索を大幅に促進する可能性がある。
下流タスクの以前の知識は、スキルデザインにおける一般性(きめ細かい制御)と特異性(より高速な学習)の適切なバランスをとるために必要である。
教師なしの方法で様々な複雑さのスキルを習得する階層的スキル学習フレームワークを提案する。
論文 参考訳(メタデータ) (2021-10-20T22:29:32Z) - Transforming task representations to perform novel tasks [12.008469282323492]
知性の重要な側面は、直接の経験(ゼロショット)なしで新しいタスクに適応できる能力である。
本稿では,従来のタスクとの関係に基づいて,新しいタスクに適応するための一般的な計算フレームワークを提案する。
論文 参考訳(メタデータ) (2020-05-08T23:41:57Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。