論文の概要: Contextually Aware Intelligent Control Agents for Heterogeneous Swarms
- arxiv url: http://arxiv.org/abs/2211.12560v1
- Date: Tue, 22 Nov 2022 20:25:59 GMT
- ステータス: 処理完了
- システム内更新日: 2022-11-24 15:05:20.444073
- Title: Contextually Aware Intelligent Control Agents for Heterogeneous Swarms
- Title(参考訳): 不均一群に対する文脈対応型知的制御エージェント
- Authors: Adam Hepworth, Aya Hussein, Darryn Reid, Hussein Abbass
- Abstract要約: Swarmシェパーディング研究における新たな課題は、効率的で効率的な人工知能アルゴリズムを設計することである。
本研究では,コンテキスト認識型Swarm制御インテリジェントエージェントの設計手法を提案する。
我々は同種群と異種群の両方で羊飼いが成功したことを実証した。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by-sa/4.0/
- Abstract: An emerging challenge in swarm shepherding research is to design effective
and efficient artificial intelligence algorithms that maintain a
low-computational ceiling while increasing the swarm's abilities to operate in
diverse contexts. We propose a methodology to design a context-aware
swarm-control intelligent agent. The intelligent control agent (shepherd) first
uses swarm metrics to recognise the type of swarm it interacts with to then
select a suitable parameterisation from its behavioural library for that
particular swarm type. The design principle of our methodology is to increase
the situation awareness (i.e. information contents) of the control agent
without sacrificing the low-computational cost necessary for efficient swarm
control. We demonstrate successful shepherding in both homogeneous and
heterogeneous swarms.
- Abstract(参考訳): Swarmシェパーディング研究における新たな課題は、様々な状況下で運用するSwarmの能力を高めながら、低計算の天井を維持する効率的で効率的な人工知能アルゴリズムを設計することである。
本稿では,コンテキスト認識型Swarm制御インテリジェントエージェントの設計手法を提案する。
インテリジェントコントロールエージェント(shepherd)は、最初にswarmメトリクスを使用して、対話するswarmのタイプを認識し、その特定のswarmタイプに対する振る舞いライブラリから適切なパラメーターを選択する。
本手法の設計原理は,効率的なSwarm制御に必要な低計算コストを犠牲にすることなく,制御エージェントの状況意識(情報内容)を高めることである。
同種群と異種群の両方でシェパーディングに成功した。
関連論文リスト
- Investigate-Consolidate-Exploit: A General Strategy for Inter-Task Agent
Self-Evolution [92.84441068115517]
Investigate-Consolidate-Exploit(ICE)は、AIエージェントの適応性と柔軟性を高めるための新しい戦略である。
ICEは、真の自己進化のためのタスク間の知識の伝達を促進する。
XAgentフレームワークに関する我々の実験は、ICEの有効性を示し、API呼び出しを最大80%削減する。
論文 参考訳(メタデータ) (2024-01-25T07:47:49Z) - Pure Exploration under Mediators' Feedback [63.56002444692792]
マルチアームバンディット(Multi-armed bandits)は、各インタラクションステップにおいて、学習者が腕を選択し、報酬を観察する、シーケンシャルな意思決定フレームワークである。
本稿では,学習者が仲介者の集合にアクセスできるシナリオについて考察する。
本稿では,学習者には仲介者の方針が知られていると仮定して,最適な腕を発見するための逐次的意思決定戦略を提案する。
論文 参考訳(メタデータ) (2023-08-29T18:18:21Z) - Leveraging Human Feedback to Evolve and Discover Novel Emergent
Behaviors in Robot Swarms [14.404339094377319]
我々は、人間の入力を活用して、特定のマルチエージェントシステムから現れる可能性のある集団行動の分類を自動で発見することを目指している。
提案手法は,Swarm集団行動に対する類似性空間を学習することにより,ユーザの嗜好に適応する。
我々は,2つのロボット能力モデルを用いたシミュレーションにおいて,本手法が従来よりも豊かな創発的行動の集合を常に発見できることを検証した。
論文 参考訳(メタデータ) (2023-04-25T15:18:06Z) - A Scalable Reinforcement Learning Approach for Attack Allocation in
Swarm to Swarm Engagement Problems [0.0]
本稿では,大規模なSwarmの密度を制御し,敵のSwarm攻撃に対処する強化学習フレームワークを提案する。
我々の主な貢献は、マルコフ決定プロセスとして、スワムエンゲージメント問題に対するスワムの定式化である。
開発したフレームワークは,大規模エンゲージメントシナリオを多種多様なシナリオで効率的に処理できることを示す。
論文 参考訳(メタデータ) (2022-10-15T15:36:21Z) - Active Predicting Coding: Brain-Inspired Reinforcement Learning for
Sparse Reward Robotic Control Problems [79.07468367923619]
ニューラルジェネレーティブ・コーディング(NGC)の神経認知計算フレームワークによるロボット制御へのバックプロパゲーションフリーアプローチを提案する。
我々は、スパース報酬から動的オンライン学習を容易にする強力な予測符号化/処理回路から完全に構築されたエージェントを設計する。
提案するActPCエージェントは,スパース(外部)報酬信号に対して良好に動作し,複数の強力なバックプロップベースのRLアプローチと競合し,性能が優れていることを示す。
論文 参考訳(メタデータ) (2022-09-19T16:49:32Z) - Scalable Task-Driven Robotic Swarm Control via Collision Avoidance and
Learning Mean-Field Control [23.494528616672024]
我々は、最先端平均場制御技術を用いて、多くのエージェントSwarm制御を分散の古典的な単一エージェント制御に変換する。
そこで我々は,衝突回避と平均場制御の学習を,知的ロボット群動作を牽引的に設計するための統一的な枠組みに統合する。
論文 参考訳(メタデータ) (2022-09-15T16:15:04Z) - Understandable Controller Extraction from Video Observations of Swarms [0.0]
スワムの挙動はエージェントと環境の局所的な相互作用から生じ、しばしば単純な規則として符号化される。
ビデオデモから理解可能なSwarmコントローラを自動的に抽出する手法を開発した。
論文 参考訳(メタデータ) (2022-09-02T15:28:28Z) - Collective motion emerging from evolving swarm controllers in different
environments using gradient following task [2.7402733069181]
センサと通信能力に制限のあるロボットが環境特性の勾配に従わなければならないという課題を考察する。
我々は、ディファレンシャル進化を用いて、Thymio IIロボットのシミュレーションのためのニューラルネットワークコントローラを進化させる。
進化したロボットコントローラは、タスクを解決したSwarm動作を誘導する。
論文 参考訳(メタデータ) (2022-03-22T10:08:50Z) - Backprop-Free Reinforcement Learning with Active Neural Generative
Coding [84.11376568625353]
動的環境におけるエラー(バックプロップ)のバックプロパゲーションを伴わない行動駆動型生成モデルの学習のための計算フレームワークを提案する。
我々は、まばらな報酬でも機能するインテリジェントエージェントを開発し、推論として計画の認知理論からインスピレーションを得ている。
我々のエージェントの堅牢な性能は、神経推論と学習のためのバックプロップフリーアプローチがゴール指向の行動を促進するという有望な証拠を提供する。
論文 参考訳(メタデータ) (2021-07-10T19:02:27Z) - Tesseract: Tensorised Actors for Multi-Agent Reinforcement Learning [92.05556163518999]
MARLは、コミュニケーションと可観測性に様々な制約を課すことによって、問題を悪化させる。
値ベースの手法では、最適な値関数を正確に表現することが課題となる。
政策勾配法では、批判者の訓練を困難にし、遅れる批判者の問題を悪化させる。
学習理論の観点からは、関連するアクション値関数を正確に表現することで、両方の問題に対処できることが示される。
論文 参考訳(メタデータ) (2021-05-31T23:08:05Z) - Robust Deep Reinforcement Learning through Adversarial Loss [74.20501663956604]
近年の研究では、深層強化学習剤は、エージェントの入力に対する小さな逆方向の摂動に弱いことが示されている。
敵攻撃に対する堅牢性を向上した強化学習エージェントを訓練するための原則的フレームワークであるRADIAL-RLを提案する。
論文 参考訳(メタデータ) (2020-08-05T07:49:42Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。