論文の概要: Contextually Aware Intelligent Control Agents for Heterogeneous Swarms
- arxiv url: http://arxiv.org/abs/2211.12560v1
- Date: Tue, 22 Nov 2022 20:25:59 GMT
- ステータス: 処理完了
- システム内更新日: 2022-11-24 15:05:20.444073
- Title: Contextually Aware Intelligent Control Agents for Heterogeneous Swarms
- Title(参考訳): 不均一群に対する文脈対応型知的制御エージェント
- Authors: Adam Hepworth, Aya Hussein, Darryn Reid, Hussein Abbass
- Abstract要約: Swarmシェパーディング研究における新たな課題は、効率的で効率的な人工知能アルゴリズムを設計することである。
本研究では,コンテキスト認識型Swarm制御インテリジェントエージェントの設計手法を提案する。
我々は同種群と異種群の両方で羊飼いが成功したことを実証した。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by-sa/4.0/
- Abstract: An emerging challenge in swarm shepherding research is to design effective
and efficient artificial intelligence algorithms that maintain a
low-computational ceiling while increasing the swarm's abilities to operate in
diverse contexts. We propose a methodology to design a context-aware
swarm-control intelligent agent. The intelligent control agent (shepherd) first
uses swarm metrics to recognise the type of swarm it interacts with to then
select a suitable parameterisation from its behavioural library for that
particular swarm type. The design principle of our methodology is to increase
the situation awareness (i.e. information contents) of the control agent
without sacrificing the low-computational cost necessary for efficient swarm
control. We demonstrate successful shepherding in both homogeneous and
heterogeneous swarms.
- Abstract(参考訳): Swarmシェパーディング研究における新たな課題は、様々な状況下で運用するSwarmの能力を高めながら、低計算の天井を維持する効率的で効率的な人工知能アルゴリズムを設計することである。
本稿では,コンテキスト認識型Swarm制御インテリジェントエージェントの設計手法を提案する。
インテリジェントコントロールエージェント(shepherd)は、最初にswarmメトリクスを使用して、対話するswarmのタイプを認識し、その特定のswarmタイプに対する振る舞いライブラリから適切なパラメーターを選択する。
本手法の設計原理は,効率的なSwarm制御に必要な低計算コストを犠牲にすることなく,制御エージェントの状況意識(情報内容)を高めることである。
同種群と異種群の両方でシェパーディングに成功した。
関連論文リスト
- AgentPoison: Red-teaming LLM Agents via Poisoning Memory or Knowledge Bases [73.04652687616286]
本稿では,RAG とRAG をベースとした LLM エージェントを標的とした最初のバックドア攻撃である AgentPoison を提案する。
従来のバックドア攻撃とは異なり、AgentPoisonは追加のモデルトレーニングや微調整を必要としない。
エージェントごとに、AgentPoisonは平均攻撃成功率を80%以上達成し、良質なパフォーマンスに最小限の影響を与える。
論文 参考訳(メタデータ) (2024-07-17T17:59:47Z) - Surprise-Adaptive Intrinsic Motivation for Unsupervised Reinforcement Learning [6.937243101289336]
教師なし強化学習(RL)のエントロピー最小化とエントロピー最大化は異なる環境において有効であることが示されている。
マルチアームバンディット問題としての選択をフレーミングすることで、エントロピー条件に応じて、その目的をオンラインで適応できるエージェントを提案する。
我々は,このようなエージェントがエントロピーを制御し,高エントロピーと低エントロピーの両体制において創発的な行動を示すことを実証した。
論文 参考訳(メタデータ) (2024-05-27T14:58:24Z) - Investigate-Consolidate-Exploit: A General Strategy for Inter-Task Agent
Self-Evolution [92.84441068115517]
Investigate-Consolidate-Exploit(ICE)は、AIエージェントの適応性と柔軟性を高めるための新しい戦略である。
ICEは、真の自己進化のためのタスク間の知識の伝達を促進する。
XAgentフレームワークに関する我々の実験は、ICEの有効性を示し、API呼び出しを最大80%削減する。
論文 参考訳(メタデータ) (2024-01-25T07:47:49Z) - REBEL: Reward Regularization-Based Approach for Robotic Reinforcement Learning from Human Feedback [61.54791065013767]
報酬関数と人間の嗜好の相違は、現実世界で破滅的な結果をもたらす可能性がある。
近年の手法は、人間の嗜好から報酬関数を学習することで、不適応を緩和することを目的としている。
本稿では,ロボットRLHFフレームワークにおける報酬正規化の新たな概念を提案する。
論文 参考訳(メタデータ) (2023-12-22T04:56:37Z) - Leveraging Human Feedback to Evolve and Discover Novel Emergent
Behaviors in Robot Swarms [14.404339094377319]
我々は、人間の入力を活用して、特定のマルチエージェントシステムから現れる可能性のある集団行動の分類を自動で発見することを目指している。
提案手法は,Swarm集団行動に対する類似性空間を学習することにより,ユーザの嗜好に適応する。
我々は,2つのロボット能力モデルを用いたシミュレーションにおいて,本手法が従来よりも豊かな創発的行動の集合を常に発見できることを検証した。
論文 参考訳(メタデータ) (2023-04-25T15:18:06Z) - Scalable Task-Driven Robotic Swarm Control via Collision Avoidance and
Learning Mean-Field Control [23.494528616672024]
我々は、最先端平均場制御技術を用いて、多くのエージェントSwarm制御を分散の古典的な単一エージェント制御に変換する。
そこで我々は,衝突回避と平均場制御の学習を,知的ロボット群動作を牽引的に設計するための統一的な枠組みに統合する。
論文 参考訳(メタデータ) (2022-09-15T16:15:04Z) - Understandable Controller Extraction from Video Observations of Swarms [0.0]
スワムの挙動はエージェントと環境の局所的な相互作用から生じ、しばしば単純な規則として符号化される。
ビデオデモから理解可能なSwarmコントローラを自動的に抽出する手法を開発した。
論文 参考訳(メタデータ) (2022-09-02T15:28:28Z) - Collective motion emerging from evolving swarm controllers in different
environments using gradient following task [2.7402733069181]
センサと通信能力に制限のあるロボットが環境特性の勾配に従わなければならないという課題を考察する。
我々は、ディファレンシャル進化を用いて、Thymio IIロボットのシミュレーションのためのニューラルネットワークコントローラを進化させる。
進化したロボットコントローラは、タスクを解決したSwarm動作を誘導する。
論文 参考訳(メタデータ) (2022-03-22T10:08:50Z) - Backprop-Free Reinforcement Learning with Active Neural Generative
Coding [84.11376568625353]
動的環境におけるエラー(バックプロップ)のバックプロパゲーションを伴わない行動駆動型生成モデルの学習のための計算フレームワークを提案する。
我々は、まばらな報酬でも機能するインテリジェントエージェントを開発し、推論として計画の認知理論からインスピレーションを得ている。
我々のエージェントの堅牢な性能は、神経推論と学習のためのバックプロップフリーアプローチがゴール指向の行動を促進するという有望な証拠を提供する。
論文 参考訳(メタデータ) (2021-07-10T19:02:27Z) - Tesseract: Tensorised Actors for Multi-Agent Reinforcement Learning [92.05556163518999]
MARLは、コミュニケーションと可観測性に様々な制約を課すことによって、問題を悪化させる。
値ベースの手法では、最適な値関数を正確に表現することが課題となる。
政策勾配法では、批判者の訓練を困難にし、遅れる批判者の問題を悪化させる。
学習理論の観点からは、関連するアクション値関数を正確に表現することで、両方の問題に対処できることが示される。
論文 参考訳(メタデータ) (2021-05-31T23:08:05Z) - Robust Deep Reinforcement Learning through Adversarial Loss [74.20501663956604]
近年の研究では、深層強化学習剤は、エージェントの入力に対する小さな逆方向の摂動に弱いことが示されている。
敵攻撃に対する堅牢性を向上した強化学習エージェントを訓練するための原則的フレームワークであるRADIAL-RLを提案する。
論文 参考訳(メタデータ) (2020-08-05T07:49:42Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。