Fugu-MT 論文翻訳(概要): Contextually Aware Intelligent Control Agents for Heterogeneous Swarms

論文の概要: Contextually Aware Intelligent Control Agents for Heterogeneous Swarms

arxiv url: http://arxiv.org/abs/2211.12560v1
Date: Tue, 22 Nov 2022 20:25:59 GMT
ステータス: 翻訳完了
システム内更新日: 2022-11-24 15:05:20.444073
Title: Contextually Aware Intelligent Control Agents for Heterogeneous Swarms
Title（参考訳）: 不均一群に対する文脈対応型知的制御エージェント
Authors: Adam Hepworth, Aya Hussein, Darryn Reid, Hussein Abbass
Abstract要約: Swarmシェパーディング研究における新たな課題は、効率的で効率的な人工知能アルゴリズムを設計することである。本研究では,コンテキスト認識型Swarm制御インテリジェントエージェントの設計手法を提案する。我々は同種群と異種群の両方で羊飼いが成功したことを実証した。
参考スコア（独自算出の注目度）: 0.0
License: http://creativecommons.org/licenses/by-sa/4.0/
Abstract: An emerging challenge in swarm shepherding research is to design effective and efficient artificial intelligence algorithms that maintain a low-computational ceiling while increasing the swarm's abilities to operate in diverse contexts. We propose a methodology to design a context-aware swarm-control intelligent agent. The intelligent control agent (shepherd) first uses swarm metrics to recognise the type of swarm it interacts with to then select a suitable parameterisation from its behavioural library for that particular swarm type. The design principle of our methodology is to increase the situation awareness (i.e. information contents) of the control agent without sacrificing the low-computational cost necessary for efficient swarm control. We demonstrate successful shepherding in both homogeneous and heterogeneous swarms.
Abstract（参考訳）: Swarmシェパーディング研究における新たな課題は、様々な状況下で運用するSwarmの能力を高めながら、低計算の天井を維持する効率的で効率的な人工知能アルゴリズムを設計することである。本稿では,コンテキスト認識型Swarm制御インテリジェントエージェントの設計手法を提案する。インテリジェントコントロールエージェント(shepherd)は、最初にswarmメトリクスを使用して、対話するswarmのタイプを認識し、その特定のswarmタイプに対する振る舞いライブラリから適切なパラメーターを選択する。本手法の設計原理は,効率的なSwarm制御に必要な低計算コストを犠牲にすることなく,制御エージェントの状況意識(情報内容)を高めることである。同種群と異種群の両方でシェパーディングに成功した。

関連論文リスト

AgentArk: Distilling Multi-Agent Intelligence into a Single LLM Agent [57.10083973844841]
AgentArkは、マルチエージェントダイナミクスを単一のモデルの重みに蒸留する新しいフレームワークである。各種モデル,タスク,スケーリング,シナリオの3つの階層的蒸留戦略について検討する。シミュレーションからトレーニングへ計算の負担をシフトさせることで、蒸留されたモデルは、複数のエージェントの強い推論と自己補正性能を示しながら、一つのエージェントの効率を保ちます。
論文参考訳（メタデータ） (2026-02-03T19:18:28Z)
Aerial Secure Collaborative Communications under Eavesdropper Collusion in Low-altitude Economy: A Generative Swarm Intelligent Approach [84.20358039333756]
本研究では,AAV群に分散コラボレーティブビームフォーミング(DCB)を導入し,対応する信号分布を制御して盗聴者の共謀を処理した。両方向の秘密保持能力と最大サイドローブレベルを最小化して、未知の盗聴者からの情報漏洩を回避する。本稿では,より少ないオーバーヘッドで問題を解決するために,新しいジェネレーティブ・スウォーム・インテリジェンス(GenSI)フレームワークを提案する。
論文参考訳（メタデータ） (2025-03-02T04:02:58Z)
AgentPoison: Red-teaming LLM Agents via Poisoning Memory or Knowledge Bases [73.04652687616286]
本稿では,RAG とRAG をベースとした LLM エージェントを標的とした最初のバックドア攻撃である AgentPoison を提案する。従来のバックドア攻撃とは異なり、AgentPoisonは追加のモデルトレーニングや微調整を必要としない。エージェントごとに、AgentPoisonは平均攻撃成功率を80%以上達成し、良質なパフォーマンスに最小限の影響を与える。
論文参考訳（メタデータ） (2024-07-17T17:59:47Z)
Surprise-Adaptive Intrinsic Motivation for Unsupervised Reinforcement Learning [6.937243101289336]
教師なし強化学習(RL)のエントロピー最小化とエントロピー最大化は異なる環境において有効であることが示されている。マルチアームバンディット問題としての選択をフレーミングすることで、エントロピー条件に応じて、その目的をオンラインで適応できるエージェントを提案する。我々は,このようなエージェントがエントロピーを制御し,高エントロピーと低エントロピーの両体制において創発的な行動を示すことを実証した。
論文参考訳（メタデータ） (2024-05-27T14:58:24Z)
Investigate-Consolidate-Exploit: A General Strategy for Inter-Task Agent Self-Evolution [92.84441068115517]
Investigate-Consolidate-Exploit(ICE)は、AIエージェントの適応性と柔軟性を高めるための新しい戦略である。 ICEは、真の自己進化のためのタスク間の知識の伝達を促進する。 XAgentフレームワークに関する我々の実験は、ICEの有効性を示し、API呼び出しを最大80%削減する。
論文参考訳（メタデータ） (2024-01-25T07:47:49Z)
REBEL: Reward Regularization-Based Approach for Robotic Reinforcement Learning from Human Feedback [61.54791065013767]
報酬関数と人間の嗜好の相違は、現実世界で破滅的な結果をもたらす可能性がある。近年の手法は、人間の嗜好から報酬関数を学習することで、不適応を緩和することを目的としている。本稿では,ロボットRLHFフレームワークにおける報酬正規化の新たな概念を提案する。
論文参考訳（メタデータ） (2023-12-22T04:56:37Z)
Leveraging Human Feedback to Evolve and Discover Novel Emergent Behaviors in Robot Swarms [14.404339094377319]
我々は、人間の入力を活用して、特定のマルチエージェントシステムから現れる可能性のある集団行動の分類を自動で発見することを目指している。提案手法は,Swarm集団行動に対する類似性空間を学習することにより,ユーザの嗜好に適応する。我々は,2つのロボット能力モデルを用いたシミュレーションにおいて,本手法が従来よりも豊かな創発的行動の集合を常に発見できることを検証した。
論文参考訳（メタデータ） (2023-04-25T15:18:06Z)
Active Predicting Coding: Brain-Inspired Reinforcement Learning for Sparse Reward Robotic Control Problems [79.07468367923619]
ニューラルジェネレーティブ・コーディング(NGC)の神経認知計算フレームワークによるロボット制御へのバックプロパゲーションフリーアプローチを提案する。我々は、スパース報酬から動的オンライン学習を容易にする強力な予測符号化/処理回路から完全に構築されたエージェントを設計する。提案するActPCエージェントは,スパース(外部)報酬信号に対して良好に動作し,複数の強力なバックプロップベースのRLアプローチと競合し,性能が優れていることを示す。
論文参考訳（メタデータ） (2022-09-19T16:49:32Z)
Scalable Task-Driven Robotic Swarm Control via Collision Avoidance and Learning Mean-Field Control [23.494528616672024]
我々は、最先端平均場制御技術を用いて、多くのエージェントSwarm制御を分散の古典的な単一エージェント制御に変換する。そこで我々は,衝突回避と平均場制御の学習を,知的ロボット群動作を牽引的に設計するための統一的な枠組みに統合する。
論文参考訳（メタデータ） (2022-09-15T16:15:04Z)
Understandable Controller Extraction from Video Observations of Swarms [0.0]
スワムの挙動はエージェントと環境の局所的な相互作用から生じ、しばしば単純な規則として符号化される。ビデオデモから理解可能なSwarmコントローラを自動的に抽出する手法を開発した。
論文参考訳（メタデータ） (2022-09-02T15:28:28Z)
Collective motion emerging from evolving swarm controllers in different environments using gradient following task [2.7402733069181]
センサと通信能力に制限のあるロボットが環境特性の勾配に従わなければならないという課題を考察する。我々は、ディファレンシャル進化を用いて、Thymio IIロボットのシミュレーションのためのニューラルネットワークコントローラを進化させる。進化したロボットコントローラは、タスクを解決したSwarm動作を誘導する。
論文参考訳（メタデータ） (2022-03-22T10:08:50Z)
Backprop-Free Reinforcement Learning with Active Neural Generative Coding [84.11376568625353]
動的環境におけるエラー(バックプロップ)のバックプロパゲーションを伴わない行動駆動型生成モデルの学習のための計算フレームワークを提案する。我々は、まばらな報酬でも機能するインテリジェントエージェントを開発し、推論として計画の認知理論からインスピレーションを得ている。我々のエージェントの堅牢な性能は、神経推論と学習のためのバックプロップフリーアプローチがゴール指向の行動を促進するという有望な証拠を提供する。
論文参考訳（メタデータ） (2021-07-10T19:02:27Z)
Tesseract: Tensorised Actors for Multi-Agent Reinforcement Learning [92.05556163518999]
MARLは、コミュニケーションと可観測性に様々な制約を課すことによって、問題を悪化させる。値ベースの手法では、最適な値関数を正確に表現することが課題となる。政策勾配法では、批判者の訓練を困難にし、遅れる批判者の問題を悪化させる。学習理論の観点からは、関連するアクション値関数を正確に表現することで、両方の問題に対処できることが示される。
論文参考訳（メタデータ） (2021-05-31T23:08:05Z)
Robust Deep Reinforcement Learning through Adversarial Loss [74.20501663956604]
近年の研究では、深層強化学習剤は、エージェントの入力に対する小さな逆方向の摂動に弱いことが示されている。敵攻撃に対する堅牢性を向上した強化学習エージェントを訓練するための原則的フレームワークであるRADIAL-RLを提案する。
論文参考訳（メタデータ） (2020-08-05T07:49:42Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。