論文の概要: Resilient robot teams: a review integrating decentralised control,
change-detection, and learning
- arxiv url: http://arxiv.org/abs/2204.10063v1
- Date: Thu, 21 Apr 2022 12:51:27 GMT
- ステータス: 処理完了
- システム内更新日: 2022-04-22 14:27:04.926007
- Title: Resilient robot teams: a review integrating decentralised control,
change-detection, and learning
- Title(参考訳): レジリエントなロボットチーム:分散制御、変化検出、学習を統合するレビュー
- Authors: David M. Bossens, Sarvapali Ramchurn, Danesh Tarapore
- Abstract要約: 本稿では、レジリエントなロボットチームにおける分散制御、変化検出、学習の機会と課題についてレビューする。
最近の知見:外因性断層検出法は, 回復液を用いた総合的検出や特定診断を行うことができる。
認知-行動-コミュニケーションループ、マルチエージェント強化学習、具体的進化、オンライン適応によるオフライン進化、明示的なタスク割り当て、スワムロボティクスにおけるスティグマーギーの学習において、分散制御のためのレジリエントな方法が開発されている。
- 参考スコア(独自算出の注目度): 10.312968200748116
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Purpose of review: This paper reviews opportunities and challenges for
decentralised control, change-detection, and learning in the context of
resilient robot teams.
Recent findings: Exogenous fault detection methods can provide a generic
detection or a specific diagnosis with a recovery solution. Robot teams can
perform active and distributed sensing for detecting changes in the
environment, including identifying and tracking dynamic anomalies, as well as
collaboratively mapping dynamic environments. Resilient methods for
decentralised control have been developed in learning
perception-action-communication loops, multi-agent reinforcement learning,
embodied evolution, offline evolution with online adaptation, explicit task
allocation, and stigmergy in swarm robotics.
Summary: Remaining challenges for resilient robot teams are integrating
change-detection and trial-and-error learning methods, obtaining reliable
performance evaluations under constrained evaluation time, improving the safety
of resilient robot teams, theoretical results demonstrating rapid adaptation to
given environmental perturbations, and designing realistic and compelling case
studies.
- Abstract(参考訳): レビューの目的: 本論文は、レジリエントなロボットチームにおける分散制御、変化検出、学習の機会と課題をレビューする。
最近の知見:外因性断層検出法は,回復液を用いた総合的検出や特定診断を行うことができる。
ロボットチームは、動的異常の特定や追跡、動的環境の協調マッピングなど、環境の変化を検出するためのアクティブで分散的なセンシングを実行することができる。
分散制御のためのレジリエントな手法は、知覚-行動-コミュニケーションループの学習、マルチエージェント強化学習、具体化進化、オンライン適応によるオフライン進化、明示的なタスク割り当て、swarm roboticsにおけるスティグマジーにおいて開発された。
まとめ: レジリエントなロボットチームにとっての課題は、変更検出と試行錯誤学習の手法の統合、制約された評価時間下での信頼性の高いパフォーマンス評価の取得、レジリエントなロボットチームの安全性の向上、与えられた環境摂動への迅速な適応を示す理論的結果、現実的で説得力のあるケーススタディを設計することである。
関連論文リスト
- Cooperative Resilience in Artificial Intelligence Multiagent Systems [2.0608564715600273]
本稿では, 協調レジリエンスの明確な定義とその定量化手法を提案する。
その結果は、集団システムが破壊に直面してどのように準備し、抵抗し、回復し、幸福を維持し、変革するかを分析する上で、レジリエンス指標の重要な役割を強調している。
論文 参考訳(メタデータ) (2024-09-20T03:28:48Z) - Network bottlenecks and task structure control the evolution of interpretable learning rules in a foraging agent [0.0]
我々は, メタラーニングを, 単純な報酬変調型可塑性規則の進化的最適化により研究した。
制約のないメタラーニングが多様な可塑性規則の出現につながることを示す。
その結果, 可塑性規則のメタラーニングは様々なパラメータに非常に敏感であり, この感度は生物学的ネットワークで見られる学習規則に反映している可能性が示唆された。
論文 参考訳(メタデータ) (2024-03-20T14:57:02Z) - Adaptive Control Strategy for Quadruped Robots in Actuator Degradation
Scenarios [16.148061952978246]
本稿では,Actuator Degradation Adaptation Transformer (ADAPT) という,強化学習に根ざした教師学習フレームワークを提案する。
ADAPTは統合制御戦略を作成し、ロボットは突然の関節アクチュエータの故障にもかかわらず、移動を継続し、タスクを実行することができる。
Unitree A1プラットフォームに関する実証的な評価は、現実世界の四足歩行ロボットにおけるAdaptのデプロイ性と有効性を検証する。
論文 参考訳(メタデータ) (2023-12-29T14:04:45Z) - Bridging Active Exploration and Uncertainty-Aware Deployment Using
Probabilistic Ensemble Neural Network Dynamics [11.946807588018595]
本稿では,活発な探索と不確実性を考慮した展開を橋渡しするモデルベース強化学習フレームワークを提案する。
探索と展開の対立する2つのタスクは、最先端のサンプリングベースのMPCによって最適化されている。
自動運転車と車輪付きロボットの両方で実験を行い、探索と展開の両方に有望な結果を示します。
論文 参考訳(メタデータ) (2023-05-20T17:20:12Z) - Developing Decentralised Resilience to Malicious Influence in Collective
Perception Problem [0.7734726150561088]
集合的な意思決定において、局所的な情報のみを用いてスワムレベルの振る舞いに影響を与えるアルゴリズムを設計することは、自明な問題ではない。
我々は、機械学習技術を用いて、Swarmメンバーに環境の局所的な認識を最適な行動にマッピングするように教えた。
我々は、エージェントに悪意ある影響に対するレジリエンスを教えるカリキュラムを作成することで、従来のアプローチを拡張した。
論文 参考訳(メタデータ) (2022-11-06T08:53:33Z) - Interpreting Neural Policies with Disentangled Tree Representations [58.769048492254555]
本稿では,コンパクトなニューラルポリシーの解釈可能性について,不整合表現レンズを用いて検討する。
決定木を利用して,ロボット学習における絡み合いの要因を抽出する。
学習したニューラルダイナミクスの絡み合いを計測する解釈可能性指標を導入する。
論文 参考訳(メタデータ) (2022-10-13T01:10:41Z) - Revisiting the Adversarial Robustness-Accuracy Tradeoff in Robot
Learning [121.9708998627352]
近年の研究では、現実的なロボット学習の応用において、対人訓練の効果が公平なトレードオフを起こさないことが示されている。
本研究は,ロボット学習におけるロバストネスと精度のトレードオフを再考し,最近のロバストトレーニング手法と理論の進歩により,現実のロボット応用に適した対人トレーニングが可能かどうかを解析する。
論文 参考訳(メタデータ) (2022-04-15T08:12:15Z) - L2Explorer: A Lifelong Reinforcement Learning Assessment Environment [49.40779372040652]
強化学習ソリューションは、トレーニングされたデータ配布以外の新しいタスクに晒されると、あまり一般化しない傾向があります。
生涯学習エクスプローラー(L2Explorer)を用いた継続的強化学習開発と評価のための枠組みを導入する。
L2Explorerは新しいUnityベースのファーストパーソンな3D探索環境で、複雑な評価カリキュラムに構造化されたタスクやタスクのバリエーションを生成するために継続的に再構成することができる。
論文 参考訳(メタデータ) (2022-03-14T19:20:26Z) - Learning Compliance Adaptation in Contact-Rich Manipulation [81.40695846555955]
本稿では,コンタクトリッチタスクに必要な力プロファイルの予測モデルを学習するための新しいアプローチを提案する。
このアプローチは、双方向Gated Recurrent Units (Bi-GRU) に基づく異常検出と適応力/インピーダンス制御を組み合わせたものである。
論文 参考訳(メタデータ) (2020-05-01T05:23:34Z) - Never Stop Learning: The Effectiveness of Fine-Tuning in Robotic
Reinforcement Learning [109.77163932886413]
本稿では,ロボットによるロボット操作ポリシーを,政治以外の強化学習を通じて微調整することで,新たなバリエーションに適応する方法を示す。
この適応は、タスクをゼロから学習するために必要なデータの0.2%未満を使用する。
事前訓練されたポリシーを適用するという私たちのアプローチは、微調整の過程で大きなパフォーマンス向上につながります。
論文 参考訳(メタデータ) (2020-04-21T17:57:04Z) - Enhanced Adversarial Strategically-Timed Attacks against Deep
Reinforcement Learning [91.13113161754022]
本稿では,DRLに基づくナビゲーションシステムに対して,選択した時間フレーム上の物理ノイズパターンを妨害することにより,タイミングに基づく逆方向戦略を導入する。
実験結果から, 対向タイミング攻撃は性能低下を引き起こす可能性が示唆された。
論文 参考訳(メタデータ) (2020-02-20T21:39:25Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。