論文の概要: Navigation of micro-robot swarms for targeted delivery using
reinforcement learning
- arxiv url: http://arxiv.org/abs/2306.17598v1
- Date: Fri, 30 Jun 2023 12:17:39 GMT
- ステータス: 処理完了
- システム内更新日: 2023-07-03 12:35:22.874967
- Title: Navigation of micro-robot swarms for targeted delivery using
reinforcement learning
- Title(参考訳): 強化学習による目標配送のためのマイクロロボット群ナビゲーション
- Authors: Akshatha Jagadish, Manoj Varma
- Abstract要約: Inforcement Learning (RL) アルゴリズムをPPO(Proximal Policy Optimization) とRPO(Robust Policy Optimization) を用いて,4,9,16マイクロスウィマーの群を探索する。
PPOとRPOの両方のパフォーマンスを、限られた状態情報シナリオで調べ、また、ランダムな目標位置とサイズに対するロバスト性をテストする。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Micro robotics is quickly emerging to be a promising technological solution
to many medical treatments with focus on targeted drug delivery. They are
effective when working in swarms whose individual control is mostly infeasible
owing to their minute size. Controlling a number of robots with a single
controller is thus important and artificial intelligence can help us perform
this task successfully. In this work, we use the Reinforcement Learning (RL)
algorithms Proximal Policy Optimization (PPO) and Robust Policy Optimization
(RPO) to navigate a swarm of 4, 9 and 16 microswimmers under hydrodynamic
effects, controlled by their orientation, towards a circular absorbing target.
We look at both PPO and RPO performances with limited state information
scenarios and also test their robustness for random target location and size.
We use curriculum learning to improve upon the performance and demonstrate the
same in learning to navigate a swarm of 25 swimmers and steering the swarm to
exemplify the manoeuvring capabilities of the RL model.
- Abstract(参考訳): マイクロロボティクスは、多くの医療分野における有望な技術ソリューションとして急速に発展しつつある。
マイクロサイズのため、個々のコントロールがほぼ不可能なスワムで作業する場合に有効である。
したがって、複数のロボットを単一のコントローラーで制御することは重要であり、人工知能はこのタスクを成功させるのに役立ちます。
本研究では,強化学習(rl)アルゴリズム(ppo)とロバスト・ポリシー最適化(rpo)を用いて,4,9,16マイクロスウィマーの群れを流体力学的効果下に移動させ,その方向制御を行い,円形吸収ターゲットに向かって移動させる。
PPOとRPOの両方のパフォーマンスを、限られた状態情報シナリオで調べ、ランダムな目標位置とサイズに対するロバスト性をテストする。
私たちはカリキュラム学習を使ってパフォーマンスを改善し、25人のスイマーの群れをナビゲートし、群れを操り、rlモデルの操作能力を例示するために、学習でも同じことを示しています。
関連論文リスト
- Deep Reinforcement Learning with Enhanced PPO for Safe Mobile Robot Navigation [0.6554326244334868]
本研究では,複雑な環境下での自律走行のための移動ロボットの訓練における深層強化学習の適用について検討する。
このロボットは、LiDARセンサデータとディープニューラルネットワークを用いて、障害物を回避しつつ、特定の目標に向かって誘導する制御信号を生成する。
論文 参考訳(メタデータ) (2024-05-25T15:08:36Z) - SERL: A Software Suite for Sample-Efficient Robotic Reinforcement
Learning [85.21378553454672]
筆者らは,報酬の計算と環境のリセットを行う手法とともに,効率的なオフ・ポリティクス・ディープ・RL法を含むライブラリを開発した。
我々は,PCBボードアセンブリ,ケーブルルーティング,オブジェクトの移動に関するポリシを,非常に効率的な学習を実現することができることを発見した。
これらの政策は完全な成功率またはほぼ完全な成功率、摂動下でさえ極端な堅牢性を実現し、突発的な堅牢性回復と修正行動を示す。
論文 参考訳(メタデータ) (2024-01-29T10:01:10Z) - Training microrobots to swim by a large language model [0.0]
我々は5つの文からなる最小限の統一的なプロンプトを開発する。
同じプロンプトは、2つの明瞭なマイクロロボットをシグネチャストロークをマスターすることに成功した。
LLMに基づく意思決定戦略は,学習速度において従来の強化学習手法を大幅に上回っている。
論文 参考訳(メタデータ) (2024-01-21T12:18:59Z) - Mission-driven Exploration for Accelerated Deep Reinforcement Learning
with Temporal Logic Task Specifications [11.812602599752294]
未知の構造を持つ環境で動作している未知のダイナミクスを持つロボットについて考察する。
我々の目標は、オートマトン符号化されたタスクを満足する確率を最大化する制御ポリシーを合成することである。
そこで本研究では,制御ポリシーを類似手法と比較して顕著に高速に学習できるDRLアルゴリズムを提案する。
論文 参考訳(メタデータ) (2023-11-28T18:59:58Z) - Robot Fine-Tuning Made Easy: Pre-Training Rewards and Policies for
Autonomous Real-World Reinforcement Learning [58.3994826169858]
ロボット強化学習のためのリセット不要な微調整システムであるRoboFuMEを紹介する。
我々の洞察は、オフラインの強化学習技術を利用して、事前訓練されたポリシーの効率的なオンライン微調整を確保することである。
提案手法では,既存のロボットデータセットからのデータを組み込んで,目標タスクを3時間以内の自律現実体験で改善することができる。
論文 参考訳(メタデータ) (2023-10-23T17:50:08Z) - Reaching the Limit in Autonomous Racing: Optimal Control versus
Reinforcement Learning [66.10854214036605]
ロボット工学における中心的な問題は、アジャイルなモバイルロボットの制御システムをどうやって設計するかである。
本稿では、強化学習(RL)で訓練されたニューラルネットワークコントローラが最適制御(OC)法より優れていることを示す。
その結果、アジャイルドローンを最大性能に押し上げることができ、最大加速速度は重力加速度の12倍以上、ピーク速度は時速108kmに達しました。
論文 参考訳(メタデータ) (2023-10-17T02:40:27Z) - Robot Fleet Learning via Policy Merging [58.5086287737653]
我々はFLEET-MERGEを提案し、艦隊設定における政策を効率的にマージする。
本稿では,FLEET-MERGEがメタワールド環境における50のタスクで訓練されたポリシーの行動を統合することを示す。
合成・接触に富んだロボット操作タスクにおけるフリートポリシー学習のための新しいロボットツール用ベンチマークであるFLEET-TOOLSを導入する。
論文 参考訳(メタデータ) (2023-10-02T17:23:51Z) - Chemotaxis of sea urchin sperm cells through deep reinforcement learning [0.0]
本研究では, ウニ精子のモデルが, ケモアトレラント濃度場において, 自己学習型遊走運動をいかに行うかを検討する。
我々は,人工ニューラルネットワークを用いて意思決定エージェントとして機能し,精子の効率的な操作戦略の発見を容易にする。
以上の結果から,ウニ精子の遊走過程に関する知見が得られ,微生物の知能的操作のためのガイダンスも用意された。
論文 参考訳(メタデータ) (2022-08-02T06:04:32Z) - Smart Magnetic Microrobots Learn to Swim with Deep Reinforcement
Learning [0.0]
深層強化学習は、スマートなマイクロロボットを作るための堅牢なコントローラを自律的に開発するための有望な方法である。
本稿では,ソフトアクター評論家強化学習アルゴリズムを用いて制御ポリシを自律的に導出するスマートヘリカル磁性ハイドロゲルマイクロロボットの開発について報告する。
強化学習エージェントは10万歩未満のトレーニングステップで制御ポリシを成功させ、高速学習のためのサンプル効率を実証した。
論文 参考訳(メタデータ) (2022-01-14T18:42:18Z) - A Framework for Efficient Robotic Manipulation [79.10407063260473]
単一のロボットアームがピクセルからスパースリワード操作ポリシーを学習できることを示します。
デモは10回しかなく、単一のロボットアームがピクセルからスパースリワード操作のポリシーを学習できることを示しています。
論文 参考訳(メタデータ) (2020-12-14T22:18:39Z) - Enhanced Adversarial Strategically-Timed Attacks against Deep
Reinforcement Learning [91.13113161754022]
本稿では,DRLに基づくナビゲーションシステムに対して,選択した時間フレーム上の物理ノイズパターンを妨害することにより,タイミングに基づく逆方向戦略を導入する。
実験結果から, 対向タイミング攻撃は性能低下を引き起こす可能性が示唆された。
論文 参考訳(メタデータ) (2020-02-20T21:39:25Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。