論文の概要: Smart Magnetic Microrobots Learn to Swim with Deep Reinforcement
Learning
- arxiv url: http://arxiv.org/abs/2201.05599v1
- Date: Fri, 14 Jan 2022 18:42:18 GMT
- ステータス: 処理完了
- システム内更新日: 2022-01-17 15:59:44.472518
- Title: Smart Magnetic Microrobots Learn to Swim with Deep Reinforcement
Learning
- Title(参考訳): 深部強化学習でスイムを学習するスマート磁気マイクロロボット
- Authors: Michael R. Behrens and Warren C. Ruder
- Abstract要約: 深層強化学習は、スマートなマイクロロボットを作るための堅牢なコントローラを自律的に開発するための有望な方法である。
本稿では,ソフトアクター評論家強化学習アルゴリズムを用いて制御ポリシを自律的に導出するスマートヘリカル磁性ハイドロゲルマイクロロボットの開発について報告する。
強化学習エージェントは10万歩未満のトレーニングステップで制御ポリシを成功させ、高速学習のためのサンプル効率を実証した。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Swimming microrobots are increasingly developed with complex materials and
dynamic shapes and are expected to operate in complex environments in which the
system dynamics are difficult to model and positional control of the microrobot
is not straightforward to achieve. Deep reinforcement learning is a promising
method of autonomously developing robust controllers for creating smart
microrobots, which can adapt their behavior to operate in uncharacterized
environments without the need to model the system dynamics. Here, we report the
development of a smart helical magnetic hydrogel microrobot that used the soft
actor critic reinforcement learning algorithm to autonomously derive a control
policy which allowed the microrobot to swim through an uncharacterized
biomimetic fluidic environment under control of a time varying magnetic field
generated from a three-axis array of electromagnets. The reinforcement learning
agent learned successful control policies with fewer than 100,000 training
steps, demonstrating sample efficiency for fast learning. We also demonstrate
that we can fine tune the control policies learned by the reinforcement
learning agent by fitting mathematical functions to the learned policy's action
distribution via regression. Deep reinforcement learning applied to microrobot
control is likely to significantly expand the capabilities of the next
generation of microrobots.
- Abstract(参考訳): スイミングマイクロロボットは複雑な材料とダイナミックな形状で開発され、システムダイナミクスのモデル化が難しく、マイクロロボットの位置制御が容易ではない複雑な環境での運用が期待されている。
深層強化学習(deep reinforcement learning)は、スマートなマイクロロボットを作成するためのロバストなコントローラを自律的に開発する有望な方法である。
本稿では,ソフトアクタ批評家強化学習アルゴリズムを用いて,マイクロロボットが3軸の電磁石から発生する時間変化磁界の制御下で,非キャラクタリゼーションバイオミメティック流体環境を泳ぐことができる制御方針を自律的に導出するスマートヘリカル磁気ハイドロゲルマイクロロボットの開発について報告する。
強化学習エージェントは10万以下のトレーニングステップで制御ポリシを成功させ、高速学習のためのサンプル効率を実証した。
また,強化学習エージェントが学習した制御方針を,回帰による学習方針の行動分布に数学関数を適合させることで微調整できることを実証する。
マイクロロボット制御に適用される深層強化学習は、次世代のマイクロロボットの能力を大きく拡張する可能性が高い。
関連論文リスト
- RoboGen: Towards Unleashing Infinite Data for Automated Robot Learning via Generative Simulation [68.70755196744533]
RoboGenはジェネレーティブなロボットエージェントで、ジェネレーティブなシミュレーションを通じて、さまざまなロボットのスキルを自動的に学習する。
我々の研究は、大規模モデルに埋め込まれた広範囲で多目的な知識を抽出し、それらをロボット工学の分野に移す試みである。
論文 参考訳(メタデータ) (2023-11-02T17:59:21Z) - Robot Fine-Tuning Made Easy: Pre-Training Rewards and Policies for
Autonomous Real-World Reinforcement Learning [58.3994826169858]
ロボット強化学習のためのリセット不要な微調整システムであるRoboFuMEを紹介する。
我々の洞察は、オフラインの強化学習技術を利用して、事前訓練されたポリシーの効率的なオンライン微調整を確保することである。
提案手法では,既存のロボットデータセットからのデータを組み込んで,目標タスクを3時間以内の自律現実体験で改善することができる。
論文 参考訳(メタデータ) (2023-10-23T17:50:08Z) - Robot Fleet Learning via Policy Merging [58.5086287737653]
我々はFLEET-MERGEを提案し、艦隊設定における政策を効率的にマージする。
本稿では,FLEET-MERGEがメタワールド環境における50のタスクで訓練されたポリシーの行動を統合することを示す。
合成・接触に富んだロボット操作タスクにおけるフリートポリシー学習のための新しいロボットツール用ベンチマークであるFLEET-TOOLSを導入する。
論文 参考訳(メタデータ) (2023-10-02T17:23:51Z) - Navigation of micro-robot swarms for targeted delivery using
reinforcement learning [0.0]
Inforcement Learning (RL) アルゴリズムをPPO(Proximal Policy Optimization) とRPO(Robust Policy Optimization) を用いて,4,9,16マイクロスウィマーの群を探索する。
PPOとRPOの両方のパフォーマンスを、限られた状態情報シナリオで調べ、また、ランダムな目標位置とサイズに対するロバスト性をテストする。
論文 参考訳(メタデータ) (2023-06-30T12:17:39Z) - Bridging Active Exploration and Uncertainty-Aware Deployment Using
Probabilistic Ensemble Neural Network Dynamics [11.946807588018595]
本稿では,活発な探索と不確実性を考慮した展開を橋渡しするモデルベース強化学習フレームワークを提案する。
探索と展開の対立する2つのタスクは、最先端のサンプリングベースのMPCによって最適化されている。
自動運転車と車輪付きロボットの両方で実験を行い、探索と展開の両方に有望な結果を示します。
論文 参考訳(メタデータ) (2023-05-20T17:20:12Z) - Programmable Control of Ultrasound Swarmbots through Reinforcement
Learning [0.0]
マイクロバブルをベースとした音響駆動型マイクロロボットナビゲーションは、薬物の配送を狙う上で有望なアプローチである。
我々は、強化学習制御戦略を用いて、マイクロロボットの力学を学習し、音響力で操作する。
その結果,マイクロ流体環境下でのマイクロバブルの自律的音響ナビゲーションが実証された。
論文 参考訳(メタデータ) (2022-09-30T11:46:12Z) - Active Predicting Coding: Brain-Inspired Reinforcement Learning for
Sparse Reward Robotic Control Problems [79.07468367923619]
ニューラルジェネレーティブ・コーディング(NGC)の神経認知計算フレームワークによるロボット制御へのバックプロパゲーションフリーアプローチを提案する。
我々は、スパース報酬から動的オンライン学習を容易にする強力な予測符号化/処理回路から完全に構築されたエージェントを設計する。
提案するActPCエージェントは,スパース(外部)報酬信号に対して良好に動作し,複数の強力なバックプロップベースのRLアプローチと競合し,性能が優れていることを示す。
論文 参考訳(メタデータ) (2022-09-19T16:49:32Z) - Chemotaxis of sea urchin sperm cells through deep reinforcement learning [0.0]
本研究では, ウニ精子のモデルが, ケモアトレラント濃度場において, 自己学習型遊走運動をいかに行うかを検討する。
我々は,人工ニューラルネットワークを用いて意思決定エージェントとして機能し,精子の効率的な操作戦略の発見を容易にする。
以上の結果から,ウニ精子の遊走過程に関する知見が得られ,微生物の知能的操作のためのガイダンスも用意された。
論文 参考訳(メタデータ) (2022-08-02T06:04:32Z) - Autonomous object harvesting using synchronized optoelectronic
microrobots [10.860767733334306]
optoelectronic tweezer-driven microrobots (oetdms)は多用途のマイクロマニピュレーション技術である。
複数のマイクロロボットのオープンループ制御を実現するために,自動的ターゲティングと経路計画手法を提案する。
論文 参考訳(メタデータ) (2021-03-08T17:24:15Z) - Populations of Spiking Neurons for Reservoir Computing: Closed Loop
Control of a Compliant Quadruped [64.64924554743982]
本稿では,ニューラルネットワークを用いた中央パターン生成機構を実装し,閉ループロボット制御を実現するためのフレームワークを提案する。
本研究では,従順な四足歩行ロボットのシミュレーションモデル上で,予め定義された歩行パターン,速度制御,歩行遷移の学習を実演する。
論文 参考訳(メタデータ) (2020-04-09T14:32:49Z) - Enhanced Adversarial Strategically-Timed Attacks against Deep
Reinforcement Learning [91.13113161754022]
本稿では,DRLに基づくナビゲーションシステムに対して,選択した時間フレーム上の物理ノイズパターンを妨害することにより,タイミングに基づく逆方向戦略を導入する。
実験結果から, 対向タイミング攻撃は性能低下を引き起こす可能性が示唆された。
論文 参考訳(メタデータ) (2020-02-20T21:39:25Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。