論文の概要: Adaptive Control Strategy for Quadruped Robots in Actuator Degradation
Scenarios
- arxiv url: http://arxiv.org/abs/2312.17606v1
- Date: Fri, 29 Dec 2023 14:04:45 GMT
- ステータス: 処理完了
- システム内更新日: 2024-01-02 09:50:37.975132
- Title: Adaptive Control Strategy for Quadruped Robots in Actuator Degradation
Scenarios
- Title(参考訳): アクチュエータ劣化シナリオにおける四足ロボットの適応制御戦略
- Authors: Xinyuan Wu, Wentao Dong, Hang Lai, Yong Yu and Ying Wen
- Abstract要約: 本稿では,Actuator Degradation Adaptation Transformer (ADAPT) という,強化学習に根ざした教師学習フレームワークを提案する。
ADAPTは統合制御戦略を作成し、ロボットは突然の関節アクチュエータの故障にもかかわらず、移動を継続し、タスクを実行することができる。
Unitree A1プラットフォームに関する実証的な評価は、現実世界の四足歩行ロボットにおけるAdaptのデプロイ性と有効性を検証する。
- 参考スコア(独自算出の注目度): 16.148061952978246
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Quadruped robots have strong adaptability to extreme environments but may
also experience faults. Once these faults occur, robots must be repaired before
returning to the task, reducing their practical feasibility. One prevalent
concern among these faults is actuator degradation, stemming from factors like
device aging or unexpected operational events. Traditionally, addressing this
problem has relied heavily on intricate fault-tolerant design, which demands
deep domain expertise from developers and lacks generalizability.
Learning-based approaches offer effective ways to mitigate these limitations,
but a research gap exists in effectively deploying such methods on real-world
quadruped robots. This paper introduces a pioneering teacher-student framework
rooted in reinforcement learning, named Actuator Degradation Adaptation
Transformer (ADAPT), aimed at addressing this research gap. This framework
produces a unified control strategy, enabling the robot to sustain its
locomotion and perform tasks despite sudden joint actuator faults, relying
exclusively on its internal sensors. Empirical evaluations on the Unitree A1
platform validate the deployability and effectiveness of Adapt on real-world
quadruped robots, and affirm the robustness and practicality of our approach.
- Abstract(参考訳): 四足歩行ロボットは極端な環境に強い適応性を持つが、欠点を経験することもある。
これらの障害が発生したら、ロボットはタスクに戻る前に修理されなければならない。
これらの欠点の1つがアクチュエータ劣化であり、デバイス老化や予期せぬ運用イベントなどの要因に起因する。
伝統的に、この問題に対処するには複雑なフォールトトレラント設計に大きく依存している。
学習に基づくアプローチは、これらの制限を緩和する効果的な方法を提供するが、現実世界の四足ロボットにそのような方法を効果的に配置する研究上のギャップが存在する。
本稿では,Actuator Degradation Adaptation Transformer (ADAPT) という,強化学習に根ざした先駆的な教師学習フレームワークについて紹介する。
このフレームワークは統合された制御戦略を生み出し、ロボットは内部センサーにのみ依存しながら、突然の関節アクチュエータ障害にもかかわらず、移動を維持およびタスクを実行することができる。
unitree a1プラットフォームにおける経験的評価は、実世界の四足ロボットへの適応の展開可能性と有効性を検証し、このアプローチの堅牢性と実用性を確認する。
関連論文リスト
- Bridging Active Exploration and Uncertainty-Aware Deployment Using
Probabilistic Ensemble Neural Network Dynamics [11.946807588018595]
本稿では,活発な探索と不確実性を考慮した展開を橋渡しするモデルベース強化学習フレームワークを提案する。
探索と展開の対立する2つのタスクは、最先端のサンプリングベースのMPCによって最適化されている。
自動運転車と車輪付きロボットの両方で実験を行い、探索と展開の両方に有望な結果を示します。
論文 参考訳(メタデータ) (2023-05-20T17:20:12Z) - Learning and Adapting Agile Locomotion Skills by Transferring Experience [71.8926510772552]
本稿では,既存のコントローラから新しいタスクを学習するために経験を移譲することで,複雑なロボティクススキルを訓練するためのフレームワークを提案する。
提案手法は,複雑なアジャイルジャンプ行動の学習,後肢を歩いたまま目標地点への移動,新しい環境への適応を可能にする。
論文 参考訳(メタデータ) (2023-04-19T17:37:54Z) - Revisiting the Adversarial Robustness-Accuracy Tradeoff in Robot
Learning [121.9708998627352]
近年の研究では、現実的なロボット学習の応用において、対人訓練の効果が公平なトレードオフを起こさないことが示されている。
本研究は,ロボット学習におけるロバストネスと精度のトレードオフを再考し,最近のロバストトレーニング手法と理論の進歩により,現実のロボット応用に適した対人トレーニングが可能かどうかを解析する。
論文 参考訳(メタデータ) (2022-04-15T08:12:15Z) - Reinforcement Learning with Adaptive Curriculum Dynamics Randomization
for Fault-Tolerant Robot Control [4.9631159466100305]
ACDRアルゴリズムは、ランダムなアクチュエータ故障条件下で四足歩行ロボットを適応的に訓練することができる。
ACDRアルゴリズムは、アクチュエータ故障を検出するための追加モジュールを必要としないロボットシステムを構築するために使用できる。
論文 参考訳(メタデータ) (2021-11-19T01:55:57Z) - Dual-Arm Adversarial Robot Learning [0.6091702876917281]
ロボット学習のためのプラットフォームとしてデュアルアーム設定を提案する。
このセットアップの潜在的なメリットと、追求できる課題と研究の方向性について論じる。
論文 参考訳(メタデータ) (2021-10-15T12:51:57Z) - Transformer-based deep imitation learning for dual-arm robot
manipulation [5.3022775496405865]
デュアルアームの操作設定では、追加のロボットマニピュレータによって引き起こされる状態次元の増加が注意をそらす。
本稿では、逐次入力における要素間の依存関係を計算し、重要な要素に焦点をあてる自己認識機構を用いてこの問題に対処する。
自己注意型アーキテクチャの変種であるTransformerは、実世界のデュアルアーム操作タスクを解決するために、深層模倣学習に適用される。
論文 参考訳(メタデータ) (2021-08-01T07:42:39Z) - Adversarial Training is Not Ready for Robot Learning [55.493354071227174]
対人訓練は,ノルム有界摂動に耐性のあるディープラーニングモデルを訓練する有効な方法である。
敵訓練により得られたニューラルコントローラが3種類の欠陥を受けることを理論的および実験的に示す。
この結果から, ロボット学習にはまだ対応できていないことが示唆された。
論文 参考訳(メタデータ) (2021-03-15T07:51:31Z) - Never Stop Learning: The Effectiveness of Fine-Tuning in Robotic
Reinforcement Learning [109.77163932886413]
本稿では,ロボットによるロボット操作ポリシーを,政治以外の強化学習を通じて微調整することで,新たなバリエーションに適応する方法を示す。
この適応は、タスクをゼロから学習するために必要なデータの0.2%未満を使用する。
事前訓練されたポリシーを適用するという私たちのアプローチは、微調整の過程で大きなパフォーマンス向上につながります。
論文 参考訳(メタデータ) (2020-04-21T17:57:04Z) - Improving Input-Output Linearizing Controllers for Bipedal Robots via
Reinforcement Learning [85.13138591433635]
入力出力線形化コントローラの主な欠点は、正確な力学モデルが必要であり、入力制約を考慮できないことである。
本稿では,強化学習技術を用いた二足歩行ロボット制御の具体例について,両課題に対処する。
論文 参考訳(メタデータ) (2020-04-15T18:15:49Z) - Enhanced Adversarial Strategically-Timed Attacks against Deep
Reinforcement Learning [91.13113161754022]
本稿では,DRLに基づくナビゲーションシステムに対して,選択した時間フレーム上の物理ノイズパターンを妨害することにより,タイミングに基づく逆方向戦略を導入する。
実験結果から, 対向タイミング攻撃は性能低下を引き起こす可能性が示唆された。
論文 参考訳(メタデータ) (2020-02-20T21:39:25Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。