論文の概要: Ground contact and reaction force sensing for linear policy control of quadruped robot
- arxiv url: http://arxiv.org/abs/2503.01102v1
- Date: Mon, 03 Mar 2025 02:04:55 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-03-05 19:16:01.509188
- Title: Ground contact and reaction force sensing for linear policy control of quadruped robot
- Title(参考訳): 四足歩行ロボットのリニアポリシー制御のための接地・反力センシング
- Authors: Harshita Mhaske, Aniket Mandhare, Jidong Huang, Yu Bai,
- Abstract要約: 強化学習で訓練された直線的方針は、四足歩行を可能にするために適切に機能することが示されている。
地上接触と反応力のデータは、生存可能性の向上、外乱に対する安定性の向上、訓練されていない条件への適応性の向上で政策を訓練する。
- 参考スコア(独自算出の注目度): 7.2916460705335995
- License:
- Abstract: Designing robots capable of traversing uneven terrain and overcoming physical obstacles has been a longstanding challenge in the field of robotics. Walking robots show promise in this regard due to their agility, redundant DOFs and intermittent ground contact of locomoting appendages. However, the complexity of walking robots and their numerous DOFs make controlling them extremely difficult and computation heavy. Linear policies trained with reinforcement learning have been shown to perform adequately to enable quadrupedal walking, while being computationally light weight. The goal of this research is to study the effect of augmentation of observation space of a linear policy with newer state variables on performance of the policy. Since ground contact and reaction forces are the primary means of robot-environment interaction, they are essential state variables on which the linear policy must be informed. Experimental results show that augmenting the observation space with ground contact and reaction force data trains policies with better survivability, better stability against external disturbances and higher adaptability to untrained conditions.
- Abstract(参考訳): 不均一な地形を横断し、物理的障害を克服できるロボットを設計することは、ロボット工学の分野で長年の課題であった。
歩行ロボットはこの点において、機敏性、冗長なDOF、およびロコモティックアタッチメントの断続的な接点により有望であることを示している。
しかし、歩行ロボットとその多数のDOFの複雑さは、それらを制御するのを非常に困難にし、計算を重くする。
強化学習で訓練された線形ポリシーは、計算的に軽量でありながら、四足歩行を可能にするために適切に機能することが示されている。
本研究の目的は,新しい状態変数を持つ線形政策の観測空間の増大が政策の性能に及ぼす影響を検討することである。
接地力と反応力はロボットと環境の相互作用の主要な手段であるため、それらは線形ポリシーを知らなければならない重要な状態変数である。
実験の結果, 地上接触と反応力データによる観測空間の増大は, 生存性の向上, 外乱に対する安定性の向上, 未訓練条件への適応性の向上を図っている。
関連論文リスト
- Robotic Control via Embodied Chain-of-Thought Reasoning [86.6680905262442]
学習したロボット制御ポリシーの鍵となる制限は、トレーニングデータの外部で一般化できないことである。
視覚言語行動モデル(VLA)に関する最近の研究は、大規模なインターネット事前学習型視覚言語モデルを使用することで、その堅牢性と一般化能力を大幅に向上させることができることを示した。
ロボットの動作を予測する前に、VLAに対して、計画、サブタスク、動作、視覚的接地機能について複数の推論を行うために、VLAに対してEmbodied Chain-of-Thought Reasoning (ECoT)を導入する。
論文 参考訳(メタデータ) (2024-07-11T17:31:01Z) - Reinforcement Learning for Versatile, Dynamic, and Robust Bipedal Locomotion Control [106.32794844077534]
本稿では,二足歩行ロボットのための動的移動制御系を構築するために,深層強化学習を用いた研究について述べる。
本研究では、周期歩行やランニングから周期ジャンプや立位に至るまで、様々な動的二足歩行技術に使用できる汎用的な制御ソリューションを開発する。
この研究は、二足歩行ロボットの俊敏性の限界を、現実世界での広範な実験を通じて押し上げる。
論文 参考訳(メタデータ) (2024-01-30T10:48:43Z) - Grow Your Limits: Continuous Improvement with Real-World RL for Robotic
Locomotion [66.69666636971922]
本稿では,ロボットの学習過程における探索を調節するポリシー正規化フレームワークであるAPRLを提案する。
APRLは四足歩行ロボットを、数分で完全に現実世界を歩けるように効率よく学習する。
論文 参考訳(メタデータ) (2023-10-26T17:51:46Z) - Learning Vision-based Pursuit-Evasion Robot Policies [54.52536214251999]
我々は、部分的に観察可能なロボットの監督を生成する完全観測可能なロボットポリシーを開発する。
我々は、RGB-Dカメラを搭載した4足歩行ロボットに、野生での追従回避のインタラクションにポリシーを展開させる。
論文 参考訳(メタデータ) (2023-08-30T17:59:05Z) - Nonprehensile Planar Manipulation through Reinforcement Learning with
Multimodal Categorical Exploration [8.343657309038285]
強化学習はそのようなロボットコントローラを開発するための強力なフレームワークである。
分類分布を用いたマルチモーダル探索手法を提案する。
学習したポリシは外部の障害や観測ノイズに対して堅牢であり、複数のプッシュ器でタスクにスケールできることが示される。
論文 参考訳(メタデータ) (2023-08-04T16:55:00Z) - Real2Sim2Real Transfer for Control of Cable-driven Robots via a
Differentiable Physics Engine [9.268539775233346]
テンセグリティロボットは、高い強度と重量比と大きな変形を示す。
しかし、それらは高次元性、複雑な力学、結合アーキテクチャのために制御が難しい。
本稿では,Real2Sim2Real(R2S2R)戦略について述べる。
論文 参考訳(メタデータ) (2022-09-13T18:51:26Z) - A Contact-Safe Reinforcement Learning Framework for Contact-Rich Robot
Manipulation [5.0768619194124005]
本稿では,コンタクトリッチロボット操作のためのコンタクトセーフ強化学習フレームワークを提案する。
RLポリシーがロボットアームと環境の予期せぬ衝突を引き起こすと、我々のフレームワークはすぐに衝突を検出し、接触力を小さくすることができる。
本手法は, 予期せぬ衝突のシナリオ下であっても, タスク空間とジョイント空間の両方で接触力を小さく抑えることができる。
論文 参考訳(メタデータ) (2022-07-27T10:35:44Z) - Regularized Deep Signed Distance Fields for Reactive Motion Generation [30.792481441975585]
距離に基づく制約は、ロボットが自分の行動を計画し、安全に行動できるようにするための基本となる。
本研究では,任意のスケールでスムーズな距離場を計算できる単一暗黙関数ReDSDFを提案する。
共有作業空間における全身制御(WBC)と安全なヒューマンロボットインタラクション(HRI)のための代表的タスクにおけるアプローチの有効性を実証する。
論文 参考訳(メタデータ) (2022-03-09T14:21:32Z) - OSCAR: Data-Driven Operational Space Control for Adaptive and Robust
Robot Manipulation [50.59541802645156]
オペレーショナル・スペース・コントロール(OSC)は、操作のための効果的なタスクスペース・コントローラとして使われてきた。
本稿では,データ駆動型OSCのモデル誤差を補償するOSC for Adaptation and Robustness (OSCAR)を提案する。
本手法は,様々なシミュレーション操作問題に対して評価し,制御器のベースラインの配列よりも大幅に改善されていることを示す。
論文 参考訳(メタデータ) (2021-10-02T01:21:38Z) - COCOI: Contact-aware Online Context Inference for Generalizable
Non-planar Pushing [87.7257446869134]
一般的なコンタクトリッチな操作問題は、ロボット工学における長年の課題である。
深層強化学習は、ロボット操作タスクの解決に大きな可能性を示している。
動的プロパティのコンテキスト埋め込みをオンラインにエンコードする深層RL法であるCOCOIを提案する。
論文 参考訳(メタデータ) (2020-11-23T08:20:21Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。