論文の概要: A Feasibility-Driven Approach to Control-Limited DDP
- arxiv url: http://arxiv.org/abs/2010.00411v4
- Date: Mon, 15 Aug 2022 16:16:42 GMT
- ステータス: 処理完了
- システム内更新日: 2022-10-12 08:47:20.499910
- Title: A Feasibility-Driven Approach to Control-Limited DDP
- Title(参考訳): 制御限界DDPに対する可能性駆動型アプローチ
- Authors: Carlos Mastalli, Wolfgang Merkt, Josep Marti-Saumell, Henrique
Ferrolho, Joan Sola, Nicolas Mansard and Sethu Vijayakumar
- Abstract要約: BOX-FDDPは数値最適化時の動的実現性を制御し,制御限界を確保する。
本研究では,四足歩行ロボットとヒューマノイドロボットの複合運動と運動運動の生成によるアプローチの利点を実証する。
- 参考スコア(独自算出の注目度): 22.92789455838942
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Differential dynamic programming (DDP) is a direct single shooting method for
trajectory optimization. Its efficiency derives from the exploitation of
temporal structure (inherent to optimal control problems) and explicit
roll-out/integration of the system dynamics. However, it suffers from numerical
instability and, when compared to direct multiple shooting methods, it has
limited initialization options (allows initialization of controls, but not of
states) and lacks proper handling of control constraints. In this work, we
tackle these issues with a feasibility-driven approach that regulates the
dynamic feasibility during the numerical optimization and ensures control
limits. Our feasibility search emulates the numerical resolution of a direct
multiple shooting problem with only dynamics constraints. We show that our
approach (named BOX-FDDP) has better numerical convergence than BOX-DDP+ (a
single shooting method), and that its convergence rate and runtime performance
are competitive with state-of-the-art direct transcription formulations solved
using the interior point and active set algorithms available in KNITRO. We
further show that BOX-FDDP decreases the dynamic feasibility error
monotonically--as in state-of-the-art nonlinear programming algorithms. We
demonstrate the benefits of our approach by generating complex and athletic
motions for quadruped and humanoid robots. Finally, we highlight that BOX-FDDP
is suitable for model predictive control in legged robots.
- Abstract(参考訳): 微分動的プログラミング(DDP)は、軌道最適化のための直接単射法である。
その効率は、(最適制御問題への)時間的構造の導入と、システムダイナミクスの明示的なロールアウト/統合に由来する。
しかし、数値的な不安定さに苦しめられ、直接多重射撃法と比較すると、初期化オプション(制御の初期化は許されるが、状態は許さない)が制限され、制御制約の適切な処理が欠如している。
本研究では,数値最適化時の動的実現性を制御し,制御限界を確実にする実現可能性駆動手法を用いて,これらの課題に取り組む。
我々の実現可能性探索は、動的制約のみで直接多重射撃問題の数値解をエミュレートする。
提案手法(BOX-FDDP)は,BOX-DDP+よりも数値収束性が高く,その収束率と実行性能は,内部点とKNITROで利用可能な能動集合アルゴリズムを用いて解決された最先端の直接転写法と競合することを示す。
さらに、BOX-FDDPは、最先端非線形プログラミングアルゴリズムのように、動的実行可能性誤差を単調に減少させることを示す。
本研究では,四足歩行ロボットとヒューマノイドロボットの複合運動と運動運動の生成によるアプローチの利点を実証する。
最後に,BOX-FDDPが脚ロボットのモデル予測制御に適していることを強調する。
関連論文リスト
- On the Boundary Feasibility for PDE Control with Neural Operators [7.537923263907072]
本稿では,境界出力の軌道方向の制約満足度を確実にするために,一般神経境界制御障壁関数(BCBF)を導入する。
境界制御入力から出力軌道への伝達関数をモデル化したニューラル演算子を用いて、BCFの変化は入力境界の変化に線形に依存することを示す。
双曲型, 放物型, ナビエ・ストークスPDE動的環境下での実験により, 提案手法の有効性が検証された。
論文 参考訳(メタデータ) (2024-11-23T20:15:51Z) - Custom Non-Linear Model Predictive Control for Obstacle Avoidance in Indoor and Outdoor Environments [0.0]
本稿では,DJI行列100のための非線形モデル予測制御(NMPC)フレームワークを提案する。
このフレームワークは様々なトラジェクトリタイプをサポートし、厳密な操作の精度を制御するためにペナルティベースのコスト関数を採用している。
論文 参考訳(メタデータ) (2024-10-03T17:50:19Z) - Integrating DeepRL with Robust Low-Level Control in Robotic Manipulators for Non-Repetitive Reaching Tasks [0.24578723416255746]
ロボット工学では、現代の戦略は学習に基づくもので、複雑なブラックボックスの性質と解釈可能性の欠如が特徴である。
本稿では, 深部強化学習(DRL)に基づく衝突のない軌道プランナと, 自動調整型低レベル制御戦略を統合することを提案する。
論文 参考訳(メタデータ) (2024-02-04T15:54:03Z) - Safe Neural Control for Non-Affine Control Systems with Differentiable
Control Barrier Functions [58.19198103790931]
本稿では,非アフィン制御系における安全クリティカル制御の問題に対処する。
制御バリア関数(CBF)を用いて,状態制約と制御制約の2次コストの最適化を2次プログラムのシーケンス(QP)にサブ最適化できることが示されている。
我々は,高次CBFをニューラル常微分方程式に基づく学習モデルに差分CBFとして組み込んで,非アフィン制御系の安全性を保証する。
論文 参考訳(メタデータ) (2023-09-06T05:35:48Z) - OSCAR: Data-Driven Operational Space Control for Adaptive and Robust
Robot Manipulation [50.59541802645156]
オペレーショナル・スペース・コントロール(OSC)は、操作のための効果的なタスクスペース・コントローラとして使われてきた。
本稿では,データ駆動型OSCのモデル誤差を補償するOSC for Adaptation and Robustness (OSCAR)を提案する。
本手法は,様々なシミュレーション操作問題に対して評価し,制御器のベースラインの配列よりも大幅に改善されていることを示す。
論文 参考訳(メタデータ) (2021-10-02T01:21:38Z) - Identification and Avoidance of Static and Dynamic Obstacles on Point
Cloud for UAVs Navigation [7.14505983271756]
クラウド入力のみを点とする静的障害と動的障害を区別する手法を提案する。
計算効率の良い障害物回避運動計画手法を提案し, 改良された相対速度法と一致している。
このアプローチは、同じフレームワークの静的障害と動的障害の両方を避けることができる。
論文 参考訳(メタデータ) (2021-05-14T02:44:18Z) - Control of Stochastic Quantum Dynamics with Differentiable Programming [0.0]
微分可能プログラミングに基づく制御スキームの自動設計のためのフレームワークを提案する。
このアプローチを、ホモジエン検出を受けるクビットの状態準備と安定化に適用する。
その結果、信号と雑音の比が低いにもかかわらず、平均忠実度が約85%の目標状態へのキュービットの準備と安定化をコントローラに教えることができる。
論文 参考訳(メタデータ) (2021-01-04T19:00:03Z) - Gaussian Process-based Min-norm Stabilizing Controller for
Control-Affine Systems with Uncertain Input Effects and Dynamics [90.81186513537777]
本稿では,この問題の制御・アフィン特性を捉えた新しい化合物カーネルを提案する。
この結果の最適化問題は凸であることを示し、ガウス過程に基づく制御リャプノフ関数第二次コーンプログラム(GP-CLF-SOCP)と呼ぶ。
論文 参考訳(メタデータ) (2020-11-14T01:27:32Z) - Online Reinforcement Learning Control by Direct Heuristic Dynamic
Programming: from Time-Driven to Event-Driven [80.94390916562179]
時間駆動学習は、新しいデータが到着すると予測モデルのパラメータを継続的に更新する機械学習手法を指す。
ノイズなどの重要なシステムイベントによる時間駆動型dHDPの更新を防止することが望ましい。
イベント駆動型dHDPアルゴリズムは,従来の時間駆動型dHDPと比較して動作することを示す。
論文 参考訳(メタデータ) (2020-06-16T05:51:25Z) - Optimization-driven Deep Reinforcement Learning for Robust Beamforming
in IRS-assisted Wireless Communications [54.610318402371185]
Intelligent Reflecting Surface (IRS)は、マルチアンテナアクセスポイント(AP)から受信機へのダウンリンク情報伝達を支援する有望な技術である。
我々は、APのアクティブビームフォーミングとIRSのパッシブビームフォーミングを共同最適化することで、APの送信電力を最小化する。
過去の経験からビームフォーミング戦略に適応できる深層強化学習(DRL)手法を提案する。
論文 参考訳(メタデータ) (2020-05-25T01:42:55Z) - Guided Constrained Policy Optimization for Dynamic Quadrupedal Robot
Locomotion [78.46388769788405]
我々は,制約付きポリシー最適化(CPPO)の実装に基づくRLフレームワークであるGCPOを紹介する。
誘導制約付きRLは所望の最適値に近い高速収束を実現し,正確な報酬関数チューニングを必要とせず,最適かつ物理的に実現可能なロボット制御動作を実現することを示す。
論文 参考訳(メタデータ) (2020-02-22T10:15:53Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。