Fugu-MT 論文翻訳(概要): A Feasibility-Driven Approach to Control-Limited DDP

論文の概要: A Feasibility-Driven Approach to Control-Limited DDP

arxiv url: http://arxiv.org/abs/2010.00411v4
Date: Mon, 15 Aug 2022 16:16:42 GMT
ステータス: 翻訳完了
システム内更新日: 2022-10-12 08:47:20.499910
Title: A Feasibility-Driven Approach to Control-Limited DDP
Title（参考訳）: 制御限界DDPに対する可能性駆動型アプローチ
Authors: Carlos Mastalli, Wolfgang Merkt, Josep Marti-Saumell, Henrique Ferrolho, Joan Sola, Nicolas Mansard and Sethu Vijayakumar
Abstract要約: BOX-FDDPは数値最適化時の動的実現性を制御し,制御限界を確保する。本研究では,四足歩行ロボットとヒューマノイドロボットの複合運動と運動運動の生成によるアプローチの利点を実証する。
参考スコア（独自算出の注目度）: 22.92789455838942
License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
Abstract: Differential dynamic programming (DDP) is a direct single shooting method for trajectory optimization. Its efficiency derives from the exploitation of temporal structure (inherent to optimal control problems) and explicit roll-out/integration of the system dynamics. However, it suffers from numerical instability and, when compared to direct multiple shooting methods, it has limited initialization options (allows initialization of controls, but not of states) and lacks proper handling of control constraints. In this work, we tackle these issues with a feasibility-driven approach that regulates the dynamic feasibility during the numerical optimization and ensures control limits. Our feasibility search emulates the numerical resolution of a direct multiple shooting problem with only dynamics constraints. We show that our approach (named BOX-FDDP) has better numerical convergence than BOX-DDP+ (a single shooting method), and that its convergence rate and runtime performance are competitive with state-of-the-art direct transcription formulations solved using the interior point and active set algorithms available in KNITRO. We further show that BOX-FDDP decreases the dynamic feasibility error monotonically--as in state-of-the-art nonlinear programming algorithms. We demonstrate the benefits of our approach by generating complex and athletic motions for quadruped and humanoid robots. Finally, we highlight that BOX-FDDP is suitable for model predictive control in legged robots.
Abstract（参考訳）: 微分動的プログラミング(DDP)は、軌道最適化のための直接単射法である。その効率は、(最適制御問題への)時間的構造の導入と、システムダイナミクスの明示的なロールアウト/統合に由来する。しかし、数値的な不安定さに苦しめられ、直接多重射撃法と比較すると、初期化オプション(制御の初期化は許されるが、状態は許さない)が制限され、制御制約の適切な処理が欠如している。本研究では,数値最適化時の動的実現性を制御し,制御限界を確実にする実現可能性駆動手法を用いて,これらの課題に取り組む。我々の実現可能性探索は、動的制約のみで直接多重射撃問題の数値解をエミュレートする。提案手法(BOX-FDDP)は,BOX-DDP+よりも数値収束性が高く,その収束率と実行性能は,内部点とKNITROで利用可能な能動集合アルゴリズムを用いて解決された最先端の直接転写法と競合することを示す。さらに、BOX-FDDPは、最先端非線形プログラミングアルゴリズムのように、動的実行可能性誤差を単調に減少させることを示す。本研究では,四足歩行ロボットとヒューマノイドロボットの複合運動と運動運動の生成によるアプローチの利点を実証する。最後に,BOX-FDDPが脚ロボットのモデル予測制御に適していることを強調する。

関連論文リスト

Reparameterization Flow Policy Optimization [35.59197802340267]
フローポリシーは、差別化可能なODE統合を通じてアクションを生成する。 RFOは、フロー生成プロセスとシステムダイナミクスを共同でバックプロパゲーションすることで、ポリシー勾配を計算する。 RFOは最先端のベースラインの報酬として約2ドルを達成している。
論文参考訳（メタデータ） (2026-02-03T13:22:08Z)
Discrete-Guided Diffusion for Scalable and Safe Multi-Robot Motion Planning [56.240199425429445]
マルチロボット運動計画(MPMP)は、共有された連続作業空間で動作する複数のロボットのための軌道を生成する。離散マルチエージェント探索(MAPF)法は,その拡張性から広く採用されているが,粗い離散化の軌道品質は高い。本稿では、制約付き生成拡散モデルを用いた離散MAPF解法を導入することにより、2つのアプローチの限界に対処する。
論文参考訳（メタデータ） (2025-08-27T17:59:36Z)
Physics-Informed Neural Networks for Control of Single-Phase Flow Systems Governed by Partial Differential Equations [4.776073133338117]
物理インフォームド・ニューラルネット・フォー・コントロール(PINC)フレームワークを拡張して,ニューラルネットワークと物理保存法則を統合する。 PDEのPINCモデルは、幅広い制御入力に対する平衡解を学習する定常ネットワークと、時間変化境界条件下で動的応答をキャプチャする過渡的ネットワークの2段階に構成されている。本研究では,物理法則のみを用いてトレーニングされたPINCモデルを用いて,流れのダイナミクスを正確に表現し,リアルタイム制御が可能であることを実証し,数値実験により本手法の有効性を検証した。
論文参考訳（メタデータ） (2025-06-06T15:50:19Z)
Diffusion Predictive Control with Constraints [51.91057765703533]
制約付き拡散予測制御(DPCC) トレーニングデータから逸脱可能な、明示的な状態と行動制約を持つ拡散制御アルゴリズム。 DPCCは,学習した制御タスクの性能を維持しつつ,新しいテスト時間制約を満たす上で,既存の手法よりも優れるロボットマニピュレータのシミュレーションを通して示す。
論文参考訳（メタデータ） (2024-12-12T15:10:22Z)
On the Boundary Feasibility for PDE Control with Neural Operators [7.537923263907072]
本稿では,境界出力の軌道方向の制約満足度を確実にするために,一般神経境界制御障壁関数(BCBF)を導入する。境界制御入力から出力軌道への伝達関数をモデル化したニューラル演算子を用いて、BCFの変化は入力境界の変化に線形に依存することを示す。双曲型, 放物型, ナビエ・ストークスPDE動的環境下での実験により, 提案手法の有効性が検証された。
論文参考訳（メタデータ） (2024-11-23T20:15:51Z)
Custom Non-Linear Model Predictive Control for Obstacle Avoidance in Indoor and Outdoor Environments [0.0]
本稿では,DJI行列100のための非線形モデル予測制御(NMPC)フレームワークを提案する。このフレームワークは様々なトラジェクトリタイプをサポートし、厳密な操作の精度を制御するためにペナルティベースのコスト関数を採用している。
論文参考訳（メタデータ） (2024-10-03T17:50:19Z)
Integrating DeepRL with Robust Low-Level Control in Robotic Manipulators for Non-Repetitive Reaching Tasks [0.24578723416255746]
ロボット工学では、現代の戦略は学習に基づくもので、複雑なブラックボックスの性質と解釈可能性の欠如が特徴である。本稿では, 深部強化学習(DRL)に基づく衝突のない軌道プランナと, 自動調整型低レベル制御戦略を統合することを提案する。
論文参考訳（メタデータ） (2024-02-04T15:54:03Z)
Safe Neural Control for Non-Affine Control Systems with Differentiable Control Barrier Functions [58.19198103790931]
本稿では,非アフィン制御系における安全クリティカル制御の問題に対処する。制御バリア関数(CBF)を用いて,状態制約と制御制約の2次コストの最適化を2次プログラムのシーケンス(QP)にサブ最適化できることが示されている。我々は,高次CBFをニューラル常微分方程式に基づく学習モデルに差分CBFとして組み込んで,非アフィン制御系の安全性を保証する。
論文参考訳（メタデータ） (2023-09-06T05:35:48Z)
OSCAR: Data-Driven Operational Space Control for Adaptive and Robust Robot Manipulation [50.59541802645156]
オペレーショナル・スペース・コントロール(OSC)は、操作のための効果的なタスクスペース・コントローラとして使われてきた。本稿では,データ駆動型OSCのモデル誤差を補償するOSC for Adaptation and Robustness (OSCAR)を提案する。本手法は,様々なシミュレーション操作問題に対して評価し,制御器のベースラインの配列よりも大幅に改善されていることを示す。
論文参考訳（メタデータ） (2021-10-02T01:21:38Z)
Identification and Avoidance of Static and Dynamic Obstacles on Point Cloud for UAVs Navigation [7.14505983271756]
クラウド入力のみを点とする静的障害と動的障害を区別する手法を提案する。計算効率の良い障害物回避運動計画手法を提案し, 改良された相対速度法と一致している。このアプローチは、同じフレームワークの静的障害と動的障害の両方を避けることができる。
論文参考訳（メタデータ） (2021-05-14T02:44:18Z)
Control of Stochastic Quantum Dynamics with Differentiable Programming [0.0]
微分可能プログラミングに基づく制御スキームの自動設計のためのフレームワークを提案する。このアプローチを、ホモジエン検出を受けるクビットの状態準備と安定化に適用する。その結果、信号と雑音の比が低いにもかかわらず、平均忠実度が約85%の目標状態へのキュービットの準備と安定化をコントローラに教えることができる。
論文参考訳（メタデータ） (2021-01-04T19:00:03Z)
Gaussian Process-based Min-norm Stabilizing Controller for Control-Affine Systems with Uncertain Input Effects and Dynamics [90.81186513537777]
本稿では,この問題の制御・アフィン特性を捉えた新しい化合物カーネルを提案する。この結果の最適化問題は凸であることを示し、ガウス過程に基づく制御リャプノフ関数第二次コーンプログラム(GP-CLF-SOCP)と呼ぶ。
論文参考訳（メタデータ） (2020-11-14T01:27:32Z)
Online Reinforcement Learning Control by Direct Heuristic Dynamic Programming: from Time-Driven to Event-Driven [80.94390916562179]
時間駆動学習は、新しいデータが到着すると予測モデルのパラメータを継続的に更新する機械学習手法を指す。ノイズなどの重要なシステムイベントによる時間駆動型dHDPの更新を防止することが望ましい。イベント駆動型dHDPアルゴリズムは,従来の時間駆動型dHDPと比較して動作することを示す。
論文参考訳（メタデータ） (2020-06-16T05:51:25Z)
Optimization-driven Deep Reinforcement Learning for Robust Beamforming in IRS-assisted Wireless Communications [54.610318402371185]
Intelligent Reflecting Surface (IRS)は、マルチアンテナアクセスポイント(AP)から受信機へのダウンリンク情報伝達を支援する有望な技術である。我々は、APのアクティブビームフォーミングとIRSのパッシブビームフォーミングを共同最適化することで、APの送信電力を最小化する。過去の経験からビームフォーミング戦略に適応できる深層強化学習(DRL)手法を提案する。
論文参考訳（メタデータ） (2020-05-25T01:42:55Z)
Guided Constrained Policy Optimization for Dynamic Quadrupedal Robot Locomotion [78.46388769788405]
我々は,制約付きポリシー最適化(CPPO)の実装に基づくRLフレームワークであるGCPOを紹介する。誘導制約付きRLは所望の最適値に近い高速収束を実現し,正確な報酬関数チューニングを必要とせず,最適かつ物理的に実現可能なロボット制御動作を実現することを示す。
論文参考訳（メタデータ） (2020-02-22T10:15:53Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。