Fugu-MT 論文翻訳(概要): ABC-LMPC: Safe Sample-Based Learning MPC for Stochastic Nonlinear Dynamical Systems with Adjustable Boundary Conditions

論文の概要: ABC-LMPC: Safe Sample-Based Learning MPC for Stochastic Nonlinear Dynamical Systems with Adjustable Boundary Conditions

arxiv url: http://arxiv.org/abs/2003.01410v2
Date: Sat, 16 May 2020 00:03:29 GMT
ステータス: 翻訳完了
システム内更新日: 2022-12-26 23:37:27.449691
Title: ABC-LMPC: Safe Sample-Based Learning MPC for Stochastic Nonlinear Dynamical Systems with Adjustable Boundary Conditions
Title（参考訳）: ABC-LMPC: 可変境界条件をもつ確率非線形力学系のための安全なサンプルベース学習MPC
Authors: Brijen Thananjeyan, Ashwin Balakrishna, Ugo Rosolia, Joseph E. Gonzalez, Aaron Ames, Ken Goldberg
Abstract要約: 本稿では,新しいLMPCアルゴリズムであるadjustable boundary LMPC(ABC-LMPC)を提案する。提案手法は,3つの連続制御タスクの初期および終端条件に適応できることを実験的に実証する。
参考スコア（独自算出の注目度）: 34.44010424789202
License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
Abstract: Sample-based learning model predictive control (LMPC) strategies have recently attracted attention due to their desirable theoretical properties and their good empirical performance on robotic tasks. However, prior analysis of LMPC controllers for stochastic systems has mainly focused on linear systems in the iterative learning control setting. We present a novel LMPC algorithm, Adjustable Boundary Condition LMPC (ABC-LMPC), which enables rapid adaptation to novel start and goal configurations and theoretically show that the resulting controller guarantees iterative improvement in expectation for stochastic nonlinear systems. We present results with a practical instantiation of this algorithm and experimentally demonstrate that the resulting controller adapts to a variety of initial and terminal conditions on 3 stochastic continuous control tasks.
Abstract（参考訳）: サンプルベース学習モデル予測制御(LMPC)戦略は,ロボット作業における望ましい理論的特性と優れた経験的性能から近年注目されている。しかし、確率系におけるLMPCコントローラの事前解析は、反復学習制御設定における線形系に重点を置いている。本稿では,新規な開始・目標設定への迅速な適応を可能にする新しいLMPCアルゴリズムであるadjustable boundary Condition LMPC(ABC-LMPC)を提案する。本稿では,本アルゴリズムの現実的なインスタンス化と,その制御器が3つの確率的連続制御タスクの初期および終端条件に適応できることを実験的に示す。

関連論文リスト

SIT-LMPC: Safe Information-Theoretic Learning Model Predictive Control for Iterative Tasks [2.661015608942385]
本稿では,反復的なタスクに対する安全な情報理論学習モデル予測制御アルゴリズムを提案する。最適性のバランスを保ちつつ安全性を確保するために適応ペナルティ法を開発した。本稿では,SIT-LMPCがシステムの制約を十分に満たしつつ,システム性能を反復的に改善することを示す。
論文参考訳（メタデータ） (2026-02-18T05:13:45Z)
Iterative Tuning of Nonlinear Model Predictive Control for Robotic Manufacturing Tasks [0.44040106718326594]
本稿では,モデル予測制御(NMPC)重み付け行列の自動チューニングのための反復学習フレームワークを提案する。ノルム最適反復学習制御(ILC)にインスパイアされた提案手法は,タスクを繰り返してNMPC QとRを適応的に調整する。その結果,提案手法は準最適追従性能に収束することが示された。
論文参考訳（メタデータ） (2025-12-15T10:30:40Z)
Safe Beyond the Horizon: Efficient Sampling-based MPC with Neural Control Barrier Functions [23.693610702522236]
モデル予測制御(MPC)を実際に使用する場合の一般的な問題は、予測地平線を超えた安全仕様の満足度である。推定最適制御のばらつきを大幅に低減する新しいサンプリング戦略を提案する。結果のNeural Shield-VIMPCコントローラは、既存のサンプリングベースのMPCコントローラと比較して大幅に安全性が向上する。
論文参考訳（メタデータ） (2025-02-20T19:59:11Z)
Parameter-Adaptive Approximate MPC: Tuning Neural-Network Controllers without Retraining [50.00291020618743]
この研究は、大規模なデータセットを再計算し、再トレーニングすることなくオンラインチューニングが可能な、新しいパラメータ適応型AMPCアーキテクチャを導入している。資源制約の厳しいマイクロコントローラ(MCU)を用いた2種類の実カートポールシステムの揺らぎを制御し,パラメータ適応型AMPCの有効性を示す。これらの貢献は、現実世界のシステムにおけるAMPCの実践的応用に向けた重要な一歩である。
論文参考訳（メタデータ） (2024-04-08T20:02:19Z)
Multirotor Ensemble Model Predictive Control I: Simulation Experiments [0.0]
アンサンブル表現されたガウス過程は、初期時間の最適利得を決定するために後方計算を行う。端末制御と制御問題のためのEMPCを構築し、シミュレーション・同一双対研究の制御に適用する。
論文参考訳（メタデータ） (2023-05-22T01:32:17Z)
Neural Lyapunov Differentiable Predictive Control [2.042924346801313]
本稿では、確率的リアプノフに基づく安定性保証を備えた微分可能なプログラミングフレームワークを用いた学習に基づく予測制御手法を提案する。この手法は、安定な力学で状態空間の領域を認証するリアプノフ関数を共同で学習する。
論文参考訳（メタデータ） (2022-05-22T03:52:27Z)
Sparsity in Partially Controllable Linear Systems [56.142264865866636]
本研究では, 部分制御可能な線形力学系について, 基礎となる空間パターンを用いて検討する。最適制御には無関係な状態変数を特徴付ける。
論文参考訳（メタデータ） (2021-10-12T16:41:47Z)
Regret Analysis of Learning-Based MPC with Partially-Unknown Cost Function [5.601217969637838]
探索/探索のトレードオフは、データ駆動および適応制御において固有の課題である。本稿では、最適制御動作の基準として、全てのシステムパラメータの完全な知識を持つ有限水平オラクルコントローラを提案する。我々は,このオラクル有限ホライゾンコントローラに関して,低後悔を達成できる学習ベースのポリシーを開発する。
論文参考訳（メタデータ） (2021-08-04T22:43:51Z)
Controlling nonlinear dynamical systems into arbitrary states using machine learning [77.34726150561087]
機械学習(ML)を活用した,新しい完全データ駆動制御方式を提案する。最近開発されたMLに基づく複雑なシステムの予測機能により、非線形系は任意の初期状態から来る任意の動的対象状態に留まることが証明された。必要なデータ量が少なく,柔軟性の高いコントロールスキームを備えることで,工学から医学まで幅広い応用の可能性について簡単に議論する。
論文参考訳（メタデータ） (2021-02-23T16:58:26Z)
Gaussian Process-based Min-norm Stabilizing Controller for Control-Affine Systems with Uncertain Input Effects and Dynamics [90.81186513537777]
本稿では,この問題の制御・アフィン特性を捉えた新しい化合物カーネルを提案する。この結果の最適化問題は凸であることを示し、ガウス過程に基づく制御リャプノフ関数第二次コーンプログラム(GP-CLF-SOCP)と呼ぶ。
論文参考訳（メタデータ） (2020-11-14T01:27:32Z)
Learning Constrained Adaptive Differentiable Predictive Control Policies With Guarantees [1.1086440815804224]
本稿では,線形システムに対する制約付きニューラルコントロールポリシーの学習方法として,微分可能予測制御(DPC)を提案する。我々は,モデル予測制御(MPC)損失関数の逆伝搬と,微分可能な閉ループ系力学モデルによるペナルティの制約により,直接的な政策勾配を求めるために,自動微分を用いる。
論文参考訳（メタデータ） (2020-04-23T14:24:44Z)
Adaptive Control and Regret Minimization in Linear Quadratic Gaussian (LQG) Setting [91.43582419264763]
我々は不確実性に直面した楽観主義の原理に基づく新しい強化学習アルゴリズムLqgOptを提案する。 LqgOptはシステムのダイナミクスを効率的に探索し、モデルのパラメータを信頼区間まで推定し、最も楽観的なモデルのコントローラをデプロイする。
論文参考訳（メタデータ） (2020-03-12T19:56:38Z)
Information Theoretic Model Predictive Q-Learning [64.74041985237105]
本稿では,情報理論的MPCとエントロピー正規化RLとの新たな理論的関連性を示す。バイアスモデルを利用したQ-ラーニングアルゴリズムを開発した。
論文参考訳（メタデータ） (2019-12-31T00:29:22Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。