論文の概要: Deep polytopic autoencoders for low-dimensional linear parameter-varying approximations and nonlinear feedback design
- arxiv url: http://arxiv.org/abs/2403.18044v2
- Date: Thu, 23 Jan 2025 02:28:53 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-01-24 15:54:57.837604
- Title: Deep polytopic autoencoders for low-dimensional linear parameter-varying approximations and nonlinear feedback design
- Title(参考訳): 低次元線形パラメータ変動近似のための深層ポリトピックオートエンコーダと非線形フィードバック設計
- Authors: Jan Heiland, Yongho Kim, Steffen W. R. Werner,
- Abstract要約: ポリトープオートエンコーダは、ポリトープの状態の低次元次元パラメトリゼーションを提供する。
非線形PDEの場合、これは低次元線形パラメータ変動(LPV)近似に容易に適用できる。
- 参考スコア(独自算出の注目度): 0.9187159782788578
- License:
- Abstract: Polytopic autoencoders provide low-di\-men\-sion\-al parametrizations of states in a polytope. For nonlinear PDEs, this is readily applied to low-dimensional linear parameter-varying (LPV) approximations as they have been exploited for efficient nonlinear controller design via series expansions of the solution to the state-dependent Riccati equation. In this work, we develop a polytopic autoencoder for control applications and show how it improves on standard linear approaches in view of LPV approximations of nonlinear systems. We discuss how the particular architecture enables exact representation of target states and higher order series expansions of the nonlinear feedback law at little extra computational effort in the online phase and how the linear though high-dimensional and nonstandard Lyapunov equations are efficiently computed during the offline phase. In a numerical study, we illustrate the procedure and how this approach can reliably outperform the standard linear-quadratic regulator design.
- Abstract(参考訳): ポリトープオートエンコーダは、ポリトープの状態の低次元次元次元のパラメトリゼーションを提供する。
非線形PDEに対して、これは低次元線形パラメータ変化(LPV)近似に容易に適用でき、状態依存リカティ方程式への解の直列展開を通じて効率的な非線形コントローラ設計に利用されてきた。
本研究では,制御用多目的オートエンコーダを開発し,非線形システムのLPV近似の観点から,標準的な線形アプローチの改善方法を示す。
本稿では, オンライン相における非線形フィードバック法則の厳密な表現と高次系列展開を, オンライン相における計算量が少なく, オフライン相における線形だが高次元かつ非標準のリアプノフ方程式の効率的な計算方法について論じる。
数値解析において、この手法が標準線形四元数レギュレータ設計を確実に上回る方法と方法を説明する。
関連論文リスト
- Estimation Sample Complexity of a Class of Nonlinear Continuous-time Systems [0.0]
本稿では, 大規模非線形系のパラメータ推定法について述べる。
正規化線形回帰を用いて力学を直接反転させることにより未知パラメータを解く手法は、微分フィルタと正規化最小二乗の新たな設計と解析のアイデアに基づいている。
論文 参考訳(メタデータ) (2023-12-08T21:42:11Z) - Pessimistic Nonlinear Least-Squares Value Iteration for Offline Reinforcement Learning [53.97335841137496]
非線形関数近似を用いたオフラインRLにおけるPNLSVI(Pessimistic Least-Square Value Iteration)と呼ばれるオラクル効率のアルゴリズムを提案する。
本アルゴリズムは,関数クラスの複雑性に強く依存する後悔境界を享受し,線形関数近似に特化して最小限のインスタンス依存後悔を実現する。
論文 参考訳(メタデータ) (2023-10-02T17:42:01Z) - Discrete-Time Nonlinear Feedback Linearization via Physics-Informed
Machine Learning [0.0]
非線形システムのフィードバック線形化のための物理インフォームド機械学習手法を提案する。
提案したPIMLは従来の数値実装よりも優れていることを示す。
論文 参考訳(メタデータ) (2023-03-15T19:03:23Z) - Convolutional Autoencoders, Clustering and POD for Low-dimensional
Parametrization of Navier-Stokes Equations [1.160208922584163]
非線形エンコーダとアフィン線形デコーダからなる畳み込みオートエンコーダ(CAE)を提案する。
提案手法は, 圧縮不能なNavier-Stokes方程式をモデルとした2つのシリンダーウェイクシナリオにおける標準POD手法と比較した。
論文 参考訳(メタデータ) (2023-02-02T18:12:08Z) - Linear Convergence of Natural Policy Gradient Methods with Log-Linear
Policies [115.86431674214282]
我々は、無限水平割引マルコフ決定過程を考察し、自然政策勾配(NPG)とQ-NPG法の収束率を対数線形ポリシークラスで検討する。
両手法が線形収束率と $mathcalO (1/epsilon2)$サンプル複雑度を, 単純で非適応的な幾何的に増加するステップサイズを用いて達成できることを示す。
論文 参考訳(メタデータ) (2022-10-04T06:17:52Z) - Sample Efficient Reinforcement Learning In Continuous State Spaces: A
Perspective Beyond Linearity [50.38337893712897]
線形性を仮定しないMDP上の構造条件であるEPW(Effective Planning Window)条件を導入する。
EPW条件は、この条件を満たすMDPを確実に解くアルゴリズムを提供することで、サンプル効率のよいRLを許容することを示した。
また, EPW のような条件の必要性も示し, わずかに非線形な単純な MDP を効率的にサンプリングできないことを示した。
論文 参考訳(メタデータ) (2021-06-15T00:06:59Z) - Sample-Efficient Reinforcement Learning Is Feasible for Linearly
Realizable MDPs with Limited Revisiting [60.98700344526674]
線形関数表現のような低複雑度モデルがサンプル効率のよい強化学習を可能にする上で重要な役割を果たしている。
本稿では,オンライン/探索的な方法でサンプルを描画するが,制御不能な方法で以前の状態をバックトラックし,再訪することができる新しいサンプリングプロトコルについて検討する。
この設定に合わせたアルゴリズムを開発し、特徴次元、地平線、逆の準最適ギャップと実際にスケールするサンプル複雑性を実現するが、状態/作用空間のサイズではない。
論文 参考訳(メタデータ) (2021-05-17T17:22:07Z) - POD-DL-ROM: enhancing deep learning-based reduced order models for
nonlinear parametrized PDEs by proper orthogonal decomposition [0.0]
深層学習に基づく還元順序モデル(DL-ROM)は,従来の還元順序モデル(ROM)で共有される共通制限を克服するために最近提案されている。
本稿では, DL-ROMの高価なトレーニング段階を回避するために, (i) PODによる事前次元化を行い, (ii) 多要素事前学習段階に依存する方法を提案する。
提案したPOD-DL-ROMは、複数の(スカラーおよびベクトル、線形および非線形の両方)時間依存パラメタライズPDEで試験される。
論文 参考訳(メタデータ) (2021-01-28T07:34:15Z) - LQF: Linear Quadratic Fine-Tuning [114.3840147070712]
本稿では,非線形微調整に匹敵する性能を実現する事前学習モデルの線形化手法を提案する。
LQFはアーキテクチャの単純な変更、損失関数、そして一般的に分類に使用される最適化で構成されている。
論文 参考訳(メタデータ) (2020-12-21T06:40:20Z) - Pushing the Envelope of Rotation Averaging for Visual SLAM [69.7375052440794]
視覚SLAMシステムのための新しい最適化バックボーンを提案する。
従来の単分子SLAMシステムの精度, 効率, 堅牢性を向上させるために, 平均化を活用している。
我々のアプローチは、公開ベンチマークの最先端技術に対して、同等の精度で最大10倍高速に表示することができる。
論文 参考訳(メタデータ) (2020-11-02T18:02:26Z) - A comprehensive deep learning-based approach to reduced order modeling
of nonlinear time-dependent parametrized PDEs [0.0]
線形および非線形時間依存パラメタライズPDEのためのDL-ROMを構築する方法を示す。
数値的な結果は、PDE解多様体の内在次元と次元が等しいDL-ROMがパラメタライズされたPDEの解を近似できることを示している。
論文 参考訳(メタデータ) (2020-01-12T21:18:18Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。