論文の概要: Deep polytopic autoencoders for low-dimensional linear parameter-varying approximations and nonlinear feedback design
- arxiv url: http://arxiv.org/abs/2403.18044v1
- Date: Tue, 26 Mar 2024 18:57:56 GMT
- ステータス: 処理完了
- システム内更新日: 2024-03-28 21:14:58.251906
- Title: Deep polytopic autoencoders for low-dimensional linear parameter-varying approximations and nonlinear feedback design
- Title(参考訳): 低次元線形パラメータ変動近似のための深層ポリトピックオートエンコーダと非線形フィードバック設計
- Authors: Jan Heiland, Yongho Kim, Steffen W. R. Werner,
- Abstract要約: 制御用多目的オートエンコーダを開発した。
非線形系のLPV近似の観点から, 標準線形アプローチよりも優れた性能を示す。
- 参考スコア(独自算出の注目度): 0.9187159782788578
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Polytopic autoencoders provide low-dimensional parametrizations of states in a polytope. For nonlinear PDEs, this is readily applied to low-dimensional linear parameter-varying (LPV) approximations as they have been exploited for efficient nonlinear controller design via series expansions of the solution to the state-dependent Riccati equation. In this work, we develop a polytopic autoencoder for control applications and show how it outperforms standard linear approaches in view of LPV approximations of nonlinear systems and how the particular architecture enables higher order series expansions at little extra computational effort. We illustrate the properties and potentials of this approach to computational nonlinear controller design for large-scale systems with a thorough numerical study.
- Abstract(参考訳): ポリトープオートエンコーダは、ポリトープの状態の低次元パラメトリゼーションを提供する。
非線形PDEに対して、これは低次元線形パラメータ変化(LPV)近似に容易に適用でき、状態依存リカティ方程式への解の直列展開を通じて効率的な非線形コントローラ設計に利用されてきた。
本研究では,制御用多目的オートエンコーダを開発し,非線形系のLPV近似の観点から,標準線形アプローチよりも優れた性能を示し,そのアーキテクチャにより,余分な計算作業で高次級数展開が可能となることを示す。
本稿では,大規模システムの非線形制御系設計における本手法の特性と可能性について述べる。
関連論文リスト
- Estimation Sample Complexity of a Class of Nonlinear Continuous-time Systems [0.0]
本稿では, 大規模非線形系のパラメータ推定法について述べる。
正規化線形回帰を用いて力学を直接反転させることにより未知パラメータを解く手法は、微分フィルタと正規化最小二乗の新たな設計と解析のアイデアに基づいている。
論文 参考訳(メタデータ) (2023-12-08T21:42:11Z) - Pessimistic Nonlinear Least-Squares Value Iteration for Offline Reinforcement Learning [53.97335841137496]
非線形関数近似を用いたオフラインRLにおけるPNLSVI(Pessimistic Least-Square Value Iteration)と呼ばれるオラクル効率のアルゴリズムを提案する。
本アルゴリズムは,関数クラスの複雑性に強く依存する後悔境界を享受し,線形関数近似に特化して最小限のインスタンス依存後悔を実現する。
論文 参考訳(メタデータ) (2023-10-02T17:42:01Z) - Discrete-Time Nonlinear Feedback Linearization via Physics-Informed
Machine Learning [0.0]
非線形システムのフィードバック線形化のための物理インフォームド機械学習手法を提案する。
提案したPIMLは従来の数値実装よりも優れていることを示す。
論文 参考訳(メタデータ) (2023-03-15T19:03:23Z) - Convolutional Autoencoders, Clustering and POD for Low-dimensional
Parametrization of Navier-Stokes Equations [1.160208922584163]
非線形エンコーダとアフィン線形デコーダからなる畳み込みオートエンコーダ(CAE)を提案する。
提案手法は, 圧縮不能なNavier-Stokes方程式をモデルとした2つのシリンダーウェイクシナリオにおける標準POD手法と比較した。
論文 参考訳(メタデータ) (2023-02-02T18:12:08Z) - Linear Convergence of Natural Policy Gradient Methods with Log-Linear
Policies [115.86431674214282]
我々は、無限水平割引マルコフ決定過程を考察し、自然政策勾配(NPG)とQ-NPG法の収束率を対数線形ポリシークラスで検討する。
両手法が線形収束率と $mathcalO (1/epsilon2)$サンプル複雑度を, 単純で非適応的な幾何的に増加するステップサイズを用いて達成できることを示す。
論文 参考訳(メタデータ) (2022-10-04T06:17:52Z) - Sample Efficient Reinforcement Learning In Continuous State Spaces: A
Perspective Beyond Linearity [50.38337893712897]
線形性を仮定しないMDP上の構造条件であるEPW(Effective Planning Window)条件を導入する。
EPW条件は、この条件を満たすMDPを確実に解くアルゴリズムを提供することで、サンプル効率のよいRLを許容することを示した。
また, EPW のような条件の必要性も示し, わずかに非線形な単純な MDP を効率的にサンプリングできないことを示した。
論文 参考訳(メタデータ) (2021-06-15T00:06:59Z) - Sample-Efficient Reinforcement Learning Is Feasible for Linearly
Realizable MDPs with Limited Revisiting [60.98700344526674]
線形関数表現のような低複雑度モデルがサンプル効率のよい強化学習を可能にする上で重要な役割を果たしている。
本稿では,オンライン/探索的な方法でサンプルを描画するが,制御不能な方法で以前の状態をバックトラックし,再訪することができる新しいサンプリングプロトコルについて検討する。
この設定に合わせたアルゴリズムを開発し、特徴次元、地平線、逆の準最適ギャップと実際にスケールするサンプル複雑性を実現するが、状態/作用空間のサイズではない。
論文 参考訳(メタデータ) (2021-05-17T17:22:07Z) - POD-DL-ROM: enhancing deep learning-based reduced order models for
nonlinear parametrized PDEs by proper orthogonal decomposition [0.0]
深層学習に基づく還元順序モデル(DL-ROM)は,従来の還元順序モデル(ROM)で共有される共通制限を克服するために最近提案されている。
本稿では, DL-ROMの高価なトレーニング段階を回避するために, (i) PODによる事前次元化を行い, (ii) 多要素事前学習段階に依存する方法を提案する。
提案したPOD-DL-ROMは、複数の(スカラーおよびベクトル、線形および非線形の両方)時間依存パラメタライズPDEで試験される。
論文 参考訳(メタデータ) (2021-01-28T07:34:15Z) - LQF: Linear Quadratic Fine-Tuning [114.3840147070712]
本稿では,非線形微調整に匹敵する性能を実現する事前学習モデルの線形化手法を提案する。
LQFはアーキテクチャの単純な変更、損失関数、そして一般的に分類に使用される最適化で構成されている。
論文 参考訳(メタデータ) (2020-12-21T06:40:20Z) - Pushing the Envelope of Rotation Averaging for Visual SLAM [69.7375052440794]
視覚SLAMシステムのための新しい最適化バックボーンを提案する。
従来の単分子SLAMシステムの精度, 効率, 堅牢性を向上させるために, 平均化を活用している。
我々のアプローチは、公開ベンチマークの最先端技術に対して、同等の精度で最大10倍高速に表示することができる。
論文 参考訳(メタデータ) (2020-11-02T18:02:26Z) - A comprehensive deep learning-based approach to reduced order modeling
of nonlinear time-dependent parametrized PDEs [0.0]
線形および非線形時間依存パラメタライズPDEのためのDL-ROMを構築する方法を示す。
数値的な結果は、PDE解多様体の内在次元と次元が等しいDL-ROMがパラメタライズされたPDEの解を近似できることを示している。
論文 参考訳(メタデータ) (2020-01-12T21:18:18Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。