論文の概要: KEEC: Koopman Embedded Equivariant Control
- arxiv url: http://arxiv.org/abs/2312.01544v3
- Date: Thu, 27 Feb 2025 22:21:09 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-03-03 16:38:44.753504
- Title: KEEC: Koopman Embedded Equivariant Control
- Title(参考訳): KEEC: Koopman Embedded Equivariant Control
- Authors: Xiaoyuan Cheng, Yiming Yang, Xiaohang Tang, Wei Jiang, Yukun Hu,
- Abstract要約: 未知の非線形力学を持つシステムを制御する効率的な方法は、適切な埋め込みや表現を見つけることである。
Koopman Embedded Equivariant Control (KEEC) は、クープマン作用素が潜在力学として近似されるような状態とベクトル場の埋め込みを学習する。
本アルゴリズムは,様々な制御領域で実施した実験において,優れた性能を実現する。
- 参考スコア(独自算出の注目度): 29.738391644702947
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: An efficient way to control systems with unknown nonlinear dynamics is to find an appropriate embedding or representation for simplified approximation (e.g. linearization), which facilitates system identification and control synthesis. Nevertheless, there has been a lack of embedding methods that can guarantee (i) embedding the dynamical system comprehensively, including the vector fields (ODE form) of the dynamics, and (ii) preserving the consistency of control effect between the original and latent space. To address these challenges, we propose Koopman Embedded Equivariant Control (KEEC) to learn an embedding of the states and vector fields such that a Koopman operator is approximated as the latent dynamics. Due to the Koopman operator's linearity, learning the latent vector fields of the dynamics becomes simply solving linear equations. Thus in KEEC, the analytical form of the greedy control policy, which is dependent on the learned differential information of the dynamics and value function, is also simplified. Meanwhile, KEEC preserves the effectiveness of the control policy in the latent space by preserving the metric in two spaces. Our algorithm achieves superior performances in the experiments conducted on various control domains, including the image-based Pendulum, Lorenz-63 and the wave equation. The code is available at https://github.com/yyimingucl/Koopman-Embedded-Equivariant-Control.
- Abstract(参考訳): 未知の非線形力学を持つシステムを制御する効率的な方法は、システムの同定と制御を容易にする簡易近似(例えば線形化)のための適切な埋め込みや表現を見つけることである。
それでも、保証できる埋め込み方法が欠如している。
(i)力学系のベクトル場(ODE形式)を含む力学系を包括的に埋め込み、
二 原空間と潜伏空間との制御効果の整合性を維持すること。
これらの課題に対処するために、クープマン作用素が潜在力学として近似されるような状態とベクトル場の埋め込みを学習するために、クープマン埋め込み同変制御(KEEC)を提案する。
クープマン作用素の線型性のため、力学の潜在ベクトル場を学ぶことは単に線形方程式を解く。
したがって、KEECでは、力学と値関数の学習された微分情報に依存する欲求制御ポリシーの分析形式も単純化される。
一方、KEECは2つの空間で計量を保存することにより、潜在空間における制御ポリシーの有効性を保っている。
このアルゴリズムは、画像ベースの振り子、Lorenz-63、および波動方程式など、様々な制御領域で行われた実験において、優れた性能を実現する。
コードはhttps://github.com/yyimingucl/Koopman-Embedded-Equivariant-Controlで公開されている。
関連論文リスト
- Relaxing Continuous Constraints of Equivariant Graph Neural Networks for Physical Dynamics Learning [39.25135680793105]
離散同変グラフニューラルネットワーク(DEGNN)を提案する。
具体的には、幾何学的特徴を置換不変な埋め込みに変換することによって、このような離散同変メッセージパッシングを構築することができることを示す。
DEGNNはデータ効率が良く、少ないデータで学習でき、観測不能な向きなどのシナリオをまたいで一般化できることを示す。
論文 参考訳(メタデータ) (2024-06-24T03:37:51Z) - Shape Arithmetic Expressions: Advancing Scientific Discovery Beyond Closed-Form Equations [56.78271181959529]
GAM(Generalized Additive Models)は、変数とターゲットの間の非線形関係をキャプチャできるが、複雑な特徴相互作用をキャプチャすることはできない。
本稿では,GAMのフレキシブルな形状関数と,数学的表現に見られる複雑な特徴相互作用を融合させる形状表現算術(SHARE)を提案する。
また、標準制約を超えた表現の透明性を保証するSHAREを構築するための一連のルールを設計する。
論文 参考訳(メタデータ) (2024-04-15T13:44:01Z) - Koopman-Assisted Reinforcement Learning [8.812992091278668]
ベルマン方程式とその連続形式であるハミルトン・ヤコビ・ベルマン方程式(HJB)は、強化学習(RL)と制御理論においてユビキタスである。
本稿では,データ駆動型クープマン演算子と決定過程(MDP)の関連性について検討する。
これらの制約に対処する2つの新しいRLアルゴリズムを開発した。
論文 参考訳(メタデータ) (2024-03-04T18:19:48Z) - Symmetry Preservation in Hamiltonian Systems: Simulation and Learning [0.9208007322096532]
この研究は、ハミルトン系の力学をシミュレートし、学習するための一般的な幾何学的枠組みを示す。
我々は、$G$-不変ラグランジアン部分多様体の構築を通して興味ある写像をシミュレートし、学習することを提案する。
我々の設計は、シンプレクティック幾何学と幾何学力学において重要な技術と概念を活用する。
論文 参考訳(メタデータ) (2023-08-30T21:34:33Z) - Physics-Informed Quantum Machine Learning: Solving nonlinear
differential equations in latent spaces without costly grid evaluations [21.24186888129542]
非線形および多次元微分方程式を解く物理インフォームド量子アルゴリズムを提案する。
DE項の表現である状態間の重なりを測定することにより、格子点上の独立な逐次関数評価を必要としない損失を構築する。
損失が変動的に訓練されると、我々のアプローチは微分可能な量子回路プロトコルと関連付けられる。
論文 参考訳(メタデータ) (2023-08-03T15:38:31Z) - Propagating Kernel Ambiguity Sets in Nonlinear Data-driven Dynamics
Models [3.743859059772078]
非線形データ駆動力学系モデルを考えると、複数のステップで曖昧性セットを前進させるにはどうすればよいのか?
この問題は、データ分散シフトの下で、そのような学習システムモデルの分散ロバストな制御と学習に基づく制御を解決する鍵となる。
そこで我々は,カーネルの最大平均誤差幾何学を用いて,コオプマン演算子とCMEを用いた非線形データ駆動モデルを用いて曖昧性集合を正確に伝播するアルゴリズムを提案する。
論文 参考訳(メタデータ) (2023-04-27T09:38:49Z) - Data-driven End-to-end Learning of Pole Placement Control for Nonlinear
Dynamics via Koopman Invariant Subspaces [37.795752939016225]
クープマン作用素理論に基づくブラックボックス非線形力学系を制御するためのデータ駆動手法を提案する。
制御力学のクープマン作用素の固有値が目標固有値に近いようにポリシーネットワークを訓練する。
提案手法は,モデルレス強化学習やシステム同定によるモデルベース制御よりも優れた性能を示す。
論文 参考訳(メタデータ) (2022-08-16T05:57:28Z) - Equivariant Graph Mechanics Networks with Constraints [83.38709956935095]
本稿では,グラフ力学ネットワーク(GMN)を提案する。
GMNは、一般化された座標により、構造体の前方運動学情報(位置と速度)を表す。
大規模な実験は、予測精度、制約満足度、データ効率の観点から、最先端のGNNと比較してGMNの利点を支持する。
論文 参考訳(メタデータ) (2022-03-12T14:22:14Z) - Deep Koopman Operator with Control for Nonlinear Systems [44.472875714432504]
そこで我々は,Koopman組込み関数とKoopman Operatorを学習するためのエンドツーエンドのディープラーニングフレームワークを提案する。
まず、ニューラルネットワークを用いて埋め込み関数とクープマン演算子をパラメータ化し、Kステップ損失関数でエンドツーエンドに学習する。
次に,制御入力の非線形性をモデル化するために,非線形状態依存制御項を符号化する補助制御ネットワークを設計する。
論文 参考訳(メタデータ) (2022-02-16T11:40:36Z) - Measuring dissimilarity with diffeomorphism invariance [94.02751799024684]
DID(DID)は、幅広いデータ空間に適用可能なペアワイズな相似性尺度である。
我々は、DIDが理論的研究と実用に関係のある特性を享受していることを証明する。
論文 参考訳(メタデータ) (2022-02-11T13:51:30Z) - Towards Data-driven LQR with KoopmanizingFlows [8.133902705930327]
本稿では,線形時間不変モデル(LTI)を連続時間非自律非線形力学のクラスで学習するための新しいフレームワークを提案する。
我々は、有意な持ち上げ座標を同時に学習しながら、制御において線形なクープマン作用素の有限表現を学習する。
論文 参考訳(メタデータ) (2022-01-27T17:02:03Z) - Equivariant vector field network for many-body system modeling [65.22203086172019]
Equivariant Vector Field Network (EVFN) は、新しい同変層と関連するスカラー化およびベクトル化層に基づいて構築されている。
シミュレーションされたニュートン力学系の軌跡を全観測データと部分観測データで予測する手法について検討した。
論文 参考訳(メタデータ) (2021-10-26T14:26:25Z) - Deep Learning Approximation of Diffeomorphisms via Linear-Control
Systems [91.3755431537592]
我々は、制御に線形に依存する$dot x = sum_i=1lF_i(x)u_i$という形の制御系を考える。
対応するフローを用いて、コンパクトな点のアンサンブル上の微分同相写像の作用を近似する。
論文 参考訳(メタデータ) (2021-10-24T08:57:46Z) - Deep Reinforcement Learning for Online Control of Stochastic Partial
Differential Equations [10.746602033809943]
強化学習問題として偏微分方程式を制御する問題を定式化する。
本研究では,高次元状態空間を持つSPDEシステムのオンライン制御のための学習に基づく分散制御手法を提案する。
論文 参考訳(メタデータ) (2021-10-21T16:45:50Z) - Sparsity in Partially Controllable Linear Systems [56.142264865866636]
本研究では, 部分制御可能な線形力学系について, 基礎となる空間パターンを用いて検討する。
最適制御には無関係な状態変数を特徴付ける。
論文 参考訳(メタデータ) (2021-10-12T16:41:47Z) - Geometric and Physical Quantities improve E(3) Equivariant Message
Passing [59.98327062664975]
等変グラフネットワークを一般化する等変グラフニューラルネットワーク(SEGNN)を提案する。
このモデルは、ステアブルで構成され、メッセージと更新機能の両方に幾何学的および物理的情報を組み込むことができる。
計算物理学と化学におけるいくつかの課題において,本手法の有効性を実証する。
論文 参考訳(メタデータ) (2021-10-06T16:34:26Z) - Is Disentanglement enough? On Latent Representations for Controllable
Music Generation [78.8942067357231]
強い生成デコーダが存在しない場合、アンタングル化は必ずしも制御性を意味するものではない。
VAEデコーダに対する潜伏空間の構造は、異なる属性を操作するための生成モデルの能力を高める上で重要な役割を果たす。
論文 参考訳(メタデータ) (2021-08-01T18:37:43Z) - DySMHO: Data-Driven Discovery of Governing Equations for Dynamical
Systems via Moving Horizon Optimization [77.34726150561087]
本稿では,スケーラブルな機械学習フレームワークである移動水平最適化(DySMHO)による動的システムの発見について紹介する。
DySMHOは、基底関数の大きな辞書から基礎となる支配方程式を逐次学習する。
標準非線形力学系の例は、DySMHOが規則を正確に回復できることを示すために用いられる。
論文 参考訳(メタデータ) (2021-07-30T20:35:03Z) - Estimating Koopman operators for nonlinear dynamical systems: a
nonparametric approach [77.77696851397539]
Koopman演算子は非線形系の線形記述を可能にする数学的ツールである。
本稿では,その核となる部分を同一フレームワークのデュアルバージョンとして捉え,それらをカーネルフレームワークに組み込む。
カーネルメソッドとKoopman演算子との強力なリンクを確立し、Kernel関数を通じて後者を推定する。
論文 参考訳(メタデータ) (2021-03-25T11:08:26Z) - Functional Space Analysis of Local GAN Convergence [26.985600125290908]
一般機能空間における対向訓練の局所的ダイナミクスについて検討する。
偏微分方程式の系としてどのように表現できるかを示す。
我々の視点では、GANの安定化によく使われる実践的なトリックについて、いくつかの洞察が得られている。
論文 参考訳(メタデータ) (2021-02-08T18:59:46Z) - Strictly Batch Imitation Learning by Energy-based Distribution Matching [104.33286163090179]
すなわち、強化信号へのアクセスがなく、遷移力学の知識がなく、環境とのさらなる相互作用もない。
1つの解決策は、既存のアルゴリズムをオフライン環境で動作させるために、見習いの学習に適合させることである。
しかし、このようなアプローチは、政治外の評価やオフラインモデルの推定に大きく依存しており、間接的で非効率である可能性がある。
優れたソリューションは、ポリシーを明示的にパラメータ化し、ロールアウトダイナミクスから暗黙的に学習し、完全にオフラインで運用できるべきだ、と私たちは主張する。
論文 参考訳(メタデータ) (2020-06-25T03:27:59Z) - Euclideanizing Flows: Diffeomorphic Reduction for Learning Stable
Dynamical Systems [74.80320120264459]
本研究では、限られた数の人間の実演からそのような動きを学ぶためのアプローチを提案する。
複素運動は安定な力学系のロールアウトとして符号化される。
このアプローチの有効性は、確立されたベンチマーク上での検証と、現実世界のロボットシステム上で収集されたデモによって実証される。
論文 参考訳(メタデータ) (2020-05-27T03:51:57Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。