論文の概要: Co-Learning Port-Hamiltonian Systems and Optimal Energy-Shaping Control
- arxiv url: http://arxiv.org/abs/2604.26172v1
- Date: Tue, 28 Apr 2026 23:27:10 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-04-30 15:59:36.196249
- Title: Co-Learning Port-Hamiltonian Systems and Optimal Energy-Shaping Control
- Title(参考訳): 共学習型ポート・ハミルトンシステムと最適エネルギー形状制御
- Authors: Ankur Kamboj, Biswadip Dey, Vaibhav Srivastava,
- Abstract要約: 我々は、軌道データからポート・ハミルトン系(pH)のエネルギー変換制御のための物理インフォームド学習フレームワークを開発した。
提案手法は,pHシステムモデルとEB-PBC(Energy-balancing Passivity-based controller)を協調して,ポリシ対応データ収集の最適化を行う。
- 参考スコア(独自算出の注目度): 1.7906055170287054
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: We develop a physics-informed learning framework for energy-shaping control of port-Hamiltonian (pH) systems from trajectory data. The proposed approach {co-learns} a pH system model and an optimal energy-balancing passivity-based controller (EB-PBC) through alternating optimization with policy-aware data collection. At each iteration, the system model is refined using trajectory data collected under the current control policy, and the controller is re-optimized on the updated model. Both components are parameterized by neural networks that embed the pH {dynamics} and EB-PBC structure, ensuring interpretability in terms of energy {interactions}. The learned controller renders the closed-loop system inherently passive and provably stable, and exploits passive plant dynamics without canceling the natural potential. A dissipation regularization enforces strict energy decay during training, thereby enhancing robustness to sim-to-real gaps. The proposed framework is validated on state-regulation and swing-up tasks for planar and torsional pendulum systems.
- Abstract(参考訳): 我々は、軌道データからポート・ハミルトン系(pH)のエネルギー変換制御のための物理インフォームド学習フレームワークを開発した。
提案手法は,pHシステムモデルとEB-PBC(Energy-balancing Passivity-based controller)を政策対応データ収集と交互に最適化する手法である。
各イテレーションにおいて、現在の制御ポリシーに基づいて収集された軌跡データを用いてシステムモデルを洗練し、更新されたモデルに基づいてコントローラを再最適化する。
両方のコンポーネントは、pH {dynamics} と EB-PBC 構造を埋め込んだニューラルネットワークによってパラメータ化され、エネルギー {interaction} の観点で解釈可能性を保証する。
学習したコントローラは、本質的に受動的で確実に安定なクローズドループシステムをレンダリングし、自然電位をキャンセルすることなく受動的植物力学を利用する。
散逸正則化は、訓練中に厳格なエネルギー減衰を強制し、シム・トゥ・リアルギャップに対する堅牢性を高める。
提案手法は,平面およびねじり振り子系の状態制御および揺らぎのタスクに対して検証される。
関連論文リスト
- Differentiable Modeling for Low-Inertia Grids: Benchmarking PINNs, NODEs, and DP for Identification and Control of SMIB System [17.96236104895915]
本稿では、電力系統力学のモデリング、識別、制御のための異なる微分可能プログラミングパラダイムの比較研究を行う。
軌道外挿,パラメータ推定,線形擬似レギュレータ(LQR)合成における性能評価を行った。
我々の結果は、データ駆動の柔軟性と物理的構造との根本的なトレードオフを強調します。
論文 参考訳(メタデータ) (2026-02-10T11:22:59Z) - On the Generalization of Data-Assisted Control in port-Hamiltonian Systems (DAC-pH) [0.0]
本稿ではポート・ハミルトニアン (p$mathcalH$) システムに対する仮説的ハイブリッド制御フレームワークを提案する。
システムの進化は、右手側(RHS)と左手側(LHS)の2つの部分に分けられ、構造的およびパラメトリックな不確実性の両方に対処する散逸・入出力フローである。
論文 参考訳(メタデータ) (2025-06-08T10:44:01Z) - Data-Assimilated Model-Based Reinforcement Learning for Partially Observed Chaotic Flows [3.7960472831772765]
本稿では,部分観測可能性と雑音測定を行うシステムのためのデータ同化モデルベースRL(DA-MBRL)フレームワークを提案する。
状態推定から最適制御戦略を学習するために,非政治アクター批判アルゴリズムを用いる。
この枠組みは倉本-シヴァインスキーシュ方程式で検証され、時間的にカオス的な流れを安定化させる効果を実証した。
論文 参考訳(メタデータ) (2025-04-23T10:12:53Z) - A Dynamic Feedforward Control Strategy for Energy-efficient Building
System Operation [59.56144813928478]
現在の制御戦略と最適化アルゴリズムでは、そのほとんどはリアルタイムフィードバックから情報を受け取ることに依存している。
本稿では,システム制御のためのシステム特性を同時に構築することによる,ダイナミックな事前知識を組み込む,エンジニアフレンドリな制御戦略フレームワークを提案する。
典型的な制御戦略でシステム制御を加熱するケースでテストしたところ、我々のフレームワークは15%の省エネ性を持っていることがわかった。
論文 参考訳(メタデータ) (2023-01-23T09:07:07Z) - Physics-Inspired Temporal Learning of Quadrotor Dynamics for Accurate
Model Predictive Trajectory Tracking [76.27433308688592]
クオーロタのシステムダイナミクスを正確にモデル化することは、アジャイル、安全、安定したナビゲーションを保証する上で非常に重要です。
本稿では,ロボットの経験から,四重項系の力学を純粋に学習するための新しい物理インスパイアされた時間畳み込みネットワーク(PI-TCN)を提案する。
提案手法は,スパース時間的畳み込みと高密度フィードフォワード接続の表現力を組み合わせて,正確なシステム予測を行う。
論文 参考訳(メタデータ) (2022-06-07T13:51:35Z) - Distributed neural network control with dependability guarantees: a
compositional port-Hamiltonian approach [0.0]
大規模なサイバー物理システムは、制御ポリシーが分散されていること、すなわち、ローカルなリアルタイム測定と近隣エージェントとの通信にのみ依存することを要求する。
最近の研究でニューラルネットワーク(NN)分散コントローラのトレーニングが提案されている。
NNコントローラの主な課題は、トレーニング中と後、すなわちクローズドループシステムは不安定であり、勾配の消失と爆発によってトレーニングが失敗する可能性があることである。
論文 参考訳(メタデータ) (2021-12-16T17:37:11Z) - DySMHO: Data-Driven Discovery of Governing Equations for Dynamical
Systems via Moving Horizon Optimization [77.34726150561087]
本稿では,スケーラブルな機械学習フレームワークである移動水平最適化(DySMHO)による動的システムの発見について紹介する。
DySMHOは、基底関数の大きな辞書から基礎となる支配方程式を逐次学習する。
標準非線形力学系の例は、DySMHOが規則を正確に回復できることを示すために用いられる。
論文 参考訳(メタデータ) (2021-07-30T20:35:03Z) - Robust Value Iteration for Continuous Control Tasks [99.00362538261972]
シミュレーションから物理システムへ制御ポリシを転送する場合、そのポリシは、動作の変動に対して堅牢でなければならない。
本稿では、動的プログラミングを用いて、コンパクトな状態領域上での最適値関数を計算するRobust Fitted Value Iterationを提案する。
より深い強化学習アルゴリズムや非ロバストなアルゴリズムと比較して、ロバストな値の方が頑健であることを示す。
論文 参考訳(メタデータ) (2021-05-25T19:48:35Z) - Data-Driven Optimized Tracking Control Heuristic for MIMO Structures: A
Balance System Case Study [8.035375408614776]
PIDは2入力の2アウトプットバランスシステムで示される。
自己調整型非線形しきい値とニューラルネットワークを統合し、所望の過渡特性と定常特性を妥協する。
ニューラルネットワークは、客観的コスト関数のような重み付き導関数の最適化を訓練する。
論文 参考訳(メタデータ) (2021-04-01T02:00:20Z) - Online Reinforcement Learning Control by Direct Heuristic Dynamic
Programming: from Time-Driven to Event-Driven [80.94390916562179]
時間駆動学習は、新しいデータが到着すると予測モデルのパラメータを継続的に更新する機械学習手法を指す。
ノイズなどの重要なシステムイベントによる時間駆動型dHDPの更新を防止することが望ましい。
イベント駆動型dHDPアルゴリズムは,従来の時間駆動型dHDPと比較して動作することを示す。
論文 参考訳(メタデータ) (2020-06-16T05:51:25Z) - Information Theoretic Model Predictive Q-Learning [64.74041985237105]
本稿では,情報理論的MPCとエントロピー正規化RLとの新たな理論的関連性を示す。
バイアスモデルを利用したQ-ラーニングアルゴリズムを開発した。
論文 参考訳(メタデータ) (2019-12-31T00:29:22Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。