論文の概要: Learning To Estimate Regions Of Attraction Of Autonomous Dynamical
Systems Using Physics-Informed Neural Networks
- arxiv url: http://arxiv.org/abs/2111.09930v1
- Date: Thu, 18 Nov 2021 19:58:47 GMT
- ステータス: 処理完了
- システム内更新日: 2021-11-23 04:43:20.421280
- Title: Learning To Estimate Regions Of Attraction Of Autonomous Dynamical
Systems Using Physics-Informed Neural Networks
- Title(参考訳): 物理形ニューラルネットワークを用いた自律力学系のアトラクション領域推定のための学習
- Authors: Cody Scharzenberger, Joe Hays
- Abstract要約: 制御された自律力学系のアトラクション領域(ROA)を推定するためにニューラルネットワークを訓練する。
この安全ネットワークは、提案した制御行動の相対的安全性を定量化し、損傷行為の選択を防止するために使用できる。
今後の研究では、運動学習タスクにおける強化学習エージェントにこの手法を適用する予定である。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: When learning to perform motor tasks in a simulated environment, neural
networks must be allowed to explore their action space to discover new
potentially viable solutions. However, in an online learning scenario with
physical hardware, this exploration must be constrained by relevant safety
considerations in order to avoid damage to the agent's hardware and
environment. We aim to address this problem by training a neural network, which
we will refer to as a "safety network", to estimate the region of attraction
(ROA) of a controlled autonomous dynamical system. This safety network can
thereby be used to quantify the relative safety of proposed control actions and
prevent the selection of damaging actions. Here we present our development of
the safety network by training an artificial neural network (ANN) to represent
the ROA of several autonomous dynamical system benchmark problems. The training
of this network is predicated upon both Lyapunov theory and neural solutions to
partial differential equations (PDEs). By learning to approximate the viscosity
solution to a specially chosen PDE that contains the dynamics of the system of
interest, the safety network learns to approximate a particular function,
similar to a Lyapunov function, whose zero level set is boundary of the ROA. We
train our safety network to solve these PDEs in a semi-supervised manner
following a modified version of the Physics Informed Neural Network (PINN)
approach, utilizing a loss function that penalizes disagreement with the PDE's
initial and boundary conditions, as well as non-zero residual and variational
terms. In future work we intend to apply this technique to reinforcement
learning agents during motor learning tasks.
- Abstract(参考訳): シミュレーション環境でモータータスクを実行することを学ぶとき、ニューラルネットワークは、新たな潜在的ソリューションを発見するために、そのアクション空間を探索することを許さなければならない。
しかし、物理ハードウェアを用いたオンライン学習シナリオでは、エージェントのハードウェアや環境の損傷を避けるために、この探索は関連する安全上の配慮によって制約されなければならない。
我々は、制御された自律力学系のアトラクション(ROA)領域を推定するために、「安全ネットワーク」と呼ぶニューラルネットワークをトレーニングすることで、この問題に対処することを目指している。
これにより、提案した制御行動の相対的安全性を定量化し、損傷行為の選択を防止することができる。
本稿では,複数の自律力学系ベンチマーク問題のroaを表現するために,ニューラルネットワーク(ann)を訓練することにより,安全性ネットワークの開発を行う。
このネットワークのトレーニングは、リアプノフ理論と偏微分方程式(PDE)に対するニューラル解の両方に基づいている。
関心システムの力学を含む特殊選択されたPDEに粘性解を近似することを学ぶことにより、安全ネットワークは、ROAの境界がゼロとなるリャプノフ関数と同様に、特定の関数を近似することを学ぶ。
物理学インフォームドニューラルネットワーク(pinn)アプローチの修正版に従って、pdeの初期条件と境界条件との不一致を罰する損失関数と、非ゼロの残差および変動項を利用して、これらのpdeを半教師付きで解くように安全ネットワークを訓練する。
今後の課題として,運動学習タスクにおける強化学習エージェントに適用する。
関連論文リスト
- ConCerNet: A Contrastive Learning Based Framework for Automated
Conservation Law Discovery and Trustworthy Dynamical System Prediction [82.81767856234956]
本稿では,DNNに基づく動的モデリングの信頼性を向上させるために,ConCerNetという新しい学習フレームワークを提案する。
本手法は, 座標誤差と保存量の両方において, ベースラインニューラルネットワークよりも一貫して優れていることを示す。
論文 参考訳(メタデータ) (2023-02-11T21:07:30Z) - Adversarially Robust Learning for Security-Constrained Optimal Power
Flow [55.816266355623085]
我々は、N-kセキュリティ制約付き最適電力流(SCOPF)の課題に取り組む。
N-k SCOPFは電力網の運用における中核的な問題である。
N-k SCOPF を極小最適化問題とみなす。
論文 参考訳(メタデータ) (2021-11-12T22:08:10Z) - DAE-PINN: A Physics-Informed Neural Network Model for Simulating
Differential-Algebraic Equations with Application to Power Networks [8.66798555194688]
DAE-PINNは非線形微分代数方程式の解軌跡を学習し、シミュレーションするための最初の効果的なディープラーニングフレームワークである。
我々のフレームワークは、ペナルティベースの手法を用いて、DAEを(近似的に)厳しい制約として満たすためにニューラルネットワークを強制する。
DAE-PINNの有効性と精度を3バス電力ネットワークの解軌跡を学習・シミュレーションすることで示す。
論文 参考訳(メタデータ) (2021-09-09T14:30:28Z) - Provably Safe Model-Based Meta Reinforcement Learning: An
Abstraction-Based Approach [3.569867801312134]
本研究では,不確実な非線形力学系に対して,確実に安全なニューラルネットワーク(NN)コントローラをトレーニングする問題を考察する。
私たちのアプローチは、トレーニングフェーズ中にNNコントローラのセットを学ぶことです。
タスクが実行時に利用可能になると、我々のフレームワークはこれらのNNコントローラのサブセットを慎重に選択し、最終的なNNコントローラを構成する。
論文 参考訳(メタデータ) (2021-09-03T00:38:05Z) - Physics-informed attention-based neural network for solving non-linear
partial differential equations [6.103365780339364]
物理情報ニューラルネットワーク(PINN)は、物理プロセスのモデリングにおいて大幅な改善を実現しました。
PINNは単純なアーキテクチャに基づいており、ネットワークパラメータを最適化することで複雑な物理システムの振る舞いを学習し、基礎となるPDEの残余を最小限に抑える。
ここでは、非線形PDEの複雑な振る舞いを学ぶのに、どのネットワークアーキテクチャが最適かという問題に対処する。
論文 参考訳(メタデータ) (2021-05-17T14:29:08Z) - A deep learning theory for neural networks grounded in physics [2.132096006921048]
ニューロモルフィックアーキテクチャ上で大規模で高速で効率的なニューラルネットワークを構築するには、それらを実装および訓練するためのアルゴリズムを再考する必要がある。
私たちのフレームワークは、非常に幅広いモデル、すなわち状態やダイナミクスが変動方程式によって記述されるシステムに適用されます。
論文 参考訳(メタデータ) (2021-03-18T02:12:48Z) - Neural Dynamic Policies for End-to-End Sensorimotor Learning [51.24542903398335]
感覚運動制御における現在の主流パラダイムは、模倣であれ強化学習であれ、生の行動空間で政策を直接訓練することである。
軌道分布空間の予測を行うニューラル・ダイナミック・ポリシー(NDP)を提案する。
NDPは、いくつかのロボット制御タスクにおいて、効率と性能の両面で、これまでの最先端よりも優れている。
論文 参考訳(メタデータ) (2020-12-04T18:59:32Z) - Risk-Averse MPC via Visual-Inertial Input and Recurrent Networks for
Online Collision Avoidance [95.86944752753564]
本稿では,モデル予測制御(MPC)の定式化を拡張したオンライン経路計画アーキテクチャを提案する。
我々のアルゴリズムは、状態推定の共分散を推論するリカレントニューラルネットワーク(RNN)とオブジェクト検出パイプラインを組み合わせる。
本手法のロバスト性は, 複雑な四足歩行ロボットの力学で検証され, ほとんどのロボットプラットフォームに適用可能である。
論文 参考訳(メタデータ) (2020-07-28T07:34:30Z) - Modeling from Features: a Mean-field Framework for Over-parameterized
Deep Neural Networks [54.27962244835622]
本稿では、オーバーパラメータ化ディープニューラルネットワーク(DNN)のための新しい平均場フレームワークを提案する。
このフレームワークでは、DNNは連続的な極限におけるその特徴に対する確率測度と関数によって表現される。
本稿では、標準DNNとResidual Network(Res-Net)アーキテクチャを通してフレームワークを説明する。
論文 参考訳(メタデータ) (2020-07-03T01:37:16Z) - Training spiking neural networks using reinforcement learning [0.0]
本稿では,スパイクニューラルネットワークのトレーニングを容易にするために,生物学的に有望なバックプロパゲーション代替法を提案する。
本研究では,空間的・時間的信用割当問題の解決における強化学習規則の適用可能性を検討することに注力する。
我々は、グリッドワールド、カートポール、マウンテンカーといった従来のRLドメインに適用することで、2つのアプローチを比較し、対比する。
論文 参考訳(メタデータ) (2020-05-12T17:40:36Z) - Learning to Control PDEs with Differentiable Physics [102.36050646250871]
本稿では,ニューラルネットワークが長い時間をかけて複雑な非線形物理系の理解と制御を学べる新しい階層型予測器・相関器手法を提案する。
本手法は,複雑な物理系の理解に成功し,PDEに関わるタスクに対してそれらを制御できることを実証する。
論文 参考訳(メタデータ) (2020-01-21T11:58:41Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。