論文の概要: Incremental Correction in Dynamic Systems Modelled with Neural Networks
for Constraint Satisfaction
- arxiv url: http://arxiv.org/abs/2209.03698v1
- Date: Thu, 8 Sep 2022 10:33:30 GMT
- ステータス: 処理完了
- システム内更新日: 2022-09-09 13:42:29.592079
- Title: Incremental Correction in Dynamic Systems Modelled with Neural Networks
for Constraint Satisfaction
- Title(参考訳): 制約満足度のためのニューラルネットワークを用いた動的システムのインクリメンタル補正
- Authors: Namhoon Cho, Hyo-Sang Shin, Antonios Tsourdos, Davide Amato
- Abstract要約: 提案手法は、その引数の基底値のまわりのダイナミクスを線形化することである。
オンライン更新アプローチは、有限水平制御の全体的なターゲティング精度を高めるのに有用である。
- 参考スコア(独自算出の注目度): 6.729108277517129
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: This study presents incremental correction methods for refining neural
network parameters or control functions entering into a continuous-time dynamic
system to achieve improved solution accuracy in satisfying the interim point
constraints placed on the performance output variables. The proposed approach
is to linearise the dynamics around the baseline values of its arguments, and
then to solve for the corrective input required to transfer the perturbed
trajectory to precisely known or desired values at specific time points, i.e.,
the interim points. Depending on the type of decision variables to adjust,
parameter correction and control function correction methods are developed.
These incremental correction methods can be utilised as a means to compensate
for the prediction errors of pre-trained neural networks in real-time
applications where high accuracy of the prediction of dynamical systems at
prescribed time points is imperative. In this regard, the online update
approach can be useful for enhancing overall targeting accuracy of
finite-horizon control subject to point constraints using a neural policy.
Numerical example demonstrates the effectiveness of the proposed approach in an
application to a powered descent problem at Mars.
- Abstract(参考訳): 本研究では,連続時間力学系に入力されるニューラルネットワークパラメータや制御関数をインクリメンタルに補正し,性能出力変数の中間点制約を満たす解の精度を向上させる手法を提案する。
提案したアプローチは、その引数の基底値のまわりのダイナミクスを線形化し、摂動軌跡を特定の時点、すなわち中間点において正確に既知の所望の所望の値に転送するために必要な補正入力を解くことである。
調整する決定変数の種類によってパラメータ補正と制御関数補正法が開発される。
これらの漸進補正方法は、所定の時点における力学系の予測精度が高いリアルタイムアプリケーションにおいて、事前訓練されたニューラルネットワークの予測誤差を補償する手段として利用することができる。
この点において、オンライン更新アプローチは、神経ポリシーを用いて点制約を受ける有限ホライゾン制御の全体的なターゲティング精度を向上させるのに有用である。
数値例は、火星の動力降下問題への応用における提案手法の有効性を示す。
関連論文リスト
- Continual Learning via Sequential Function-Space Variational Inference [65.96686740015902]
連続学習を逐次関数空間変動推論として定式化した目的を提案する。
ニューラルネットワークの予測を直接正規化する目的と比較して、提案した目的はより柔軟な変動分布を可能にする。
タスクシーケンスの範囲で、逐次関数空間変動推論によってトレーニングされたニューラルネットワークは、関連する手法でトレーニングされたネットワークよりも予測精度が良いことを実証した。
論文 参考訳(メタデータ) (2023-12-28T18:44:32Z) - Achieving Constraints in Neural Networks: A Stochastic Augmented
Lagrangian Approach [49.1574468325115]
DNN(Deep Neural Networks)の正規化は、一般化性の向上とオーバーフィッティングの防止に不可欠である。
制約付き最適化問題としてトレーニングプロセスのフレーミングによるDNN正規化に対する新しいアプローチを提案する。
我々はAugmented Lagrangian (SAL) 法を用いて、より柔軟で効率的な正規化機構を実現する。
論文 参考訳(メタデータ) (2023-10-25T13:55:35Z) - Neural ODEs as Feedback Policies for Nonlinear Optimal Control [1.8514606155611764]
ニューラルネットワークをパラメータ化した微分方程式として連続時間力学をモデル化するために、ニューラル常微分方程式(ニューラルODE)を用いる。
本稿では,一般非線形最適制御問題の解法としてニューラル・オードとして提案するニューラル・コントロール・ポリシーを提案する。
論文 参考訳(メタデータ) (2022-10-20T13:19:26Z) - Adaptive Self-supervision Algorithms for Physics-informed Neural
Networks [59.822151945132525]
物理情報ニューラルネットワーク(PINN)は、損失関数のソフト制約として問題領域からの物理的知識を取り入れている。
これらのモデルの訓練性に及ぼす座標点の位置の影響について検討した。
モデルがより高い誤りを犯している領域に対して、より多くのコロケーションポイントを段階的に割り当てる適応的コロケーション方式を提案する。
論文 参考訳(メタデータ) (2022-07-08T18:17:06Z) - Automatic Debiased Machine Learning for Dynamic Treatment Effects and
General Nested Functionals [23.31865419578237]
我々は、自動脱バイアス機械学習の考え方を動的治療体制に拡張し、より一般的にネストされた機能に拡張する。
離散的な処理を施した動的処理系に対する多重ロバストな式は、ネスト平均回帰のリース表現器のキャラクタリゼーションにより再定式化可能であることを示す。
論文 参考訳(メタデータ) (2022-03-25T19:54:17Z) - Neural Solvers for Fast and Accurate Numerical Optimal Control [12.80824586913772]
本稿では,固定的な計算予算が与えられた場合,最適化された制御ポリシーの品質を向上させるための技術を提供する。
我々は、微分方程式解法とニューラルネットワークをハイブリダイズする超解法アプローチにより、上記のことを達成した。
論文 参考訳(メタデータ) (2022-03-13T10:46:50Z) - On the adaptation of recurrent neural networks for system identification [2.5234156040689237]
本稿では,動的システムのリカレントニューラルネットワーク(RNN)モデルの高速かつ効率的な適応を可能にするトランスファー学習手法を提案する。
その後、システムダイナミクスが変化すると仮定され、摂動系における名目モデルの性能が不可避的に低下する。
ミスマッチに対処するため、新しい動的状態からの新鮮なデータに基づいてトレーニングされた付加的補正項でモデルを拡張する。
論文 参考訳(メタデータ) (2022-01-21T12:04:17Z) - Automating Control of Overestimation Bias for Continuous Reinforcement
Learning [65.63607016094305]
バイアス補正を導くためのデータ駆動型手法を提案する。
我々は、最先端の連続制御アルゴリズムであるTrncated Quantile Criticsにおいて、その効果を実証する。
論文 参考訳(メタデータ) (2021-10-26T09:27:12Z) - Better Training using Weight-Constrained Stochastic Dynamics [0.0]
我々は、トレーニングを通してディープニューラルネットワークのパラメータ空間を制御するために制約を用いる。
カスタマイズされた適切な設計の制約を使用することで、消滅/展開の問題を減らすことができる。
グラデーションランゲヴィンフレームワークに制約を効率的に組み込むための一般的なアプローチを提供する。
論文 参考訳(メタデータ) (2021-06-20T14:41:06Z) - Adaptive Gradient Method with Resilience and Momentum [120.83046824742455]
レジリエンスとモメンタム(AdaRem)を用いた適応勾配法を提案する。
AdaRemは、過去の1つのパラメータの変化方向が現在の勾配の方向と一致しているかどうかに応じてパラメータワイズ学習率を調整する。
本手法は,学習速度とテスト誤差の観点から,従来の適応学習率に基づくアルゴリズムよりも優れていた。
論文 参考訳(メタデータ) (2020-10-21T14:49:00Z) - Logarithmic Regret Bound in Partially Observable Linear Dynamical
Systems [91.43582419264763]
部分的に観測可能な線形力学系におけるシステム同定と適応制御の問題について検討する。
開ループ系と閉ループ系の両方において有限時間保証付きの最初のモデル推定法を提案する。
AdaptOnは、未知の部分観測可能な線形力学系の適応制御において、$textpolylogleft(Tright)$ regretを達成する最初のアルゴリズムであることを示す。
論文 参考訳(メタデータ) (2020-03-25T06:00:33Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。