論文の概要: Learning Unstable Dynamical Systems with Time-Weighted Logarithmic Loss
- arxiv url: http://arxiv.org/abs/2007.05189v1
- Date: Fri, 10 Jul 2020 06:28:05 GMT
- ステータス: 処理完了
- システム内更新日: 2022-11-11 21:32:49.775779
- Title: Learning Unstable Dynamical Systems with Time-Weighted Logarithmic Loss
- Title(参考訳): 時間重み付き対数損失を伴う不安定力学系の学習
- Authors: Kamil Nar, Yuan Xue, Andrew M. Dai
- Abstract要約: 勾配降下アルゴリズムの力学を考察し、不安定なシステムの学習が困難になる原因をピンポイントする。
この不均衡を解消し,不安定なシステムを学習する上での有効性を示すために,時間重対数損失関数を導入する。
- 参考スコア(独自算出の注目度): 20.167719985846002
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: When training the parameters of a linear dynamical model, the gradient
descent algorithm is likely to fail to converge if the squared-error loss is
used as the training loss function. Restricting the parameter space to a
smaller subset and running the gradient descent algorithm within this subset
can allow learning stable dynamical systems, but this strategy does not work
for unstable systems. In this work, we look into the dynamics of the gradient
descent algorithm and pinpoint what causes the difficulty of learning unstable
systems. We show that observations taken at different times from the system to
be learned influence the dynamics of the gradient descent algorithm in
substantially different degrees. We introduce a time-weighted logarithmic loss
function to fix this imbalance and demonstrate its effectiveness in learning
unstable systems.
- Abstract(参考訳): 線形力学モデルのパラメータをトレーニングする場合、二乗誤差損失がトレーニング損失関数として使用される場合、勾配降下アルゴリズムは収束しない可能性が高い。
パラメータ空間を小さなサブセットに制限し、このサブセット内で勾配降下アルゴリズムを実行することで、安定した力学系を学習することができるが、この戦略は不安定なシステムでは機能しない。
本研究では,勾配降下アルゴリズムのダイナミクスを考察し,不安定なシステムを学習することの難しさを指摘する。
学習対象とするシステムから異なるタイミングで観測された観測は,勾配降下アルゴリズムの力学に大きく異なる影響を及ぼすことを示す。
この不均衡を解消するための時間重対数損失関数を導入し、不安定なシステムを学ぶ上での有効性を示す。
関連論文リスト
- Differentially Flat Learning-based Model Predictive Control Using a
Stability, State, and Input Constraining Safety Filter [10.52705437098686]
学習に基づく最適制御アルゴリズムは、過去の軌跡データとシステムダイナミクスの学習モデルを用いて未知のシステムを制御する。
本稿では、微分平坦性を利用して、最先端の学習ベースコントローラに類似した性能を実現する非線形制御器を提案する。
論文 参考訳(メタデータ) (2023-07-20T02:42:23Z) - Losing momentum in continuous-time stochastic optimisation [62.997667081978825]
近年,運動量に基づくアルゴリズムが特に普及している。
本研究では,運動量を伴う勾配降下の連続時間モデルを提案し,解析する。
我々は、時間とともに運動量を減らす際に、我々のシステムを世界規模のミニミザーに収束させることを示す。
論文 参考訳(メタデータ) (2022-09-08T10:46:05Z) - A Priori Denoising Strategies for Sparse Identification of Nonlinear
Dynamical Systems: A Comparative Study [68.8204255655161]
本研究では, 局所的およびグローバルな平滑化手法の性能と, 状態測定値の偏差について検討・比較する。
一般に,測度データセット全体を用いたグローバルな手法は,局所点の周辺に隣接するデータサブセットを用いる局所的手法よりも優れていることを示す。
論文 参考訳(メタデータ) (2022-01-29T23:31:25Z) - Bayesian Algorithms Learn to Stabilize Unknown Continuous-Time Systems [0.0]
線形力学系は、不確実な力学を持つ植物の学習に基づく制御のための標準モデルである。
この目的のための信頼性の高い安定化手順は、不安定なデータから有効に学習し、有限時間でシステムを安定化させることができない。
本研究では,未知の連続時間線形系を安定化する新しい学習アルゴリズムを提案する。
論文 参考訳(メタデータ) (2021-12-30T15:31:35Z) - Learning over All Stabilizing Nonlinear Controllers for a
Partially-Observed Linear System [4.3012765978447565]
線形力学系に対する非線形出力フィードバックコントローラのパラメータ化を提案する。
提案手法は, 制約を満たすことなく, 部分的に観測可能な線形力学系の閉ループ安定性を保証する。
論文 参考訳(メタデータ) (2021-12-08T10:43:47Z) - Learning Unstable Dynamics with One Minute of Data: A
Differentiation-based Gaussian Process Approach [47.045588297201434]
ガウス過程の微分可能性を利用して、真の連続力学の状態依存線形化近似を作成する方法を示す。
9次元セグウェイのような不安定なシステムのシステムダイナミクスを反復的に学習することで、アプローチを検証する。
論文 参考訳(メタデータ) (2021-03-08T05:08:47Z) - Gradient Starvation: A Learning Proclivity in Neural Networks [97.02382916372594]
グラディエント・スターベーションは、タスクに関連する機能のサブセットのみをキャプチャすることで、クロスエントロピー損失を最小化するときに発生する。
この研究は、ニューラルネットワークにおけるそのような特徴不均衡の出現に関する理論的説明を提供する。
論文 参考訳(メタデータ) (2020-11-18T18:52:08Z) - Reinforcement Learning with Fast Stabilization in Linear Dynamical
Systems [91.43582419264763]
未知の安定化線形力学系におけるモデルベース強化学習(RL)について検討する。
本研究では,環境を効果的に探索することで,基盤システムの高速安定化を証明できるアルゴリズムを提案する。
提案アルゴリズムはエージェント環境相互作用の時間ステップで$tildemathcalO(sqrtT)$ regretを達成した。
論文 参考訳(メタデータ) (2020-07-23T23:06:40Z) - Active Learning for Nonlinear System Identification with Guarantees [102.43355665393067]
状態遷移が既知の状態-作用対の特徴埋め込みに線形に依存する非線形力学系のクラスについて検討する。
そこで本稿では, トラジェクティブ・プランニング, トラジェクティブ・トラッキング, システムの再推定という3つのステップを繰り返すことで, この問題を解決するためのアクティブ・ラーニング・アプローチを提案する。
本手法は, 非線形力学系を標準線形回帰の統計速度と同様, パラメトリック速度で推定する。
論文 参考訳(メタデータ) (2020-06-18T04:54:11Z) - Convergence and sample complexity of gradient methods for the model-free
linear quadratic regulator problem [27.09339991866556]
本稿では,コントローラの空間を直接探索することにより,未知の計算系に対する最適制御を求める。
我々は、安定化フィードバックゲインの勾配-フローのダイナミクスセットに焦点をあてて、そのような手法の性能と効率を最小化するための一歩を踏み出した。
論文 参考訳(メタデータ) (2019-12-26T16:56:59Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。