論文の概要: Learning Unstable Dynamical Systems with Time-Weighted Logarithmic Loss
- arxiv url: http://arxiv.org/abs/2007.05189v1
- Date: Fri, 10 Jul 2020 06:28:05 GMT
- ステータス: 処理完了
- システム内更新日: 2022-11-11 21:32:49.775779
- Title: Learning Unstable Dynamical Systems with Time-Weighted Logarithmic Loss
- Title(参考訳): 時間重み付き対数損失を伴う不安定力学系の学習
- Authors: Kamil Nar, Yuan Xue, Andrew M. Dai
- Abstract要約: 勾配降下アルゴリズムの力学を考察し、不安定なシステムの学習が困難になる原因をピンポイントする。
この不均衡を解消し,不安定なシステムを学習する上での有効性を示すために,時間重対数損失関数を導入する。
- 参考スコア(独自算出の注目度): 20.167719985846002
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: When training the parameters of a linear dynamical model, the gradient
descent algorithm is likely to fail to converge if the squared-error loss is
used as the training loss function. Restricting the parameter space to a
smaller subset and running the gradient descent algorithm within this subset
can allow learning stable dynamical systems, but this strategy does not work
for unstable systems. In this work, we look into the dynamics of the gradient
descent algorithm and pinpoint what causes the difficulty of learning unstable
systems. We show that observations taken at different times from the system to
be learned influence the dynamics of the gradient descent algorithm in
substantially different degrees. We introduce a time-weighted logarithmic loss
function to fix this imbalance and demonstrate its effectiveness in learning
unstable systems.
- Abstract(参考訳): 線形力学モデルのパラメータをトレーニングする場合、二乗誤差損失がトレーニング損失関数として使用される場合、勾配降下アルゴリズムは収束しない可能性が高い。
パラメータ空間を小さなサブセットに制限し、このサブセット内で勾配降下アルゴリズムを実行することで、安定した力学系を学習することができるが、この戦略は不安定なシステムでは機能しない。
本研究では,勾配降下アルゴリズムのダイナミクスを考察し,不安定なシステムを学習することの難しさを指摘する。
学習対象とするシステムから異なるタイミングで観測された観測は,勾配降下アルゴリズムの力学に大きく異なる影響を及ぼすことを示す。
この不均衡を解消するための時間重対数損失関数を導入し、不安定なシステムを学ぶ上での有効性を示す。
関連論文リスト
- Learning Unstable Continuous-Time Stochastic Linear Control Systems [0.0]
有限長状態軌跡に基づく連続時間力学におけるシステム同定の問題について検討する。
適切なランダム化制御入力を用いて不安定なオープンループ行列を推定する手法を提案する。
我々は,推定誤差が軌道長,励起率,信号対雑音比で減衰することを示す理論的性能保証を確立する。
論文 参考訳(メタデータ) (2024-09-17T16:24:51Z) - Stochastic Reinforcement Learning with Stability Guarantees for Control of Unknown Nonlinear Systems [6.571209126567701]
本稿では,力学の局所線形表現を学習することでシステムを安定化する強化学習アルゴリズムを提案する。
本稿では,いくつかの高次元力学系におけるアルゴリズムの有効性を示す。
論文 参考訳(メタデータ) (2024-09-12T20:07:54Z) - Divide And Conquer: Learning Chaotic Dynamical Systems With Multistep Penalty Neural Ordinary Differential Equations [0.0]
多段階ペナルティ・ヌードは, 倉本・シヴァシュ・コリンスキー方程式, 2次元コルモゴロフ流, ERA5再解析データなどのカオスシステムに適用される。
計算コストを著しく低減したカオスシステムに対してMPODEが実行可能な性能を提供することが観察された。
論文 参考訳(メタデータ) (2024-06-30T02:50:28Z) - A Priori Denoising Strategies for Sparse Identification of Nonlinear
Dynamical Systems: A Comparative Study [68.8204255655161]
本研究では, 局所的およびグローバルな平滑化手法の性能と, 状態測定値の偏差について検討・比較する。
一般に,測度データセット全体を用いたグローバルな手法は,局所点の周辺に隣接するデータサブセットを用いる局所的手法よりも優れていることを示す。
論文 参考訳(メタデータ) (2022-01-29T23:31:25Z) - Bayesian Algorithms Learn to Stabilize Unknown Continuous-Time Systems [0.0]
線形力学系は、不確実な力学を持つ植物の学習に基づく制御のための標準モデルである。
この目的のための信頼性の高い安定化手順は、不安定なデータから有効に学習し、有限時間でシステムを安定化させることができない。
本研究では,未知の連続時間線形系を安定化する新しい学習アルゴリズムを提案する。
論文 参考訳(メタデータ) (2021-12-30T15:31:35Z) - Learning Unstable Dynamics with One Minute of Data: A
Differentiation-based Gaussian Process Approach [47.045588297201434]
ガウス過程の微分可能性を利用して、真の連続力学の状態依存線形化近似を作成する方法を示す。
9次元セグウェイのような不安定なシステムのシステムダイナミクスを反復的に学習することで、アプローチを検証する。
論文 参考訳(メタデータ) (2021-03-08T05:08:47Z) - Gradient Starvation: A Learning Proclivity in Neural Networks [97.02382916372594]
グラディエント・スターベーションは、タスクに関連する機能のサブセットのみをキャプチャすることで、クロスエントロピー損失を最小化するときに発生する。
この研究は、ニューラルネットワークにおけるそのような特徴不均衡の出現に関する理論的説明を提供する。
論文 参考訳(メタデータ) (2020-11-18T18:52:08Z) - Training Generative Adversarial Networks by Solving Ordinary
Differential Equations [54.23691425062034]
GANトレーニングによって引き起こされる連続時間ダイナミクスについて検討する。
この観点から、GANのトレーニングにおける不安定性は積分誤差から生じると仮定する。
本研究では,有名なODEソルバ(Runge-Kutta など)がトレーニングを安定化できるかどうかを実験的に検証する。
論文 参考訳(メタデータ) (2020-10-28T15:23:49Z) - Reinforcement Learning with Fast Stabilization in Linear Dynamical
Systems [91.43582419264763]
未知の安定化線形力学系におけるモデルベース強化学習(RL)について検討する。
本研究では,環境を効果的に探索することで,基盤システムの高速安定化を証明できるアルゴリズムを提案する。
提案アルゴリズムはエージェント環境相互作用の時間ステップで$tildemathcalO(sqrtT)$ regretを達成した。
論文 参考訳(メタデータ) (2020-07-23T23:06:40Z) - Active Learning for Nonlinear System Identification with Guarantees [102.43355665393067]
状態遷移が既知の状態-作用対の特徴埋め込みに線形に依存する非線形力学系のクラスについて検討する。
そこで本稿では, トラジェクティブ・プランニング, トラジェクティブ・トラッキング, システムの再推定という3つのステップを繰り返すことで, この問題を解決するためのアクティブ・ラーニング・アプローチを提案する。
本手法は, 非線形力学系を標準線形回帰の統計速度と同様, パラメトリック速度で推定する。
論文 参考訳(メタデータ) (2020-06-18T04:54:11Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。