Fugu-MT 論文翻訳(概要): The Complexity of Sequential Prediction in Dynamical Systems

関連論文リスト

The Sample Complexity of Online Reinforcement Learning: A Multi-model Perspective [55.15192437680943]
連続状態と行動空間を持つ非線形力学系の一般設定におけるオンライン強化学習のサンプル複雑性について検討した。我々のアルゴリズムは、$mathcalO(N epsilon2 + Mathrmln(m(epsilon)/epsilon2)$のポリシーを後悔する。力学がコンパクトで実数値のパラメータ集合によってパラメータ化される特別な場合、$mathcalO(sqrt)のポリシー後悔を証明する。
論文参考訳（メタデータ） (2025-01-27T10:01:28Z)
Logarithmic Regret for Nonlinear Control [5.473636587010879]
逐次的相互作用を通じて未知の非線形力学系を制御する学習の課題に対処する。ミスが破滅的に起こりうる高スループットアプリケーションに動機付けられ,高速な逐次学習が可能となる状況について検討する。
論文参考訳（メタデータ） (2025-01-17T15:42:42Z)
Learning Physics Informed Neural ODEs With Partial Measurements [13.313167463468499]
我々は,システム状態の一部が測定されていない場合に,動的制御系を学習する問題に取り組む。本稿では,非測定プロセスの動的制御を学習可能な逐次最適化フレームワークを提案する。
論文参考訳（メタデータ） (2024-12-11T18:17:34Z)
Integrating Physics-Informed Deep Learning and Numerical Methods for Robust Dynamics Discovery and Parameter Estimation [0.0]
本研究では,動的システム理論における2つの課題を解決するために,ディープラーニング手法と微分方程式の古典的数値法を組み合わせる。その結果,カオス力学を示す一連のテスト問題に対する提案手法の有効性が示された。
論文参考訳（メタデータ） (2024-10-05T22:40:02Z)
Learning System Dynamics without Forgetting [60.08612207170659]
未知の力学を持つ系の軌道予測は、物理学や生物学を含む様々な研究分野において重要である。本稿では,モードスイッチンググラフODE (MS-GODE) の新たなフレームワークを提案する。生体力学の異なる多様な系を特徴とする生体力学システムの新しいベンチマークを構築した。
論文参考訳（メタデータ） (2024-06-30T14:55:18Z)
Joint Learning of Linear Dynamical Systems under Smoothness Constraints [5.2395896768723045]
複数の線形力学系の連立学習の問題点を考察する。特に,平均二乗誤差が平均二乗誤差(MSE)に収束する条件を示す。
論文参考訳（メタデータ） (2024-06-03T08:29:42Z)
Koopman-based Deep Learning for Nonlinear System Estimation [1.3791394805787949]
複素非線形系の有意な有限次元表現を抽出するために、クープマン作用素理論に基づく新しいデータ駆動線形推定器を提案する。我々の推定器は推定された非線形系の微分同相変換にも適応しており、再学習せずに最適な状態推定を計算できる。
論文参考訳（メタデータ） (2024-05-01T16:49:54Z)
AI-Lorenz: A physics-data-driven framework for black-box and gray-box identification of chaotic systems with symbolic regression [2.07180164747172]
複雑な動的挙動をモデル化した数学的表現を学習するフレームワークを開発する。私たちは、システムのダイナミクス、時間の変化率、モデル用語の欠如を学ぶために、小さなニューラルネットワークをトレーニングします。これにより、動的挙動の将来的な進化を予測することができる。
論文参考訳（メタデータ） (2023-12-21T18:58:41Z)
Identifiability and Asymptotics in Learning Homogeneous Linear ODE Systems from Discrete Observations [114.17826109037048]
通常の微分方程式(ODE)は、機械学習において最近多くの注目を集めている。理論的な側面、例えば、統計的推定の識別可能性と特性は、いまだに不明である。本稿では,1つの軌道からサンプリングされた等間隔の誤差のない観測結果から,同次線形ODE系の同定可能性について十分な条件を導出する。
論文参考訳（メタデータ） (2022-10-12T06:46:38Z)
A Causality-Based Learning Approach for Discovering the Underlying Dynamics of Complex Systems from Partial Observations with Stochastic Parameterization [1.2882319878552302]
本稿では,部分的な観測を伴う複雑な乱流系の反復学習アルゴリズムを提案する。モデル構造を識別し、観測されていない変数を復元し、パラメータを推定する。数値実験により、新しいアルゴリズムはモデル構造を同定し、多くの複雑な非線形系に対して適切なパラメータ化を提供することに成功した。
論文参考訳（メタデータ） (2022-08-19T00:35:03Z)
The Best of Both Worlds: Reinforcement Learning with Logarithmic Regret and Policy Switches [84.54669549718075]
漸進的強化学習(RL)における後悔の最小化問題について検討する。一般関数クラスと一般モデルクラスで学ぶことに集中する。対数的後悔境界は$O(log T)$スイッチングコストのアルゴリズムによって実現可能であることを示す。
論文参考訳（メタデータ） (2022-03-03T02:55:55Z)
Time varying regression with hidden linear dynamics [74.9914602730208]
線形力学系に従って未知のパラメータが進化することを前提とした時間変化線形回帰モデルを再検討する。反対に、基礎となる力学が安定である場合、このモデルのパラメータは2つの通常の最小二乗推定と組み合わせることで、データから推定できることが示される。
論文参考訳（メタデータ） (2021-12-29T23:37:06Z)
Structure-Preserving Learning Using Gaussian Processes and Variational Integrators [62.31425348954686]
本稿では,機械系の古典力学に対する変分積分器と,ガウス過程の回帰による残留力学の学習の組み合わせを提案する。我々は、既知のキネマティック制約を持つシステムへのアプローチを拡張し、予測の不確実性に関する公式な境界を提供する。
論文参考訳（メタデータ） (2021-12-10T11:09:29Z)
Can Q-Learning be Improved with Advice? [27.24260290748049]
本稿では,マルコフ決定過程(MDP)のオンライン学習において,後悔に対する最悪の下限を回避できるかどうかを論じる。最適$Q$-値関数の予測が蒸留と呼ばれる合理的に弱い条件を満たす場合、状態-作用対の集合を、その予測が極端に不正確な状態-作用対の集合に置き換えることで、後悔境界を改善することができることを示す。私たちの研究は、キャッシュやスケジューリングといった単純なオンライン問題に重点を置いていた予測を伴うアルゴリズムに関する最近の研究を、強化学習のより複雑で一般的な問題へと拡張しています。
論文参考訳（メタデータ） (2021-10-25T15:44:20Z)
Supervised DKRC with Images for Offline System Identification [77.34726150561087]
現代の力学系はますます非線形で複雑なものになりつつある。予測と制御のためのコンパクトで包括的な表現でこれらのシステムをモデル化するフレームワークが必要である。本手法は,教師付き学習手法を用いてこれらの基礎関数を学習する。
論文参考訳（メタデータ） (2021-09-06T04:39:06Z)
Instance-optimality in optimal value estimation: Adaptivity via variance-reduced Q-learning [99.34907092347733]
本稿では,マルコフ決定過程における最適な$Q$値関数を離散状態と動作で推定する問題を解析する。局所的なミニマックスフレームワークを用いて、この関数は任意の推定手順の精度の低い境界に現れることを示す。他方,Q$ラーニングの分散還元版を解析することにより,状態と行動空間の対数的要因まで,下位境界のシャープさを確立する。
論文参考訳（メタデータ） (2021-06-28T00:38:54Z)
Using Data Assimilation to Train a Hybrid Forecast System that Combines Machine-Learning and Knowledge-Based Components [52.77024349608834]
利用可能なデータがノイズの多い部分測定の場合,カオスダイナミクスシステムのデータ支援予測の問題を検討する。動的システムの状態の部分的測定を用いることで、不完全な知識ベースモデルによる予測を改善するために機械学習モデルを訓練できることを示す。
論文参考訳（メタデータ） (2021-02-15T19:56:48Z)
Improved rates for prediction and identification of partially observed linear dynamical systems [4.68299658663016]
部分的な観測から線形時間イン力学系の同定は制御理論の基本的な問題である。本稿では,システム固有の$d$に依存する非漸近統計率でそのようなシステムを学習するアルゴリズムを提案する。本アルゴリズムは,ハンケル行列に適用したマルチスケール低ランク近似SVDに基づく。
論文参考訳（メタデータ） (2020-11-19T18:04:18Z)
Active Learning for Nonlinear System Identification with Guarantees [102.43355665393067]
状態遷移が既知の状態-作用対の特徴埋め込みに線形に依存する非線形力学系のクラスについて検討する。そこで本稿では, トラジェクティブ・プランニング, トラジェクティブ・トラッキング, システムの再推定という3つのステップを繰り返すことで, この問題を解決するためのアクティブ・ラーニング・アプローチを提案する。本手法は, 非線形力学系を標準線形回帰の統計速度と同様, パラメトリック速度で推定する。
論文参考訳（メタデータ） (2020-06-18T04:54:11Z)
Making Non-Stochastic Control (Almost) as Easy as Stochastic [27.736345095024276]
より一般的な非確率的制御モデルにおいても、同じ後悔率が達成可能であることを示す。学習者にとってダイナミクスが不明な場合に、最適な$widetildemathcalO(sqrtT)$ regretを得る。
論文参考訳（メタデータ） (2020-06-10T16:00:14Z)
Upper Confidence Primal-Dual Reinforcement Learning for CMDP with Adversarial Loss [145.54544979467872]
マルコフ決定過程(CMDP)に対するオンライン学習の検討本稿では,遷移モデルから標本化した軌跡のみを必要とする,新しいEmphupper confidence primal-dualアルゴリズムを提案する。我々の分析では、ラグランジュ乗算過程の新たな高確率ドリフト解析を、高信頼強化学習の記念後悔解析に組み入れている。
論文参考訳（メタデータ） (2020-03-02T05:02:23Z)
Regret Minimization in Partially Observable Linear Quadratic Control [91.43582419264763]
モデル力学が未知の先行性を持つ場合、部分的に観測可能な線形二次制御系における後悔の問題を考察する。本稿では, 部分的に観測可能な線形二次制御のために, 後悔を分解し, 終端から終端までの後悔の上限を与える新しい方法を提案する。
論文参考訳（メタデータ） (2020-01-31T22:35:08Z)
Naive Exploration is Optimal for Online LQR [49.681825576239355]
最適後悔尺度は$widetildeTheta(sqrtd_mathbfu2 d_mathbfx T)$で、$T$は時間ステップの数、$d_mathbfu$は入力空間の次元、$d_mathbfx$はシステム状態の次元である。我々の下界は、かつての$mathrmpoly(logT)$-regretアルゴリズムの可能性を排除する。
論文参考訳（メタデータ） (2020-01-27T03:44:54Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

論文の概要: The Complexity of Sequential Prediction in Dynamical Systems

関連論文リスト