論文の概要: Smoothed Online Learning for Prediction in Piecewise Affine Systems
- arxiv url: http://arxiv.org/abs/2301.11187v1
- Date: Thu, 26 Jan 2023 15:54:14 GMT
- ステータス: 処理完了
- システム内更新日: 2023-01-27 13:16:38.755274
- Title: Smoothed Online Learning for Prediction in Piecewise Affine Systems
- Title(参考訳): ピアスワイドアフィンシステムにおける予測のための平滑オンライン学習
- Authors: Adam Block, Max Simchowitz, Russ Tedrake
- Abstract要約: 本稿では,最近開発されたスムーズなオンライン学習フレームワークに基づく。
これは、断片的なアフィン系における予測とシミュレーションのための最初のアルゴリズムを提供する。
- 参考スコア(独自算出の注目度): 54.98643421343919
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: The problem of piecewise affine (PWA) regression and planning is of
foundational importance to the study of online learning, control, and robotics,
where it provides a theoretically and empirically tractable setting to study
systems undergoing sharp changes in the dynamics. Unfortunately, due to the
discontinuities that arise when crossing into different ``pieces,'' learning in
general sequential settings is impossible and practical algorithms are forced
to resort to heuristic approaches. This paper builds on the recently developed
smoothed online learning framework and provides the first algorithms for
prediction and simulation in PWA systems whose regret is polynomial in all
relevant problem parameters under a weak smoothness assumption; moreover, our
algorithms are efficient in the number of calls to an optimization oracle. We
further apply our results to the problems of one-step prediction and multi-step
simulation regret in piecewise affine dynamical systems, where the learner is
tasked with simulating trajectories and regret is measured in terms of the
Wasserstein distance between simulated and true data. Along the way, we develop
several technical tools of more general interest.
- Abstract(参考訳): pwa(slitwise affine)の回帰と計画の問題は、オンライン学習、制御、ロボット工学の研究において基礎的な重要性があり、そこでは、力学の鋭い変化を受けるシステムを研究するための理論的かつ経験的な設定を提供する。
残念なことに、異なる「要素」に交差する際に生じる不連続のため、一般的な逐次的な学習は不可能であり、実用的なアルゴリズムはヒューリスティックなアプローチに頼らざるを得ない。
本稿では,最近開発された平滑化オンライン学習フレームワークをベースとし,弱平滑性仮定下で関連するすべての問題パラメータの多項式を後悔するpwaシステムにおいて,予測とシミュレーションのための最初のアルゴリズムを提供する。
さらに,シミュレーションデータと実データとの間のwasserstein距離から,学習者が軌道をシミュレーションし,後悔を計測する分節アフィン力学系において,一段階予測と多段階シミュレーションの後悔の問題にも適用する。
その過程で、より一般的な技術ツールを開発します。
関連論文リスト
- Stochastic Online Optimization for Cyber-Physical and Robotic Systems [9.392372266209103]
本稿では,サイバー物理・ロボットシステムの文脈におけるプログラミング問題の解決のための新しいオンラインフレームワークを提案する。
我々の問題定式化制約は、一般に連続状態とアクション空間が非線形であるサイバー物理システムの進化をモデル化する。
我々は, 力学の粗い推定でも, アルゴリズムの収束性を大幅に向上させることができることを示した。
論文 参考訳(メタデータ) (2024-04-08T09:08:59Z) - An Analytic End-to-End Deep Learning Algorithm based on Collaborative
Learning [5.710971447109949]
本稿では, 完全連結ニューラルネットワーク(FNN)の終端深層学習におけるスムーズなアクティベーション機能を持つ収束解析について述べる。
提案手法は,潜在的な解答の問題を回避するとともに,解答の問題も容易には起こらない。
論文 参考訳(メタデータ) (2023-05-26T08:09:03Z) - Oracle-Efficient Smoothed Online Learning for Piecewise Continuous Decision Making [73.48977854003697]
この研究は、複雑性という新しい概念、一般化ブラケット数を導入し、空間の大きさに対する敵の制約を結婚させる。
次に、オンライン予測や断片的連続関数の計画など、関心のあるいくつかの問題で境界をインスタンス化する。
論文 参考訳(メタデータ) (2023-02-10T18:45:52Z) - On Robust Numerical Solver for ODE via Self-Attention Mechanism [82.95493796476767]
我々は,内在性雑音障害を緩和し,AIによって強化された数値解法を,データサイズを小さくする訓練について検討する。
まず,教師付き学習における雑音を制御するための自己認識機構の能力を解析し,さらに微分方程式の数値解に付加的な自己認識機構を導入し,簡便かつ有効な数値解法であるAttrを提案する。
論文 参考訳(メタデータ) (2023-02-05T01:39:21Z) - Guaranteed Conservation of Momentum for Learning Particle-based Fluid
Dynamics [96.9177297872723]
本稿では,学習物理シミュレーションにおける線形運動量を保証する新しい手法を提案する。
我々は、強い制約で運動量の保存を強制し、反対称的な連続的な畳み込み層を通して実現する。
提案手法により,学習シミュレータの物理的精度を大幅に向上させることができる。
論文 参考訳(メタデータ) (2022-10-12T09:12:59Z) - Learning to Control under Time-Varying Environment [18.48729114775298]
本稿では,線形時間変化(LTV)力学系における後悔の問題について検討する。
提案するオンラインアルゴリズムは, 計算に難易度を保証した最初のオンラインアルゴリズムである。
論文 参考訳(メタデータ) (2022-06-06T11:40:46Z) - FEM-based Real-Time Simulations of Large Deformations with Probabilistic
Deep Learning [1.2617078020344616]
負荷下での超弾性体の応答を予測できる高効率なディープラーニングサロゲートフレームワークを提案する。
このフレームワークは、特殊な畳み込みニューラルネットワークアーキテクチャ(いわゆるU-Net)の形式を採っている。
論文 参考訳(メタデータ) (2021-11-02T20:05:22Z) - Reinforcement Learning Policies in Continuous-Time Linear Systems [0.0]
パラメータ推定を慎重にランダムにすることで、最適行動の学習を迅速に行うオンラインポリシーを提案する。
非接触系の力学に対する鋭い安定性を証明し、準最適動作による無限小の後悔を厳密に特定する。
我々の分析は、継続的強化学習における基本的な課題に光を当て、同様の問題に対する有用な基礎となることを示唆している。
論文 参考訳(メタデータ) (2021-09-16T00:08:50Z) - Gone Fishing: Neural Active Learning with Fisher Embeddings [55.08537975896764]
ディープニューラルネットワークと互換性のあるアクティブな学習アルゴリズムの必要性が高まっている。
本稿では,ニューラルネットワークのための抽出可能かつ高性能な能動学習アルゴリズムBAITを紹介する。
論文 参考訳(メタデータ) (2021-06-17T17:26:31Z) - Information Theoretic Model Predictive Q-Learning [64.74041985237105]
本稿では,情報理論的MPCとエントロピー正規化RLとの新たな理論的関連性を示す。
バイアスモデルを利用したQ-ラーニングアルゴリズムを開発した。
論文 参考訳(メタデータ) (2019-12-31T00:29:22Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。