論文の概要: Smoothed Online Learning for Prediction in Piecewise Affine Systems
- arxiv url: http://arxiv.org/abs/2301.11187v2
- Date: Tue, 19 Mar 2024 15:18:23 GMT
- ステータス: 処理完了
- システム内更新日: 2024-03-21 01:51:05.848785
- Title: Smoothed Online Learning for Prediction in Piecewise Affine Systems
- Title(参考訳): ピアスワイドアフィンシステムにおける予測のための平滑オンライン学習
- Authors: Adam Block, Max Simchowitz, Russ Tedrake,
- Abstract要約: 本稿では,最近開発されたスムーズなオンライン学習フレームワークに基づく。
これは、断片的なアフィン系における予測とシミュレーションのための最初のアルゴリズムを提供する。
- 参考スコア(独自算出の注目度): 43.64498536409903
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: The problem of piecewise affine (PWA) regression and planning is of foundational importance to the study of online learning, control, and robotics, where it provides a theoretically and empirically tractable setting to study systems undergoing sharp changes in the dynamics. Unfortunately, due to the discontinuities that arise when crossing into different ``pieces,'' learning in general sequential settings is impossible and practical algorithms are forced to resort to heuristic approaches. This paper builds on the recently developed smoothed online learning framework and provides the first algorithms for prediction and simulation in PWA systems whose regret is polynomial in all relevant problem parameters under a weak smoothness assumption; moreover, our algorithms are efficient in the number of calls to an optimization oracle. We further apply our results to the problems of one-step prediction and multi-step simulation regret in piecewise affine dynamical systems, where the learner is tasked with simulating trajectories and regret is measured in terms of the Wasserstein distance between simulated and true data. Along the way, we develop several technical tools of more general interest.
- Abstract(参考訳): ピースワイズアフィン(PWA)の回帰と計画の問題は、オンライン学習、制御、ロボット工学の研究において基礎的な重要性を持つ。
残念なことに、異なる「作品」にまたがる際に生じる不連続さのため、一般的なシーケンシャルなセッティングでの学習は不可能であり、実用的なアルゴリズムはヒューリスティックなアプローチに頼らざるを得ない。
本稿は、最近開発されたスムーズなオンライン学習フレームワークを基盤として、弱スムーズな仮定の下で全ての問題パラメータの多項式を後悔するPWAシステムにおいて、予測とシミュレーションのための最初のアルゴリズムを提供する。
さらに,本研究は,学習者が軌道を模擬し,実データと実データとのワッサーシュタイン距離を測った場合の,一段階の予測と多段階のシミュレーション後悔の問題に適用する。
その過程で私たちは,より一般的な技術ツールをいくつか開発しています。
関連論文リスト
- Stochastic Online Optimization for Cyber-Physical and Robotic Systems [9.392372266209103]
本稿では,サイバー物理・ロボットシステムの文脈におけるプログラミング問題の解決のための新しいオンラインフレームワークを提案する。
我々の問題定式化制約は、一般に連続状態とアクション空間が非線形であるサイバー物理システムの進化をモデル化する。
我々は, 力学の粗い推定でも, アルゴリズムの収束性を大幅に向上させることができることを示した。
論文 参考訳(メタデータ) (2024-04-08T09:08:59Z) - An Analytic End-to-End Deep Learning Algorithm based on Collaborative
Learning [5.710971447109949]
本稿では, 完全連結ニューラルネットワーク(FNN)の終端深層学習におけるスムーズなアクティベーション機能を持つ収束解析について述べる。
提案手法は,潜在的な解答の問題を回避するとともに,解答の問題も容易には起こらない。
論文 参考訳(メタデータ) (2023-05-26T08:09:03Z) - Oracle-Efficient Smoothed Online Learning for Piecewise Continuous Decision Making [73.48977854003697]
この研究は、複雑性という新しい概念、一般化ブラケット数を導入し、空間の大きさに対する敵の制約を結婚させる。
次に、オンライン予測や断片的連続関数の計画など、関心のあるいくつかの問題で境界をインスタンス化する。
論文 参考訳(メタデータ) (2023-02-10T18:45:52Z) - On Robust Numerical Solver for ODE via Self-Attention Mechanism [82.95493796476767]
我々は,内在性雑音障害を緩和し,AIによって強化された数値解法を,データサイズを小さくする訓練について検討する。
まず,教師付き学習における雑音を制御するための自己認識機構の能力を解析し,さらに微分方程式の数値解に付加的な自己認識機構を導入し,簡便かつ有効な数値解法であるAttrを提案する。
論文 参考訳(メタデータ) (2023-02-05T01:39:21Z) - Guaranteed Conservation of Momentum for Learning Particle-based Fluid
Dynamics [96.9177297872723]
本稿では,学習物理シミュレーションにおける線形運動量を保証する新しい手法を提案する。
我々は、強い制約で運動量の保存を強制し、反対称的な連続的な畳み込み層を通して実現する。
提案手法により,学習シミュレータの物理的精度を大幅に向上させることができる。
論文 参考訳(メタデータ) (2022-10-12T09:12:59Z) - Learning to Control under Time-Varying Environment [18.48729114775298]
本稿では,線形時間変化(LTV)力学系における後悔の問題について検討する。
提案するオンラインアルゴリズムは, 計算に難易度を保証した最初のオンラインアルゴリズムである。
論文 参考訳(メタデータ) (2022-06-06T11:40:46Z) - FEM-based Real-Time Simulations of Large Deformations with Probabilistic
Deep Learning [1.2617078020344616]
負荷下での超弾性体の応答を予測できる高効率なディープラーニングサロゲートフレームワークを提案する。
このフレームワークは、特殊な畳み込みニューラルネットワークアーキテクチャ(いわゆるU-Net)の形式を採っている。
論文 参考訳(メタデータ) (2021-11-02T20:05:22Z) - Reinforcement Learning Policies in Continuous-Time Linear Systems [0.0]
パラメータ推定を慎重にランダムにすることで、最適行動の学習を迅速に行うオンラインポリシーを提案する。
非接触系の力学に対する鋭い安定性を証明し、準最適動作による無限小の後悔を厳密に特定する。
我々の分析は、継続的強化学習における基本的な課題に光を当て、同様の問題に対する有用な基礎となることを示唆している。
論文 参考訳(メタデータ) (2021-09-16T00:08:50Z) - Gone Fishing: Neural Active Learning with Fisher Embeddings [55.08537975896764]
ディープニューラルネットワークと互換性のあるアクティブな学習アルゴリズムの必要性が高まっている。
本稿では,ニューラルネットワークのための抽出可能かつ高性能な能動学習アルゴリズムBAITを紹介する。
論文 参考訳(メタデータ) (2021-06-17T17:26:31Z) - Information Theoretic Model Predictive Q-Learning [64.74041985237105]
本稿では,情報理論的MPCとエントロピー正規化RLとの新たな理論的関連性を示す。
バイアスモデルを利用したQ-ラーニングアルゴリズムを開発した。
論文 参考訳(メタデータ) (2019-12-31T00:29:22Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。