論文の概要: A Variational Infinite Mixture for Probabilistic Inverse Dynamics
Learning
- arxiv url: http://arxiv.org/abs/2011.05217v3
- Date: Tue, 30 Mar 2021 08:51:07 GMT
- ステータス: 処理完了
- システム内更新日: 2022-09-27 08:25:09.478087
- Title: A Variational Infinite Mixture for Probabilistic Inverse Dynamics
Learning
- Title(参考訳): 確率的逆ダイナミクス学習のための変分無限混合
- Authors: Hany Abdulsamad, Peter Nickl, Pascal Klink, Jan Peters
- Abstract要約: 確率的局所モデルの無限混合に対する効率的な変分ベイズ推論手法を開発した。
我々は、データ駆動適応、高速予測、不連続関数とヘテロセダスティックノイズに対処する能力の組み合わせにおけるモデルのパワーを強調した。
学習したモデルを用いてBarrett-WAMマニピュレータのオンライン動的制御を行い、軌道追跡性能を大幅に改善した。
- 参考スコア(独自算出の注目度): 34.90240171916858
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Probabilistic regression techniques in control and robotics applications have
to fulfill different criteria of data-driven adaptability, computational
efficiency, scalability to high dimensions, and the capacity to deal with
different modalities in the data. Classical regressors usually fulfill only a
subset of these properties. In this work, we extend seminal work on Bayesian
nonparametric mixtures and derive an efficient variational Bayes inference
technique for infinite mixtures of probabilistic local polynomial models with
well-calibrated certainty quantification. We highlight the model's power in
combining data-driven complexity adaptation, fast prediction and the ability to
deal with discontinuous functions and heteroscedastic noise. We benchmark this
technique on a range of large real inverse dynamics datasets, showing that the
infinite mixture formulation is competitive with classical Local Learning
methods and regularizes model complexity by adapting the number of components
based on data and without relying on heuristics. Moreover, to showcase the
practicality of the approach, we use the learned models for online inverse
dynamics control of a Barrett-WAM manipulator, significantly improving the
trajectory tracking performance.
- Abstract(参考訳): 制御とロボティクスのアプリケーションにおける確率的回帰技術は、データ駆動適応性、計算効率、高次元へのスケーラビリティ、データ内の異なるモダリティを扱う能力の異なる基準を満たす必要がある。
古典的な回帰器は通常これらの性質のサブセットのみを満たす。
本研究では、ベイズ的非パラメトリック混合に関する基礎研究を拡張し、確率的局所多項式モデルの無限混合に対する効率的な変分ベイズ推論手法を導出する。
我々は,データ駆動型複雑性適応,高速予測,不連続関数とヘテロセダスティックノイズに対処する能力を組み合わせたモデルの有用性を強調した。
我々は,この手法を大規模実数逆ダイナミクスデータセットで評価し,無限混合式が古典的局所学習法と競合し,ヒューリスティックスに頼らずにデータに基づく成分数に適応することでモデルの複雑さを正則化することを示した。
さらに,本手法の実用性を示すために,Barrett-WAMマニピュレータのオンライン逆ダイナミクス制御に学習モデルを用い,軌道追跡性能を著しく改善した。
関連論文リスト
- Learning Controlled Stochastic Differential Equations [61.82896036131116]
本研究では,非一様拡散を伴う連続多次元非線形微分方程式のドリフト係数と拡散係数の両方を推定する新しい手法を提案する。
我々は、(L2)、(Linfty)の有限サンプル境界や、係数の正則性に適応する学習率を持つリスクメトリクスを含む、強力な理論的保証を提供する。
当社のメソッドはオープンソースPythonライブラリとして利用可能です。
論文 参考訳(メタデータ) (2024-11-04T11:09:58Z) - Dynamic Post-Hoc Neural Ensemblers [55.15643209328513]
本研究では,ニューラルネットワークをアンサンブル手法として活用することを検討する。
低多様性のアンサンブルを学習するリスクを動機として,ベースモデル予測をランダムにドロップすることでモデルの正規化を提案する。
このアプローチはアンサンブル内の多様性を低くし、オーバーフィッティングを減らし、一般化能力を向上させる。
論文 参考訳(メタデータ) (2024-10-06T15:25:39Z) - Online Variational Sequential Monte Carlo [49.97673761305336]
我々は,計算効率が高く正確なモデルパラメータ推定とベイジアン潜在状態推定を提供する変分連続モンテカルロ法(VSMC)を構築した。
オンラインVSMCは、パラメータ推定と粒子提案適応の両方を効率よく、完全にオンザフライで実行することができる。
論文 参考訳(メタデータ) (2023-12-19T21:45:38Z) - Parallel and Limited Data Voice Conversion Using Stochastic Variational
Deep Kernel Learning [2.5782420501870296]
本稿では,限られたデータを扱う音声変換手法を提案する。
変分深層学習(SVDKL)に基づく。
非滑らかでより複雑な関数を推定することができる。
論文 参考訳(メタデータ) (2023-09-08T16:32:47Z) - Variational Hierarchical Mixtures for Probabilistic Learning of Inverse
Dynamics [20.953728061894044]
適切に校正された確率回帰モデルは、データセットが急速に成長し、タスクがより複雑になるにつれて、ロボットアプリケーションにおいて重要な学習要素である。
計算効率のよい表現と計算複雑性の正規化を両世界の利点と組み合わせた確率論的階層的モデリングパラダイムを考察する。
これらの表現を学習するための2つの効率的な変分推論手法を導出し、階層的無限局所回帰モデルの利点を強調する。
論文 参考訳(メタデータ) (2022-11-02T13:54:07Z) - HyperImpute: Generalized Iterative Imputation with Automatic Model
Selection [77.86861638371926]
カラムワイズモデルを適応的かつ自動的に構成するための一般化反復計算フレームワークを提案する。
既製の学習者,シミュレータ,インターフェースを備えた具体的な実装を提供する。
論文 参考訳(メタデータ) (2022-06-15T19:10:35Z) - Capturing Actionable Dynamics with Structured Latent Ordinary
Differential Equations [68.62843292346813]
本稿では,その潜在表現内でのシステム入力の変動をキャプチャする構造付き潜在ODEモデルを提案する。
静的変数仕様に基づいて,本モデルではシステムへの入力毎の変動要因を学習し,潜在空間におけるシステム入力の影響を分離する。
論文 参考訳(メタデータ) (2022-02-25T20:00:56Z) - Compositional Modeling of Nonlinear Dynamical Systems with ODE-based
Random Features [0.0]
この問題に対処するための新しいドメインに依存しないアプローチを提案する。
我々は、通常の微分方程式から導かれる物理インフォームド・ランダムな特徴の合成を用いる。
提案手法は,ベンチマーク回帰タスクにおいて,他の多くの確率モデルに匹敵する性能を実現する。
論文 参考訳(メタデータ) (2021-06-10T17:55:13Z) - Multiplicative noise and heavy tails in stochastic optimization [62.993432503309485]
経験的最適化は現代の機械学習の中心であるが、その成功における役割はまだ不明である。
分散による離散乗法雑音のパラメータによく現れることを示す。
最新のステップサイズやデータを含む重要な要素について、詳細な分析を行い、いずれも最先端のニューラルネットワークモデルで同様の結果を示す。
論文 参考訳(メタデータ) (2020-06-11T09:58:01Z) - Variational Model-based Policy Optimization [34.80171122943031]
モデルベース強化学習(RL)アルゴリズムにより、実システムとの相互作用から得られたデータとモデル生成データを組み合わせ、RLにおけるデータ効率問題を緩和する。
本稿では,ログライクリフのログライクリフの変動的下界としての目的関数を提案し,モデルとポリシーを共同で学習し,改善する。
多くの連続制御タスクに関する実験により、モデルベース(Eステップ)アルゴリズムはより複雑であるにもかかわらず、浮動小数点数モデルベースポリシー最適化(VMBPO)と呼ばれるアルゴリズムの方がよりサンプリング効率が高いことが示された。
論文 参考訳(メタデータ) (2020-06-09T18:30:15Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。