論文の概要: Active Learning in Gaussian Process State Space Model
- arxiv url: http://arxiv.org/abs/2108.00819v1
- Date: Fri, 30 Jul 2021 16:52:38 GMT
- ステータス: 処理完了
- システム内更新日: 2021-08-03 15:41:31.562530
- Title: Active Learning in Gaussian Process State Space Model
- Title(参考訳): ガウス過程状態空間モデルにおけるアクティブラーニング
- Authors: Hon Sum Alec Yu, Dingling Yao, Christoph Zimmer, Marc Toussaint, Duy
Nguyen-Tuong
- Abstract要約: ガウス過程状態空間モデル(GPSSM)におけるアクティブラーニングの検討
我々の問題は、入力を決定することによって、潜伏状態を通じて積極的にシステムを操ることである。
特に、潜伏状態が与えられたGPSSMに対して、相互情報の近似を行うための2つのアプローチを提案する。
- 参考スコア(独自算出の注目度): 21.520328063169078
- License: http://creativecommons.org/licenses/by-nc-nd/4.0/
- Abstract: We investigate active learning in Gaussian Process state-space models
(GPSSM). Our problem is to actively steer the system through latent states by
determining its inputs such that the underlying dynamics can be optimally
learned by a GPSSM. In order that the most informative inputs are selected, we
employ mutual information as our active learning criterion. In particular, we
present two approaches for the approximation of mutual information for the
GPSSM given latent states. The proposed approaches are evaluated in several
physical systems where we actively learn the underlying non-linear dynamics
represented by the state-space model.
- Abstract(参考訳): ガウス過程状態空間モデル(GPSSM)におけるアクティブラーニングについて検討する。
我々の課題は、GPSSMによって基礎となる力学を最適に学べるように入力を決定することで、潜伏状態を通して積極的にシステムを操ることである。
最も情報性の高い入力が選択されるためには、相互情報をアクティブな学習基準として採用する。
特に,潜在状態が与えられたgpssmの相互情報の近似に2つのアプローチを提案する。
提案手法は、状態空間モデルで表される非線形力学を積極的に学習する物理系で評価される。
関連論文リスト
- Spatio-Temporal Branching for Motion Prediction using Motion Increments [55.89014020303557]
HMP(Human Motion Prediction)はその多種多様な応用により、人気のある研究トピックとして浮上している。
従来の手法は手作りの機能と機械学習技術に依存している。
HMPのためのインクリメンタル情報を用いた時空間分岐ネットワークを提案する。
論文 参考訳(メタデータ) (2023-08-02T12:04:28Z) - Safe Multi-agent Learning via Trapping Regions [89.24858306636816]
我々は、動的システムの定性理論から知られているトラップ領域の概念を適用し、分散学習のための共同戦略空間に安全セットを作成する。
本稿では,既知の学習力学を持つシステムにおいて,候補がトラップ領域を形成することを検証するための二分分割アルゴリズムと,学習力学が未知のシナリオに対するサンプリングアルゴリズムを提案する。
論文 参考訳(メタデータ) (2023-02-27T14:47:52Z) - Deep active learning for nonlinear system identification [0.4485566425014746]
我々は非線形システム同定のための新しい深層能動学習手法を開発した。
グローバル探索は、最も情報に富む状態-行動軌道に対応する初期状態のバッチを取得する。
局所的な探索は最適な制御問題を解き、情報の測度を最大化する制御軌道を見つける。
論文 参考訳(メタデータ) (2023-02-24T14:46:36Z) - Physics-Informed Kernel Embeddings: Integrating Prior System Knowledge
with Data-Driven Control [22.549914935697366]
カーネル埋め込みを用いたデータ駆動制御アルゴリズムに事前知識を組み込む手法を提案する。
提案手法は,カーネル学習問題におけるバイアス項として,システムダイナミクスの事前知識を取り入れたものである。
純粋にデータ駆動ベースライン上でのサンプル効率の向上と,我々のアプローチのアウト・オブ・サンプル一般化を実証する。
論文 参考訳(メタデータ) (2023-01-09T18:35:32Z) - GEM: Group Enhanced Model for Learning Dynamical Control Systems [78.56159072162103]
サンプルベースの学習が可能な効果的なダイナミクスモデルを構築します。
リー代数ベクトル空間上のダイナミクスの学習は、直接状態遷移モデルを学ぶよりも効果的であることを示す。
この研究は、ダイナミクスの学習とリー群の性質の関連性を明らかにし、新たな研究の方向への扉を開く。
論文 参考訳(メタデータ) (2021-04-07T01:08:18Z) - Model-free Representation Learning and Exploration in Low-rank MDPs [64.72023662543363]
低位mdpに対して,最初のモデルフリー表現学習アルゴリズムを提案する。
主要なアルゴリズムの貢献は新しいミニマックス表現の学習の目的です。
結果は複雑な環境にスケールする一般的な関数近似を収容できます。
論文 参考訳(メタデータ) (2021-02-14T00:06:54Z) - Learning Dynamical Systems with Side Information [2.28438857884398]
いくつかの軌跡のノイズ観測から力学系を学習するための枠組みを提案する。
多くのアプリケーションで自然に発生する6種類のサイド情報を識別する。
本研究では,物理・細胞生物学における基礎モデルの力学を学習するための側面情報の付加価値と,疫学におけるモデルの力学の学習と制御について述べる。
論文 参考訳(メタデータ) (2020-08-23T23:30:48Z) - Active Learning for Nonlinear System Identification with Guarantees [102.43355665393067]
状態遷移が既知の状態-作用対の特徴埋め込みに線形に依存する非線形力学系のクラスについて検討する。
そこで本稿では, トラジェクティブ・プランニング, トラジェクティブ・トラッキング, システムの再推定という3つのステップを繰り返すことで, この問題を解決するためのアクティブ・ラーニング・アプローチを提案する。
本手法は, 非線形力学系を標準線形回帰の統計速度と同様, パラメトリック速度で推定する。
論文 参考訳(メタデータ) (2020-06-18T04:54:11Z) - Planning from Images with Deep Latent Gaussian Process Dynamics [2.924868086534434]
計画は既知の環境力学の問題を制御するための強力なアプローチである。
未知の環境では、エージェントは計画を適用するためにシステムダイナミクスのモデルを学ぶ必要がある。
本稿では,環境と視覚的相互作用から低次元システムダイナミクスを学習する,遅延ガウス過程力学(DLGPD)モデルを提案する。
論文 参考訳(メタデータ) (2020-05-07T21:29:45Z) - Localized active learning of Gaussian process state space models [63.97366815968177]
多くの共通制御アプリケーションにおいて、優れた性能を達成するためには、グローバルに正確なモデルを必要としない。
本稿では,状態-作用空間の有界部分集合上の正確なモデルを得ることを目的としたガウス過程状態空間モデルに対する能動的学習戦略を提案する。
モデル予測制御を用いることで、探索中に収集した情報を統合し、探索戦略を適応的に改善する。
論文 参考訳(メタデータ) (2020-05-04T05:35:02Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。