論文の概要: Explore the Context: Optimal Data Collection for Context-Conditional
Dynamics Models
- arxiv url: http://arxiv.org/abs/2102.11394v1
- Date: Mon, 22 Feb 2021 22:52:39 GMT
- ステータス: 処理完了
- システム内更新日: 2021-02-24 14:03:30.033476
- Title: Explore the Context: Optimal Data Collection for Context-Conditional
Dynamics Models
- Title(参考訳): コンテキストを探索する:コンテキスト条件ダイナミクスモデルのための最適データ収集
- Authors: Jan Achterhold and Joerg Stueckler
- Abstract要約: 特性の異なる動的系のパラメータ化ファミリのダイナミクスモデルを学ぶ。
我々は、限られた数の環境相互作用に対して、与えられたシステムを最適に探索するアクションシーケンスを計算する。
非線形トイプロブレムと2つの有名な強化学習環境における探索手法の有効性を実証する。
- 参考スコア(独自算出の注目度): 2.66512000865131
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: In this paper, we learn dynamics models for parametrized families of
dynamical systems with varying properties. The dynamics models are formulated
as stochastic processes conditioned on a latent context variable which is
inferred from observed transitions of the respective system. The probabilistic
formulation allows us to compute an action sequence which, for a limited number
of environment interactions, optimally explores the given system within the
parametrized family. This is achieved by steering the system through
transitions being most informative for the context variable. We demonstrate the
effectiveness of our method for exploration on a non-linear toy-problem and two
well-known reinforcement learning environments.
- Abstract(参考訳): 本稿では,特性の異なる動的系のパラメータ化族のダイナミクスモデルについて検討する。
力学モデルは、各系の観測された遷移から推定される潜在コンテキスト変数に基づく確率過程として定式化される。
確率的定式化により、限られた数の環境相互作用に対して、パラメトリズドファミリー内の与えられたシステムを最適に探索するアクションシーケンスを計算できる。
これは、コンテキスト変数に対して最も有益な遷移を通じてシステムをステアリングすることで達成される。
非線形トイプロブレムと2つの有名な強化学習環境における探索手法の有効性を実証する。
関連論文リスト
- Learning System Dynamics without Forgetting [60.08612207170659]
未知の力学を持つ系の軌道予測は、物理学や生物学を含む様々な研究分野において重要である。
本稿では,モードスイッチンググラフODE (MS-GODE) の新たなフレームワークを提案する。
生体力学の異なる多様な系を特徴とする生体力学システムの新しいベンチマークを構築した。
論文 参考訳(メタデータ) (2024-06-30T14:55:18Z) - Data-Driven Model Selections of Second-Order Particle Dynamics via
Integrating Gaussian Processes with Low-Dimensional Interacting Structures [0.9821874476902972]
我々は、一般の2階粒子モデルにおけるデータ駆動的な発見に焦点を当てる。
本稿では、2つの実世界の魚の動きデータセットのモデリングへの応用について述べる。
論文 参考訳(メタデータ) (2023-11-01T23:45:15Z) - Learning minimal representations of stochastic processes with
variational autoencoders [52.99137594502433]
プロセスを記述するのに必要なパラメータの最小セットを決定するために、教師なしの機械学習アプローチを導入する。
我々の手法はプロセスを記述する未知のパラメータの自律的な発見を可能にする。
論文 参考訳(メタデータ) (2023-07-21T14:25:06Z) - Learning Latent Dynamics via Invariant Decomposition and
(Spatio-)Temporal Transformers [0.6767885381740952]
本研究では,高次元経験データから力学系を学習する手法を提案する。
我々は、システムの複数の異なるインスタンスからデータが利用できる設定に焦点を当てる。
我々は、単純な理論的分析と、合成および実世界のデータセットに関する広範な実験を通して行動を研究する。
論文 参考訳(メタデータ) (2023-06-21T07:52:07Z) - Latent Variable Representation for Reinforcement Learning [131.03944557979725]
モデルに基づく強化学習のサンプル効率を改善するために、潜在変数モデルが学習、計画、探索をいかに促進するかは理論上、実証上、不明である。
状態-作用値関数に対する潜在変数モデルの表現ビューを提供する。これは、抽出可能な変分学習アルゴリズムと楽観主義/悲観主義の原理の効果的な実装の両方を可能にする。
特に,潜伏変数モデルのカーネル埋め込みを組み込んだUPB探索を用いた計算効率の良い計画アルゴリズムを提案する。
論文 参考訳(メタデータ) (2022-12-17T00:26:31Z) - Learning Interacting Dynamical Systems with Latent Gaussian Process ODEs [13.436770170612295]
本研究では,対話対象の連続時間力学の不確実性を考慮したモデリングを初めて行った。
我々のモデルは、独立力学と信頼性のある不確実性推定との相互作用の両方を推測する。
論文 参考訳(メタデータ) (2022-05-24T08:36:25Z) - Capturing Actionable Dynamics with Structured Latent Ordinary
Differential Equations [68.62843292346813]
本稿では,その潜在表現内でのシステム入力の変動をキャプチャする構造付き潜在ODEモデルを提案する。
静的変数仕様に基づいて,本モデルではシステムへの入力毎の変動要因を学習し,潜在空間におけるシステム入力の影響を分離する。
論文 参考訳(メタデータ) (2022-02-25T20:00:56Z) - Structure-Preserving Learning Using Gaussian Processes and Variational
Integrators [62.31425348954686]
本稿では,機械系の古典力学に対する変分積分器と,ガウス過程の回帰による残留力学の学習の組み合わせを提案する。
我々は、既知のキネマティック制約を持つシステムへのアプローチを拡張し、予測の不確実性に関する公式な境界を提供する。
論文 参考訳(メタデータ) (2021-12-10T11:09:29Z) - Meta-learning using privileged information for dynamics [66.32254395574994]
Neural ODE Processモデルを拡張して、Learning Using Privileged Information設定内の追加情報を使用します。
シミュレーション動的タスクの精度とキャリブレーションを向上した実験により拡張性を検証する。
論文 参考訳(メタデータ) (2021-04-29T12:18:02Z) - Automatic Differentiation and Continuous Sensitivity Analysis of Rigid
Body Dynamics [15.565726546970678]
剛体力学のための微分可能な物理シミュレータを提案する。
軌道最適化の文脈では、閉ループモデル予測制御アルゴリズムを導入する。
論文 参考訳(メタデータ) (2020-01-22T03:54:00Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。