論文の概要: Systematic Generalization for Predictive Control in Multivariate Time
Series
- arxiv url: http://arxiv.org/abs/2102.05602v1
- Date: Wed, 10 Feb 2021 18:00:45 GMT
- ステータス: 処理完了
- システム内更新日: 2021-02-11 14:52:38.485061
- Title: Systematic Generalization for Predictive Control in Multivariate Time
Series
- Title(参考訳): 多変量時系列における予測制御の系統的一般化
- Authors: Hritik Bansal, Gantavya Bhatt, Pankaj Malhotra, Prathosh A.P
- Abstract要約: 本研究では,力学系の将来の状態軌跡の予測における系統的一般化について検討する。
我々は、大きな地平線まで軌道を予測できる有用な帰納的バイアスの厳密な研究を行う。
- 参考スコア(独自算出の注目度): 8.9409202880533
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Prior work has focused on evaluating the ability of neural networks to reason
about novel combinations from known components, an intrinsic property of human
cognition. In this work, we aim to study systematic generalization in
predicting future state trajectories of a dynamical system, conditioned on past
states' trajectory (dependent variables), past and future actions (control
variables). In our context, systematic generalization implies that a good model
should perform well on all new combinations of future actions after being
trained on all of them, but only on a limited set of their combinations. For
models to generalize out-of-distribution to unseen action combinations, they
should reason about the states and their dependency relation with the applied
actions. We conduct a rigorous study of useful inductive biases that learn to
predict the trajectories up to large horizons well, and capture true dependency
relations between the states and the controls through our synthetic setup, and
simulated data from electric motors.
- Abstract(参考訳): 以前の研究は、人間の認知の本質的特性である既知のコンポーネントから新しい組み合わせを推論するニューラルネットワークの能力を評価することに焦点を当てていた。
本研究では、過去の状態の軌跡(依存変数)、過去および将来の行動(制御変数)に基づいて、動的システムの将来の状態軌跡を予測するための体系的な一般化を研究する。
私たちの文脈では、体系的な一般化は、良いモデルがすべてのアクションで訓練された後に、将来のアクションのすべての新しい組み合わせでうまく機能するべきであることを暗示します。
モデルが非表示のアクションコンビネーションに分散アウト・オブ・ディストリビューションを一般化するためには、状態と適用アクションとの関係を推論する必要がある。
筆者らは, 軌道を水平線まで予測し, 状態と制御の真の依存関係を, 合成装置を用いて把握し, 電動機からのデータをシミュレーションする, 有用な誘導バイアスの厳密な研究を行った。
関連論文リスト
- Dynamic Post-Hoc Neural Ensemblers [55.15643209328513]
本研究では,ニューラルネットワークをアンサンブル手法として活用することを検討する。
低多様性のアンサンブルを学習するリスクを動機として,ベースモデル予測をランダムにドロップすることでモデルの正規化を提案する。
このアプローチはアンサンブル内の多様性を低くし、オーバーフィッティングを減らし、一般化能力を向上させる。
論文 参考訳(メタデータ) (2024-10-06T15:25:39Z) - Enhanced Prediction of Multi-Agent Trajectories via Control Inference and State-Space Dynamics [14.694200929205975]
本稿では,状態空間動的システムモデリングに基づく軌道予測の新しい手法を提案する。
動的システムにおける状態推定の精度を高めるために,制御変数に対する新しいモデリング手法を提案する。
提案手法は,グラフニューラルネットワークと状態空間モデルを統合し,マルチエージェント相互作用の複雑さを効果的に捉える。
論文 参考訳(メタデータ) (2024-08-08T08:33:02Z) - Neural Persistence Dynamics [8.197801260302642]
時間発展する点雲のトポロジにおける力学を学習する問題を考察する。
提案したモデル - $textitNeural Persistence Dynamics$ - は、パラメータ回帰タスクの多種多様なセットで最先端のパフォーマンスを大幅に上回る。
論文 参考訳(メタデータ) (2024-05-24T17:20:18Z) - Cheap and Deterministic Inference for Deep State-Space Models of
Interacting Dynamical Systems [38.23826389188657]
本稿では,基礎となる相互作用力学系をモデル化するために,グラフニューラルネットワークを用いた深部状態空間モデルを提案する。
予測分布はマルチモーダルであり、ガウス混合モデルの形をしており、ガウス成分のモーメントは決定論的モーメントマッチングルールによって計算できる。
我々のモーメントマッチングスキームはサンプルのない推論に利用でき、モンテカルロの代替案と比較してより効率的で安定した訓練がもたらされる。
論文 参考訳(メタデータ) (2023-05-02T20:30:23Z) - Learning Neural Constitutive Laws From Motion Observations for
Generalizable PDE Dynamics [97.38308257547186]
多くのNNアプローチは、支配的PDEと物質モデルの両方を暗黙的にモデル化するエンドツーエンドモデルを学ぶ。
PDEの管理はよく知られており、学習よりも明示的に実施されるべきである、と私たちは主張する。
そこで我々は,ネットワークアーキテクチャを利用したニューラル構成則(Neural Constitutive Laws,NCLaw)と呼ばれる新しいフレームワークを導入する。
論文 参考訳(メタデータ) (2023-04-27T17:42:24Z) - Model-Based Reinforcement Learning with Isolated Imaginations [61.67183143982074]
モデルに基づく強化学習手法であるIso-Dream++を提案する。
我々は、切り離された潜在的想像力に基づいて政策最適化を行う。
これにより、野生の混合力学源を孤立させることで、長い水平振動子制御タスクの恩恵を受けることができる。
論文 参考訳(メタデータ) (2023-03-27T02:55:56Z) - Towards Out-of-Distribution Sequential Event Prediction: A Causal
Treatment [72.50906475214457]
シーケンシャルなイベント予測の目標は、一連の歴史的なイベントに基づいて次のイベントを見積もることである。
実際には、次のイベント予測モデルは、一度に収集されたシーケンシャルなデータで訓練される。
文脈固有の表現を学習するための階層的な分岐構造を持つフレームワークを提案する。
論文 参考訳(メタデータ) (2022-10-24T07:54:13Z) - Physics-Inspired Temporal Learning of Quadrotor Dynamics for Accurate
Model Predictive Trajectory Tracking [76.27433308688592]
クオーロタのシステムダイナミクスを正確にモデル化することは、アジャイル、安全、安定したナビゲーションを保証する上で非常に重要です。
本稿では,ロボットの経験から,四重項系の力学を純粋に学習するための新しい物理インスパイアされた時間畳み込みネットワーク(PI-TCN)を提案する。
提案手法は,スパース時間的畳み込みと高密度フィードフォワード接続の表現力を組み合わせて,正確なシステム予測を行う。
論文 参考訳(メタデータ) (2022-06-07T13:51:35Z) - Distinguishing rule- and exemplar-based generalization in learning
systems [10.396761067379195]
特徴レベルバイアスと例え-vs-ルールバイアスの2つの異なる帰納バイアスについて検討した。
ほとんどの標準ニューラルネットワークモデルは、模範に基づく外挿に対する正当性を持っている。
データ拡張、公平性、体系的一般化に関する研究において、これらの発見がもたらす意味について論じる。
論文 参考訳(メタデータ) (2021-10-08T18:37:59Z) - Adapted projection operator technique for the treatment of initial
correlations [0.0]
本稿では,システム環境相互作用の微視的モデリングに適用可能な摂動的手法を提案する。
提案手法は,従来の投射法よりも長期体制において期待される動的挙動を再現する2つのケーススタディによってさらに説明される。
論文 参考訳(メタデータ) (2021-07-28T18:01:12Z) - Context-aware Dynamics Model for Generalization in Model-Based
Reinforcement Learning [124.9856253431878]
グローバルなダイナミクスモデルを学習するタスクを,(a)ローカルなダイナミクスをキャプチャするコンテキスト潜在ベクトルを学習し,(b)次に条件付き状態を予測するという2つの段階に分割する。
本研究では,コンテキスト潜在ベクトルに動的情報をエンコードするために,コンテキスト潜在ベクトルを前方と後方の両方のダイナミクスを予測するのに役立つような新しい損失関数を導入する。
提案手法は,既存のRL方式と比較して,様々なシミュレーションロボットや制御タスクの一般化能力に優れる。
論文 参考訳(メタデータ) (2020-05-14T08:10:54Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。