論文の概要: Extracting Latent State Representations with Linear Dynamics from Rich
Observations
- arxiv url: http://arxiv.org/abs/2006.16128v1
- Date: Mon, 29 Jun 2020 15:47:01 GMT
- ステータス: 処理完了
- システム内更新日: 2022-11-15 13:44:41.915132
- Title: Extracting Latent State Representations with Linear Dynamics from Rich
Observations
- Title(参考訳): リッチ観測による線形ダイナミクスによる潜在状態表現の抽出
- Authors: Abraham Frandsen, Rong Ge
- Abstract要約: 本研究では,力学が線形である隠れ線形部分空間が存在するモデルについて検討する。
線形力学を用いて線形部分空間を抽出する効率的なアルゴリズムを提案する。
本手法の有効性を,リッチな観測による簡単な設定で実証的に検証した。
- 参考スコア(独自算出の注目度): 10.382642122818648
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Recently, many reinforcement learning techniques were shown to have provable
guarantees in the simple case of linear dynamics, especially in problems like
linear quadratic regulators. However, in practice, many reinforcement learning
problems try to learn a policy directly from rich, high dimensional
representations such as images. Even if there is an underlying dynamics that is
linear in the correct latent representations (such as position and velocity),
the rich representation is likely to be nonlinear and can contain irrelevant
features. In this work we study a model where there is a hidden linear subspace
in which the dynamics is linear. For such a model we give an efficient
algorithm for extracting the linear subspace with linear dynamics. We then
extend our idea to extracting a nonlinear mapping, and empirically verify the
effectiveness of our approach in simple settings with rich observations.
- Abstract(参考訳): 近年, 線形力学の単純な場合, 特に線形二次レギュレータのような問題において, 多くの強化学習技術が証明可能な保証を持つことが示された。
しかし、実際には多くの強化学習問題は、画像のような豊かな高次元表現から直接ポリシーを学習しようとする。
正しい潜在表現(位置や速度など)で線形である基盤となるダイナミクスがあるとしても、リッチ表現は非線形であり、無関係な特徴を含む可能性がある。
本研究では,動力学が線形である隠れた線形部分空間が存在するモデルについて検討する。
このようなモデルに対して、線形部分空間を線形ダイナミクスで抽出する効率的なアルゴリズムを与える。
次に, 非線形写像の抽出にアイデアを拡張し, 単純な観測条件下でのアプローチの有効性を実証的に検証する。
関連論文リスト
- A New Approach to Learning Linear Dynamical Systems [19.47235707806519]
本稿では,線形力学系を時間軌道からシステムパラメータの誤差まで,初めて学習するアルゴリズムを提案する。
本アルゴリズムはモーメント推定器を用いて,動的に抽出できるパラメータを直接推定する。
論文 参考訳(メタデータ) (2023-01-23T16:07:57Z) - NOMAD: Nonlinear Manifold Decoders for Operator Learning [17.812064311297117]
関数空間における教師付き学習は、機械学習研究の新たな領域である。
関数空間における非線形部分多様体の有限次元表現を学習できる非線形デコーダマップを備えた新しい演算子学習フレームワークであるNOMADについて述べる。
論文 参考訳(メタデータ) (2022-06-07T19:52:44Z) - Understanding the Role of Nonlinearity in Training Dynamics of
Contrastive Learning [37.27098255569438]
本研究では,1層および2層非線形ネットワーク上でのコントラスト学習(CL)の学習力学における非線形性の役割について検討する。
非線形性の存在は1層設定においても多くの局所最適性をもたらすことを示す。
グローバルレベルパターンの観点から識別可能な局所パターンを優先的に学習する。
論文 参考訳(メタデータ) (2022-06-02T23:52:35Z) - Exploring Linear Feature Disentanglement For Neural Networks [63.20827189693117]
Sigmoid、ReLU、Tanhなどの非線形活性化関数は、ニューラルネットワーク(NN)において大きな成功を収めた。
サンプルの複雑な非線形特性のため、これらの活性化関数の目的は、元の特徴空間から線形分離可能な特徴空間へサンプルを投影することである。
この現象は、現在の典型的なNNにおいて、すべての特徴がすべての非線形関数によって変換される必要があるかどうかを探求することに興味をそそる。
論文 参考訳(メタデータ) (2022-03-22T13:09:17Z) - Near-optimal Offline Reinforcement Learning with Linear Representation:
Leveraging Variance Information with Pessimism [65.46524775457928]
オフライン強化学習は、オフライン/歴史的データを活用して、シーケンシャルな意思決定戦略を最適化しようとしている。
線形モデル表現を用いたオフライン強化学習の統計的限界について検討する。
論文 参考訳(メタデータ) (2022-03-11T09:00:12Z) - Linear Adversarial Concept Erasure [108.37226654006153]
与えられた概念に対応する線形部分空間の同定と消去の問題を定式化する。
提案手法は, トラクタビリティと解釈性を維持しつつ, 深い非線形分類器のバイアスを効果的に軽減し, 高い表現性を有することを示す。
論文 参考訳(メタデータ) (2022-01-28T13:00:17Z) - Learning Low-Dimensional Quadratic-Embeddings of High-Fidelity Nonlinear
Dynamics using Deep Learning [9.36739413306697]
データから動的モデルを学ぶことは、エンジニアリング設計、最適化、予測において重要な役割を果たす。
深層学習を用いて高忠実度力学系に対する低次元埋め込みを同定する。
論文 参考訳(メタデータ) (2021-11-25T10:09:00Z) - Deformable Linear Object Prediction Using Locally Linear Latent Dynamics [51.740998379872195]
変形可能な物体(例えばロープ)の予測は、その非線形ダイナミクスと無限次元の構成空間のために困難である。
我々は、将来の潜在状態を予測するのに使用できる局所線形なアクション条件付きダイナミクスモデルを学ぶ。
我々は,本手法が将来10段階まで正確にロープ状態を予測できることを実証的に実証した。
論文 参考訳(メタデータ) (2021-03-26T00:29:31Z) - Online Stochastic Gradient Descent Learns Linear Dynamical Systems from
A Single Trajectory [1.52292571922932]
本研究では,システムを記述する未知の重み行列がブルノフスキー正則形式であれば,システムの未知の基底真理を効率的に推定できることを示した。
具体的には、具体的な境界を導出することにより、SGDは基底真理重みから任意の小さなフロベニウスノルム距離に期待して線型収束することを示す。
論文 参考訳(メタデータ) (2021-02-23T17:48:39Z) - Learning the Linear Quadratic Regulator from Nonlinear Observations [135.66883119468707]
我々は、LQR with Rich Observations(RichLQR)と呼ばれる連続制御のための新しい問題設定を導入する。
本設定では, 線形力学と二次的コストを有する低次元連続潜伏状態によって環境を要約する。
本結果は,システムモデルと一般関数近似における未知の非線形性を持つ連続制御のための,最初の証明可能なサンプル複雑性保証である。
論文 参考訳(メタデータ) (2020-10-08T07:02:47Z) - Learning Bijective Feature Maps for Linear ICA [73.85904548374575]
画像データに適した既存の確率的深層生成モデル (DGM) は, 非線形ICAタスクでは不十分であることを示す。
そこで本研究では,2次元特徴写像と線形ICAモデルを組み合わせることで,高次元データに対する解釈可能な潜在構造を学習するDGMを提案する。
画像上のフローベースモデルや線形ICA、変分オートエンコーダよりも、高速に収束し、訓練が容易なモデルを作成し、教師なしの潜在因子発見を実現する。
論文 参考訳(メタデータ) (2020-02-18T17:58:07Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。