論文の概要: Maximum Likelihood Learning of Latent Dynamics Without Reconstruction
- arxiv url: http://arxiv.org/abs/2505.23569v1
- Date: Thu, 29 May 2025 15:44:20 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-05-30 18:14:07.953135
- Title: Maximum Likelihood Learning of Latent Dynamics Without Reconstruction
- Title(参考訳): 再建を伴わない潜在ダイナミクスの最大習熟学習
- Authors: Samo Hromadka, Kai Biegun, Lior Fox, James Heald, Maneesh Sahani,
- Abstract要約: 遅延動的構造を持つ時系列データに対する新しい教師なし学習手法:認識パラメタ化ガウス状態空間モデル(RP-GSSM)を提案する。
RP-GSSMは、異なる時間ステップにおける観測間の統計的依存を説明するマルコフ・ガウシアン潜伏子を学習する確率論的モデルである。
ビデオから非線形ダイナミクスを学習することを含む問題に対して、バックグラウンドイントラクタの有無にかかわらず、このアプローチがいかに優れているかを示す。
- 参考スコア(独自算出の注目度): 9.186673054867864
- License: http://creativecommons.org/licenses/by-nc-sa/4.0/
- Abstract: We introduce a novel unsupervised learning method for time series data with latent dynamical structure: the recognition-parametrized Gaussian state space model (RP-GSSM). The RP-GSSM is a probabilistic model that learns Markovian Gaussian latents explaining statistical dependence between observations at different time steps, combining the intuition of contrastive methods with the flexible tools of probabilistic generative models. Unlike contrastive approaches, the RP-GSSM is a valid probabilistic model learned via maximum likelihood. Unlike generative approaches, the RP-GSSM has no need for an explicit network mapping from latents to observations, allowing it to focus model capacity on inference of latents. The model is both tractable and expressive: it admits exact inference thanks to its jointly Gaussian latent prior, while maintaining expressivity with an arbitrarily nonlinear neural network link between observations and latents. These qualities allow the RP-GSSM to learn task-relevant latents without ad-hoc regularization, auxiliary losses, or optimizer scheduling. We show how this approach outperforms alternatives on problems that include learning nonlinear stochastic dynamics from video, with or without background distractors. Our results position the RP-GSSM as a useful foundation model for a variety of downstream applications.
- Abstract(参考訳): 本稿では,認識パラメタ化ガウス状態空間モデル (RP-GSSM) を用いた時系列データの非教師なし学習手法を提案する。
RP-GSSMは確率論的モデルであり、確率的生成モデルの柔軟なツールと対照的な手法の直観を組み合わせることで、異なる時間ステップにおける観測間の統計的依存を説明するマルコフ・ガウスの潜伏学を学習する。
対照的なアプローチとは異なり、RP-GSSMは最大確率によって学習された有効な確率モデルである。
生成的アプローチとは異なり、RP-GSSMは潜伏者から観測者への明示的なネットワークマッピングを必要としないため、潜伏者の推測にモデルキャパシティを集中させることができる。
モデルはトラクタブルかつ表現力があり、観測と潜伏の間の任意の非線形ニューラルネットワークリンクで表現性を維持しながら、その結合したガウス潜伏子により正確な推論を許容する。
これらの特性により、RP-GSSMは、アドホックな正規化、補助損失、オプティマイザスケジューリングなしでタスク関連潜伏者を学ぶことができる。
本稿では,ビデオから非線形確率力学を学ぶことを含む問題に対して,背景障害の有無にかかわらず,この手法が代替手段よりも優れていることを示す。
以上の結果から,RP-GSSMを下流アプリケーションに有用な基礎モデルとして位置づけた。
関連論文リスト
- A Novel Framework for Learning Stochastic Representations for Sequence Generation and Recognition [0.0]
シーケンシャルなデータの生成と認識は、動的環境で動作する自律システムの基本である。
パラメトリックバイアスを用いた新しいリカレントネットワーク(RNNPB)を提案する。
我々のアプローチは、時間パターンをモデル化するためのフレームワークを提供し、人工知能とロボティクスにおける堅牢なシステムの開発を前進させる。
論文 参考訳(メタデータ) (2024-12-30T07:27:50Z) - Reinforcement Learning under Latent Dynamics: Toward Statistical and Algorithmic Modularity [51.40558987254471]
強化学習の現実的な応用は、エージェントが複雑な高次元の観察を行う環境を含むことが多い。
本稿では,統計的・アルゴリズム的な観点から,textit General$ latent dynamicsの下での強化学習の課題に対処する。
論文 参考訳(メタデータ) (2024-10-23T14:22:49Z) - Efficient Exploration in Continuous-time Model-based Reinforcement
Learning [37.14026153342745]
強化学習アルゴリズムは典型的には離散時間力学を考察するが、基礎となるシステムは時間的に連続していることが多い。
連続時間力学を表すモデルに基づく強化学習アルゴリズムを提案する。
論文 参考訳(メタデータ) (2023-10-30T15:04:40Z) - ConCerNet: A Contrastive Learning Based Framework for Automated
Conservation Law Discovery and Trustworthy Dynamical System Prediction [82.81767856234956]
本稿では,DNNに基づく動的モデリングの信頼性を向上させるために,ConCerNetという新しい学習フレームワークを提案する。
本手法は, 座標誤差と保存量の両方において, ベースラインニューラルネットワークよりも一貫して優れていることを示す。
論文 参考訳(メタデータ) (2023-02-11T21:07:30Z) - Latent Variable Representation for Reinforcement Learning [131.03944557979725]
モデルに基づく強化学習のサンプル効率を改善するために、潜在変数モデルが学習、計画、探索をいかに促進するかは理論上、実証上、不明である。
状態-作用値関数に対する潜在変数モデルの表現ビューを提供する。これは、抽出可能な変分学習アルゴリズムと楽観主義/悲観主義の原理の効果的な実装の両方を可能にする。
特に,潜伏変数モデルのカーネル埋め込みを組み込んだUPB探索を用いた計算効率の良い計画アルゴリズムを提案する。
論文 参考訳(メタデータ) (2022-12-17T00:26:31Z) - Unsupervised representation learning with recognition-parametrised
probabilistic models [12.865596223775649]
認識パラメータモデル(RPM)に基づく確率的教師なし学習の新しいアプローチを提案する。
観測が条件独立であるというキー前提の下では、RPMはパラメトリックな事前条件付き潜時分布と非パラメトリックな観測因子を結合する。
RPMは、動物と人工知能の両方にとって重要な機能である観測データの基礎となる有意義な潜在構造を発見する強力なフレームワークを提供する。
論文 参考訳(メタデータ) (2022-09-13T00:33:21Z) - Prediction-Centric Learning of Independent Cascade Dynamics from Partial
Observations [13.680949377743392]
本稿では,このモデルから生成された予測が正確であるような拡散モデルの学習の問題に対処する。
本稿では,スケーラブルな動的メッセージパッシング手法に基づく計算効率のよいアルゴリズムを提案する。
学習モデルからの抽出可能な推論は,元のモデルと比較して限界確率の予測精度がよいことを示す。
論文 参考訳(メタデータ) (2020-07-13T17:58:21Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。