論文の概要: Biased Dreams: Limitations to Epistemic Uncertainty Quantification in Latent Space Models
- arxiv url: http://arxiv.org/abs/2604.25416v1
- Date: Tue, 28 Apr 2026 09:27:01 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-04-29 16:49:17.794828
- Title: Biased Dreams: Limitations to Epistemic Uncertainty Quantification in Latent Space Models
- Title(参考訳): バイアスドドリーム:後期宇宙モデルにおけるてんかん不確実性定量化の限界
- Authors: Julia Berger, Bernd Frauenknecht, Sebastian Trimpe, Bastian Leibe,
- Abstract要約: 潜在遷移は、潜在空間のよく表現された領域に偏りを示し、真の環境力学から逸脱する引き金の挙動を示す。
これらの誘引者は高水準の地域にあることが多いため、潜在ロールアウトは体系的に予測された報酬を過大評価する。
- 参考スコア(独自算出の注目度): 21.96882320671615
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Model-Based Reinforcement Learning distinguishes between physical dynamics models operating on proprioceptive inputs and latent dynamics models operating on high-dimensional image observations. A prominent latent approach is the Recurrent State Space Model used in the Dreamer family. While epistemic uncertainty quantification to inform exploration and mitigate model exploitation is well established for physical dynamics models, its transfer to latent dynamics models has received limited scrutiny. We empirically demonstrate that latent transitions are biased toward well-represented regions of latent space, exhibiting an attractor behavior that can deviate from true environment dynamics. As a result, discrepancies in environment dynamics may not manifest in latent space, undermining the reliability of epistemic uncertainty estimates. Because these attractors often lie in high-reward regions, latent rollouts systematically overestimate predicted rewards. Our findings highlight key limitations of epistemic uncertainty estimation in latent dynamics models and motivate more critical evaluation of this method.
- Abstract(参考訳): モデルベース強化学習は、主受容入力で動作する物理力学モデルと高次元画像観測で動作する潜在力学モデルとを区別する。
リカレント・ステート・スペース・モデル(Recurrent State Space Model)は、ドリーマー・ファミリーで使用される宇宙モデルである。
物理力学モデルでは,探索および緩和モデル利用を知らせる疫学的な不確実性定量化が確立されているが,潜伏力学モデルへの移行は限定的な調査を受けている。
我々は、潜伏遷移が潜在空間のよく表現された領域に偏りがあることを実証的に示し、真の環境力学から逸脱する引き金の挙動を示す。
その結果、環境力学における相違は潜伏空間に現れず、疫学的な不確実性推定の信頼性を損なう可能性がある。
これらの誘引者は高水準の地域にあることが多いため、潜在ロールアウトは体系的に予測された報酬を過大評価する。
本研究は,潜伏動態モデルにおける疫学的不確実性評価の重要な限界を強調し,この手法のより重要な評価を動機づけるものである。
関連論文リスト
- Generalizing Dynamics Modeling More Easily from Representation Perspective [17.958624542632947]
我々はPDEDER(Generalized Pre-trained Dynamics EncoDER)を行う。
PDEDERは、元の状態の観測結果をより容易に取得できる潜在空間に埋め込む。
ドメイン内設定とクロスドメイン設定の両方で,PDEDERを短時間・長期の予測によって評価する。
論文 参考訳(メタデータ) (2026-03-24T00:15:47Z) - Aligning Agentic World Models via Knowledgeable Experience Learning [68.85843641222186]
環境フィードバックをシンセサイザー化したWorld Knowledge Repositoryを構築するフレームワークであるWorldMindを紹介する。
WorldMindは、優れたクロスモデルとクロス環境転送性を備えたベースラインよりも優れたパフォーマンスを実現している。
論文 参考訳(メタデータ) (2026-01-19T17:33:31Z) - SmallWorlds: Assessing Dynamics Understanding of World Models in Isolated Environments [15.243547292947397]
我々はSmallWorld Benchmarkを紹介した。これは、分離された、正確に制御された動的条件下での世界モデル能力を評価するために設計されたテストベッドである。
我々は、Recurrent State Space Model、Transformer、Diffusion Model、Neural ODEなどの代表的アーキテクチャ上で、完全に観測可能な状態空間で包括的な実験を行う。
実験結果から, これらのモデルが環境構造を効果的に把握し, ロールアウトによる予測がいかに悪化するかが明らかになった。
論文 参考訳(メタデータ) (2025-11-28T18:56:02Z) - Diffusion Dynamics Models with Generative State Estimation for Cloth Manipulation [31.868248649812088]
衣服の操作は、非常に複雑なダイナミクス、ほぼ無限の自由度、そして頻繁な自己閉塞によって困難である。
本稿では,知覚と動的モデリングの両方に対する拡散に基づく生成手法を提案する。
本研究では,実際のロボットシステムにおいて,布の折り畳みを効果的に行うことができることを示す。
論文 参考訳(メタデータ) (2025-03-15T05:34:26Z) - When predict can also explain: few-shot prediction to select better neural latents [2.8933605229876664]
広く使われている1つのメソッドである$textitco-smoothing$は、潜在変数を共同で推定し、保持されたチャネルに沿って観測を予測する。
高い共平度を持つモデルは、その潜在表現において任意の外部ダイナミクスを持つことができることを示す。
すべてのモデルペアの潜伏変数を高共平滑化でクロスデコードすることにより、最小限の外部ダイナミクスを持つモデルを同定する。
論文 参考訳(メタデータ) (2024-05-23T10:48:30Z) - Exploring Model Transferability through the Lens of Potential Energy [78.60851825944212]
トランスファーラーニングは、事前訓練されたディープラーニングモデルが広く利用可能であることから、コンピュータビジョンタスクにおいて重要になっている。
既存のトレーニング済みモデルの転送可能性の測定方法は、符号化された静的特徴とタスクラベルの間の統計的相関に依存する。
我々はこれらの課題に対処するために,PEDという物理に着想を得たアプローチを提案する。
論文 参考訳(メタデータ) (2023-08-29T07:15:57Z) - Latent Diffusion Energy-Based Model for Interpretable Text Modeling [104.85356157724372]
本稿では,拡散モデルと潜時空間ESMの共生を変動学習フレームワークで導入する。
我々は,学習した潜在空間の品質を向上させるために,情報ボトルネックと合わせて幾何学的クラスタリングに基づく正規化を開発する。
論文 参考訳(メタデータ) (2022-06-13T03:41:31Z) - SyMetric: Measuring the Quality of Learnt Hamiltonian Dynamics Inferred
from Vision [73.26414295633846]
最近提案されたモデルのクラスは、高次元観測から潜在力学を学習しようと試みている。
既存の手法は画像再構成の品質に依存しており、学習した潜在力学の質を常に反映しているわけではない。
我々は、基礎となるハミルトン力学が忠実に捕獲されたかどうかのバイナリ指標を含む、一連の新しい尺度を開発する。
論文 参考訳(メタデータ) (2021-11-10T23:26:58Z) - Likelihood-Free Inference in State-Space Models with Unknown Dynamics [71.94716503075645]
本研究では、状態空間モデルにおいて、観測をシミュレートすることしかできず、遷移ダイナミクスが不明な潜在状態の推測と予測を行う手法を提案する。
本研究では,限られた数のシミュレーションで状態予測と状態予測を行う手法を提案する。
論文 参考訳(メタデータ) (2021-11-02T12:33:42Z) - Variational Dynamic for Self-Supervised Exploration in Deep Reinforcement Learning [12.76337275628074]
本研究では,条件付き変分推論に基づく変動力学モデルを提案し,多モード性および生成性をモデル化する。
環境遷移の負の対数類似度の上界を導出し、その上界を探査の本質的な報酬として利用する。
提案手法は,最先端の環境モデルに基づく探索手法よりも優れている。
論文 参考訳(メタデータ) (2020-10-17T09:54:51Z) - Heteroscedastic Uncertainty for Robust Generative Latent Dynamics [7.107159120605662]
本稿では,潜在状態表現と関連するダイナミクスを協調的に学習する手法を提案する。
我々の主な貢献として、我々の表現がヘテロスセダスティックあるいは入力固有の不確実性の概念を捉えることができるかを説明します。
画像に基づく2つのタスクの予測と制御実験の結果を示す。
論文 参考訳(メタデータ) (2020-08-18T21:04:33Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。