論文の概要: Geometry of Uncertainty: Learning Metric Spaces for Multimodal State Estimation in RL
- arxiv url: http://arxiv.org/abs/2602.12087v1
- Date: Thu, 12 Feb 2026 15:41:20 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-02-13 21:07:25.900541
- Title: Geometry of Uncertainty: Learning Metric Spaces for Multimodal State Estimation in RL
- Title(参考訳): 不確かさの幾何学:RLにおけるマルチモーダル状態推定のための距離空間の学習
- Authors: Alfredo Reichlin, Adriano Pacciarelli, Danica Kragic, Miguel Vasco,
- Abstract要約: 高次元・マルチモーダル・ノイズ観測から環境状態を推定することは強化学習(RL)における根本的な課題である
従来のアプローチは不確実性を考慮するために確率モデルに依存しているが、しばしば明示的なノイズ仮定を必要とする。
本稿では,各状態間の距離が,その間の遷移に必要な最小アクション数と相関する構造的潜在表現を学習する新しい手法を提案する。
- 参考スコア(独自算出の注目度): 13.394337316697241
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Estimating the state of an environment from high-dimensional, multimodal, and noisy observations is a fundamental challenge in reinforcement learning (RL). Traditional approaches rely on probabilistic models to account for the uncertainty, but often require explicit noise assumptions, in turn limiting generalization. In this work, we contribute a novel method to learn a structured latent representation, in which distances between states directly correlate with the minimum number of actions required to transition between them. The proposed metric space formulation provides a geometric interpretation of uncertainty without the need for explicit probabilistic modeling. To achieve this, we introduce a multimodal latent transition model and a sensor fusion mechanism based on inverse distance weighting, allowing for the adaptive integration of multiple sensor modalities without prior knowledge of noise distributions. We empirically validate the approach on a range of multimodal RL tasks, demonstrating improved robustness to sensor noise and superior state estimation compared to baseline methods. Our experiments show enhanced performance of an RL agent via the learned representation, eliminating the need of explicit noise augmentation. The presented results suggest that leveraging transition-aware metric spaces provides a principled and scalable solution for robust state estimation in sequential decision-making.
- Abstract(参考訳): 高次元・マルチモーダル・ノイズの観測から環境の状態を評価することは、強化学習(RL)における根本的な課題である。
従来のアプローチは不確実性を考慮するために確率モデルに依存しているが、しばしば明示的な雑音仮定を必要とするため、一般化は制限される。
本研究では、状態間の距離が、それらの間の遷移に必要な最小のアクション数と直接相関する構造的潜在表現を学習するための新しい方法を提案する。
提案された距離空間定式化は、明示的な確率的モデリングを必要としない不確実性の幾何学的解釈を提供する。
これを実現するために,逆距離重み付けに基づくマルチモーダル潜時遷移モデルとセンサ融合機構を導入する。
センサノイズに対するロバスト性の向上と,ベースライン法よりも優れた状態推定を実証し,マルチモーダルRLタスクに対するアプローチを実証的に検証した。
実験では,学習表現によるRLエージェントの性能向上を図り,明示的な雑音増大の必要性を排除した。
以上の結果から,遷移対応距離空間の活用は,逐次意思決定におけるロバストな状態推定のための原理的かつスケーラブルなソリューションを提供する可能性が示唆された。
関連論文リスト
- Learning Causal States Under Partial Observability and Perturbation [29.533770208192845]
既存の手法では、部分的な可観測性に対処しながら摂動を緩和できない。
Asynchronous Diffusion Model (CaDiff) に基づくtextitCausal State Representationを提案する。
CaDiffは、理論的な厳密さと実用性の両方で拡散モデルを用いて因果状態を近似する最初のフレームワークである。
論文 参考訳(メタデータ) (2025-11-29T06:56:03Z) - Latent Diffusion Model Based Denoising Receiver for 6G Semantic Communication: From Stochastic Differential Theory to Application [11.385703484113552]
生成人工知能(GAI)を利用した新しい意味コミュニケーションフレームワークを提案する。
意味的特徴抽出のための変分オートエンコーダを組み合わせた潜在拡散モデル(LDM)に基づくセマンティックコミュニケーションフレームワークを提案する。
提案システムはゼロショットの一般化をサポートし,低SNRおよびアウト・オブ・ディストリビューション条件下での優れた性能を実現する訓練自由フレームワークである。
論文 参考訳(メタデータ) (2025-06-06T03:20:32Z) - Ensemble Kalman Filtering Meets Gaussian Process SSM for Non-Mean-Field and Online Inference [47.460898983429374]
我々は,非平均場(NMF)変動推定フレームワークにアンサンブルカルマンフィルタ(EnKF)を導入し,潜在状態の後方分布を近似する。
EnKFとGPSSMのこの新しい結婚は、変分分布の学習における広範なパラメータ化の必要性をなくすだけでなく、エビデンスの下限(ELBO)の解釈可能でクローズドな近似を可能にする。
得られたEnKF支援オンラインアルゴリズムは、データ適合精度を確保しつつ、モデル正規化を組み込んで過度適合を緩和し、目的関数を具現化する。
論文 参考訳(メタデータ) (2023-12-10T15:22:30Z) - Distributionally Robust Model-based Reinforcement Learning with Large
State Spaces [55.14361269378122]
強化学習における3つの大きな課題は、大きな状態空間を持つ複雑な力学系、コストのかかるデータ取得プロセス、トレーニング環境の展開から現実の力学を逸脱させることである。
広範に用いられているKullback-Leibler, chi-square, および全変分不確実性集合の下で, 連続状態空間を持つ分布ロバストなマルコフ決定過程について検討した。
本稿では,ガウス過程と最大分散削減アルゴリズムを用いて,多出力名目遷移力学を効率的に学習するモデルベースアプローチを提案する。
論文 参考訳(メタデータ) (2023-09-05T13:42:11Z) - Latent Variable Representation for Reinforcement Learning [131.03944557979725]
モデルに基づく強化学習のサンプル効率を改善するために、潜在変数モデルが学習、計画、探索をいかに促進するかは理論上、実証上、不明である。
状態-作用値関数に対する潜在変数モデルの表現ビューを提供する。これは、抽出可能な変分学習アルゴリズムと楽観主義/悲観主義の原理の効果的な実装の両方を可能にする。
特に,潜伏変数モデルのカーネル埋め込みを組み込んだUPB探索を用いた計算効率の良い計画アルゴリズムを提案する。
論文 参考訳(メタデータ) (2022-12-17T00:26:31Z) - Structured Optimal Variational Inference for Dynamic Latent Space Models [16.531262817315696]
動的ネットワークの潜在空間モデルについて検討し、その目的は、ペアの内積と潜在位置のインターセプトを推定することである。
後部推論と計算スケーラビリティのバランスをとるために、構造的平均場変動推論フレームワークを検討する。
論文 参考訳(メタデータ) (2022-09-29T22:10:42Z) - Provable RL with Exogenous Distractors via Multistep Inverse Dynamics [85.52408288789164]
実世界の強化学習(RL)の応用は、メガピクセルカメラから生成されたような高次元の観察にエージェントが対処する必要がある。
従来の研究は表現学習でこのような問題に対処しており、エージェントは生の観察から内因性、潜伏状態の情報を確実に抽出することができる。
しかし、このような手法は観測において時間的に相関するノイズの存在下では失敗する可能性がある。
論文 参考訳(メタデータ) (2021-10-17T15:21:27Z) - Modal Uncertainty Estimation via Discrete Latent Representation [4.246061945756033]
本稿では,インプットとアウトプットの1対1マッピングを,忠実な不確実性対策とともに学習するディープラーニングフレームワークを提案する。
我々のフレームワークは、現在の最先端手法よりもはるかに正確な不確実性推定を実証している。
論文 参考訳(メタデータ) (2020-07-25T05:29:34Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。