論文の概要: Situationally-Aware Dynamics Learning
- arxiv url: http://arxiv.org/abs/2505.19574v1
- Date: Mon, 26 May 2025 06:40:11 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-05-27 16:58:43.220908
- Title: Situationally-Aware Dynamics Learning
- Title(参考訳): 状況認識型ダイナミクス学習
- Authors: Alejandro Murillo-Gonzalez, Lantao Liu,
- Abstract要約: 隠れ状態表現のオンライン学習のための新しいフレームワークを提案する。
提案手法は、非観測パラメータが遷移力学と報酬構造の両方に与える影響を明示的にモデル化する。
シミュレーションと実世界の両方の実験は、データ効率、ポリシー性能、安全で適応的なナビゲーション戦略の出現を著しく改善した。
- 参考スコア(独自算出の注目度): 57.698553219660376
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Autonomous robots operating in complex, unstructured environments face significant challenges due to latent, unobserved factors that obscure their understanding of both their internal state and the external world. Addressing this challenge would enable robots to develop a more profound grasp of their operational context. To tackle this, we propose a novel framework for online learning of hidden state representations, with which the robots can adapt in real-time to uncertain and dynamic conditions that would otherwise be ambiguous and result in suboptimal or erroneous behaviors. Our approach is formalized as a Generalized Hidden Parameter Markov Decision Process, which explicitly models the influence of unobserved parameters on both transition dynamics and reward structures. Our core innovation lies in learning online the joint distribution of state transitions, which serves as an expressive representation of latent ego- and environmental-factors. This probabilistic approach supports the identification and adaptation to different operational situations, improving robustness and safety. Through a multivariate extension of Bayesian Online Changepoint Detection, our method segments changes in the underlying data generating process governing the robot's dynamics. The robot's transition model is then informed with a symbolic representation of the current situation derived from the joint distribution of latest state transitions, enabling adaptive and context-aware decision-making. To showcase the real-world effectiveness, we validate our approach in the challenging task of unstructured terrain navigation, where unmodeled and unmeasured terrain characteristics can significantly impact the robot's motion. Extensive experiments in both simulation and real world reveal significant improvements in data efficiency, policy performance, and the emergence of safer, adaptive navigation strategies.
- Abstract(参考訳): 複雑で非構造的な環境で動く自律ロボットは、内部状態と外界の両方の理解を曖昧にする、潜伏した、観測されていない要因のために重大な課題に直面している。
この課題に対処することで、ロボットは自分たちの運用状況をより深く把握できるようになる。
そこで本研究では,隠れ状態表現のオンライン学習フレームワークを提案する。これはロボットが不明瞭で不確実な状況にリアルタイムで適応し,不適切な動作や誤動作をもたらす。
我々の手法は一般化された隠れパラメータマルコフ決定過程として定式化され、非観測パラメータが遷移力学と報酬構造の両方に与える影響を明示的にモデル化する。
私たちの中心となるイノベーションは、オンライン学習において、潜在エゴと環境要素の表現的な表現として機能する、状態遷移の連関分布を学習することにあります。
この確率論的アプローチは、異なる運用状況に対する識別と適応をサポートし、堅牢性と安全性を向上させる。
ベイジアンオンライン変更点検出の多変量拡張により,本手法は,ロボットのダイナミクスを規定する基礎となるデータ生成過程の変化をセグメント化する。
そして、ロボットの遷移モデルに、最新の状態遷移の連立分布から導かれる現在の状況を象徴的に表現し、適応的かつ文脈対応の意思決定を可能にする。
実世界の有効性を示すために,非構造的地形ナビゲーションの課題において,非構造的かつ非計測的地形特性がロボットの動作に大きな影響を及ぼすようなアプローチを検証した。
シミュレーションと実世界の両方での大規模な実験は、データ効率、ポリシー性能、より安全で適応的なナビゲーション戦略の出現において、大幅に改善されている。
関連論文リスト
- Safety-Critical Traffic Simulation with Guided Latent Diffusion Model [8.011306318131458]
安全クリティカルな交通シミュレーションは、自動運転システムを評価する上で重要な役割を果たす。
本稿では,物理的に現実的で逆向きなシナリオを生成可能なガイド付き潜時拡散モデル(LDM)を提案する。
我々の研究は、現実的な安全クリティカルなシナリオシミュレーションのための効果的なツールを提供し、自律運転システムのより堅牢な評価の道を開く。
論文 参考訳(メタデータ) (2025-05-01T13:33:34Z) - Diffeomorphic Obstacle Avoidance for Contractive Dynamical Systems via Implicit Representations [0.6144680854063939]
本稿では、デモから学んだダイナミックロボットの安全性と堅牢性を両立させるという課題に対処する。
我々は、学習スキルの堅牢な外挿を提供するために、神経収縮力学系を構築している。
我々は、微分同相変換による収縮安定性を維持するフルボディ障害物回避戦略を設計する。
論文 参考訳(メタデータ) (2025-04-26T08:56:51Z) - Robotic World Model: A Neural Network Simulator for Robust Policy Optimization in Robotics [50.191655141020505]
この研究は、長期水平予測、エラー蓄積、およびsim-to-real転送の課題に対処することで、モデルに基づく強化学習を前進させる。
スケーラブルでロバストなフレームワークを提供することで、現実のアプリケーションにおいて適応的で効率的なロボットシステムを実現することができる。
論文 参考訳(メタデータ) (2025-01-17T10:39:09Z) - SAFE-SIM: Safety-Critical Closed-Loop Traffic Simulation with Diffusion-Controllable Adversaries [94.84458417662407]
制御可能なクローズドループ安全クリティカルシミュレーションフレームワークであるSAFE-SIMを紹介する。
提案手法は,1)現実の環境を深く反映した現実的な長距離安全クリティカルシナリオの生成,2)より包括的でインタラクティブな評価のための制御可能な敵行動の提供,の2つの利点をもたらす。
複数のプランナにまたがるnuScenesとnuPlanデータセットを使用して、我々のフレームワークを実証的に検証し、リアリズムと制御性の両方の改善を実証した。
論文 参考訳(メタデータ) (2023-12-31T04:14:43Z) - Amortized Network Intervention to Steer the Excitatory Point Processes [8.15558505134853]
動的グラフ上に発生する励起点過程(すなわちイベントフロー)は、時間と空間を通じて離散事象がどのように広がるかを把握するためのきめ細かいモデルを提供する。
動的グラフ構造を変更してイベントフローを効果的に操縦する方法は、感染症の拡散を抑制する動機となる興味深い問題である。
我々はAmortized Network Interventionsフレームワークを設計し、履歴やその他のコンテキストから最適なポリシーをプールできるようにする。
論文 参考訳(メタデータ) (2023-10-06T11:17:28Z) - Feature Interaction Aware Automated Data Representation Transformation [27.26916497306978]
我々は,マルコフ決定過程をカスケードした階層的強化学習構造を開発し,特徴選択と操作選択を自動化する。
我々は、選択された特徴間の相互作用強度に基づいてエージェントに報酬を与える。その結果、人間の意思決定をエミュレートする特徴空間をインテリジェントかつ効率的に探索する。
論文 参考訳(メタデータ) (2023-09-29T06:48:16Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。