論文の概要: Risk-Guided Diffusion: Toward Deploying Robot Foundation Models in Space, Where Failure Is Not An Option
- arxiv url: http://arxiv.org/abs/2506.17601v1
- Date: Sat, 21 Jun 2025 05:39:04 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-06-24 19:06:36.496285
- Title: Risk-Guided Diffusion: Toward Deploying Robot Foundation Models in Space, Where Failure Is Not An Option
- Title(参考訳): リスクガイドによる拡散: 失敗はオプションではない宇宙にロボットの基礎モデルを配置する
- Authors: Rohan Thakker, Adarsh Patnaik, Vince Kurtz, Jonas Frey, Jonathan Becktor, Sangwoo Moon, Rob Royce, Marcel Kaufmann, Georgios Georgakis, Pascal Roth, Joel Burdick, Marco Hutter, Shehryar Khattak,
- Abstract要約: 近年のジェネレーティブAI手法は,大規模・クロスボデーメントデータセットから意味的に認識されたナビゲーションポリシーを学習する。
人間の認知科学に触発されて、速く学習された「システム-1」と遅い物理ベースの「システム-2」を融合させるリスク誘導拡散フレームワークを提案する。
- 参考スコア(独自算出の注目度): 14.217389097651573
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Safe, reliable navigation in extreme, unfamiliar terrain is required for future robotic space exploration missions. Recent generative-AI methods learn semantically aware navigation policies from large, cross-embodiment datasets, but offer limited safety guarantees. Inspired by human cognitive science, we propose a risk-guided diffusion framework that fuses a fast, learned "System-1" with a slow, physics-based "System-2", sharing computation at both training and inference to couple adaptability with formal safety. Hardware experiments conducted at the NASA JPL's Mars-analog facility, Mars Yard, show that our approach reduces failure rates by up to $4\times$ while matching the goal-reaching performance of learning-based robotic models by leveraging inference-time compute without any additional training.
- Abstract(参考訳): ロボティック宇宙探査ミッションには、安全で信頼性の高い極端に不慣れな地形でのナビゲーションが不可欠である。
近年のジェネレーティブAI手法は,大規模な企業間データセットからセマンティックなナビゲーションポリシーを学習するが,安全性の保証は限られている。
人間の認知科学にインスパイアされたリスク誘導拡散フレームワークを提案する。このフレームワークは、高速で学習された"System-1"と物理ベースの"System-2"とを融合させ、トレーニングと推論の両方で計算を共有し、形式的安全性と適合性を両立させる。
NASA JPLのMars-analog施設(Mars Yard)で実施されたハードウェア実験により、我々のアプローチは、追加のトレーニングなしで推論時間計算を活用することで、学習ベースのロボットモデルの目標達成性能に適合しながら、失敗率を最大4\times$に下げることを示した。
関連論文リスト
- ReGentS: Real-World Safety-Critical Driving Scenario Generation Made Stable [88.08120417169971]
機械学習に基づく自律運転システムは、現実世界のデータでは稀な安全クリティカルなシナリオで課題に直面していることが多い。
この研究は、軌道最適化によって複雑な現実世界の通常のシナリオを変更することによって、安全クリティカルな運転シナリオを生成することを検討する。
提案手法は、頑健なプランナーの訓練には役に立たない非現実的な発散軌道と避けられない衝突シナリオに対処する。
論文 参考訳(メタデータ) (2024-09-12T08:26:33Z) - SoNIC: Safe Social Navigation with Adaptive Conformal Inference and Constrained Reinforcement Learning [26.554847852013737]
SoNICは適応型共形推論と制約付き強化学習を統合する最初のアルゴリズムである。
本手法は,従来の最先端RL法よりも11.67%高い96.93%の成功率を達成する。
実験により,疎密な群集と密集した群集の両方と相互作用して,堅牢で社会的に礼儀正しく意思決定できることを示した。
論文 参考訳(メタデータ) (2024-07-24T17:57:21Z) - Confidence-Controlled Exploration: Efficient Sparse-Reward Policy Learning for Robot Navigation [72.24964965882783]
強化学習(RL)はロボットナビゲーションにおいて有望なアプローチであり、ロボットは試行錯誤を通じて学習することができる。
現実世界のロボットタスクは、しばしばまばらな報酬に悩まされ、非効率な探索と準最適政策に繋がる。
本稿では,RLに基づくロボットナビゲーションにおいて,報酬関数を変更せずにサンプル効率を向上させる新しい手法であるConfidence-Controlled Exploration (CCE)を紹介する。
論文 参考訳(メタデータ) (2023-06-09T18:45:15Z) - Incremental 3D Scene Completion for Safe and Efficient Exploration
Mapping and Planning [60.599223456298915]
本研究では,情報,安全,解釈可能な地図作成と計画に3次元シーン補完を活用することによって,深層学習を探索に統合する新しい手法を提案する。
本手法は,地図の精度を最小限に抑えることで,ベースラインに比べて環境のカバレッジを73%高速化できることを示す。
最終地図にシーン完了が含まれていなくても、ロボットがより情報的な経路を選択するように誘導し、ロボットのセンサーでシーンの測定を35%高速化できることが示される。
論文 参考訳(メタデータ) (2022-08-17T14:19:33Z) - MLNav: Learning to Safely Navigate on Martian Terrains [25.42849032622348]
MLNavは,安全クリティカルで資源に制限のあるシステムのための学習支援パス計画フレームワークである。
MLNavは、安全制約を完全に尊重しながら、経路計画の効率を高めるために、機械学習を司法的に利用している。
我々は,火星の実際の地形データと,難易度の高い合成地形データを用いて高忠実度シミュレーションを検証した。
論文 参考訳(メタデータ) (2022-03-09T07:53:15Z) - Fail-Safe Human Detection for Drones Using a Multi-Modal Curriculum
Learning Approach [1.094245191265935]
KUL-UAVSAFEは、ドローンによる安全クリティカルな人検出の研究のための第一種データセットである。
本稿では,クロスフュージョンハイウェイを用いたCNNアーキテクチャを提案し,マルチモーダルデータのためのカリキュラム学習戦略を提案する。
論文 参考訳(メタデータ) (2021-09-28T12:34:13Z) - Towards Robust Monocular Visual Odometry for Flying Robots on Planetary
Missions [49.79068659889639]
火星に着陸したばかりのIngenuityは、トラバーサビリティの影響を受けない新時代の探検の始まりとなるでしょう。
高速な光フロートラッキングを用いた高能率単分子オードメトリーアルゴリズムを提案する。
また、相対翻訳情報行列の主成分分析に基づいて、スケールドリフトの現在のリスクを推定する新しい手法を提案する。
論文 参考訳(メタデータ) (2021-09-12T12:52:20Z) - SABER: Data-Driven Motion Planner for Autonomously Navigating
Heterogeneous Robots [112.2491765424719]
我々は、データ駆動型アプローチを用いて、異種ロボットチームをグローバルな目標に向けてナビゲートする、エンドツーエンドのオンラインモーションプランニングフレームワークを提案する。
モデル予測制御(SMPC)を用いて,ロボット力学を満たす制御入力を計算し,障害物回避時の不確実性を考慮した。
リカレントニューラルネットワークは、SMPC有限時間地平線解における将来の状態の不確かさを素早く推定するために用いられる。
ディープQ学習エージェントがハイレベルパスプランナーとして機能し、SMPCにロボットを望ましいグローバルな目標に向けて移動させる目標位置を提供する。
論文 参考訳(メタデータ) (2021-08-03T02:56:21Z) - Rule-Based Reinforcement Learning for Efficient Robot Navigation with
Space Reduction [8.279526727422288]
本稿では,強化学習(RL)技術を用いた効率的なナビゲーションに焦点を当てた。
軌道を縮小するために減速ルールを採用し、冗長な探査空間を効果的に削減します。
ヘックスグリッド環境における実際のロボットナビゲーション問題に対する実験は、RuRLが航法性能を向上させることを実証している。
論文 参考訳(メタデータ) (2021-04-15T07:40:27Z) - Learning to be Safe: Deep RL with a Safety Critic [72.00568333130391]
安全なRLへの自然な第一のアプローチは、ポリシーの動作に関する制約を手動で指定することである。
我々は,タスクと環境の1つのセットで安全であることを学習し,その学習した直観を用いて将来の行動を制限することを提案する。
論文 参考訳(メタデータ) (2020-10-27T20:53:20Z) - Learning-to-Fly: Learning-based Collision Avoidance for Scalable Urban
Air Mobility [2.117421588033177]
複数のUASのための分散型オンデマンド空中衝突回避フレームワークであるL2F(Learning-to-Fly)を提案する。
L2Fは,1)学習に基づく意思決定方式と,2)分散線形プログラミングに基づくUAS制御アルゴリズムからなる2段階衝突回避手法である。
本手法のリアルタイム適用性は,MILP法よりも6000ドル高速であり,操作の余地が十分ある場合,100%の衝突を解消できる。
論文 参考訳(メタデータ) (2020-06-23T18:46:31Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。