論文の概要: Do We Really Need Immediate Resets? Rethinking Collision Handling for Efficient Robot Navigation
- arxiv url: http://arxiv.org/abs/2605.02192v1
- Date: Mon, 04 May 2026 03:44:37 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-05-05 20:33:50.126203
- Title: Do We Really Need Immediate Resets? Rethinking Collision Handling for Efficient Robot Navigation
- Title(参考訳): 即時リセットは本当に必要か? 効率的なロボットナビゲーションのための衝突処理を再考する
- Authors: Shanze Wang, Xinming Zhang, Siwei Cheng, Xianghui Wang, Hailong Huang, Wei Zhang,
- Abstract要約: ロボットナビゲーションのためのほとんどの深層強化学習(DRL)フレームワークでは、すべての衝突が世界環境のリセットを引き起こし、完全なタスク失敗として罰せられる。
本稿では,地球環境リセットから局所衝突終了を分離するマルチコリレーション・リセット・バジェット(MCB)フレームワークを提案する。
実験により,本フレームワークは早期探索を加速し,従来の単一衝突リセットベースラインよりも成功率と航法効率を向上することが示された。
- 参考スコア(独自算出の注目度): 15.335739520634432
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Should a single collision necessarily terminate an entire navigation episode? In most deep reinforcement learning (DRL) frameworks for robot navigation, this remains the standard practice: every collision immediately triggers a global environment reset and is penalized as a complete task failure. While a collision during deployment naturally indicates task failure, applying the same treatment during training prevents the agent from exploring challenging obstacle configurations, which slows learning progress in the early training phase. In this work, we challenge this convention and propose a Multi-Collision reset Budget (MCB) framework that decouples local collision termination from global environment resets, allowing the agent to retry difficult configurations within the same episode. Experiments on multiple simulated and real-world robotic platforms show that the framework accelerates early-stage exploration and improves both success rate and navigation efficiency over conventional single-collision reset baselines, with a small collision budget producing the largest gains.
- Abstract(参考訳): 一つの衝突は必ずしもナビゲーションのエピソード全体を終わらせるべきなのか?
ロボットナビゲーションのためのほとんどの深層強化学習(DRL)フレームワークでは、これは標準的慣行であり、すべての衝突が直ちに地球環境のリセットをトリガーし、完全なタスク失敗として罰せられる。
デプロイメント中の衝突はタスクの障害を自然に示すが、トレーニング中に同じ処理を適用すると、エージェントが障害の設定に挑戦することを防ぎ、初期のトレーニングフェーズでの学習の進行を遅らせる。
本研究では,地球環境リセットから局所衝突終了を分離し,エージェントが同一エピソード内で困難な設定をリトライできるようにするマルチコリレーション・リセット・バジェット(MCB)フレームワークを提案する。
複数のシミュレーションおよび実世界のロボットプラットフォームの実験により、このフレームワークは早期の探索を加速し、従来の単一衝突リセットベースラインよりも成功率と航法効率を向上し、衝突予算が最小のゲインを生み出すことが示されている。
関連論文リスト
- NaviFormer: A Deep Reinforcement Learning Transformer-like Model to Holistically Solve the Navigation Problem [53.70554593151033]
NaviFormerは、高レベル経路と低レベル軌道の両方を予測することによって、グローバルナビゲーション問題を解決する深層強化学習モデルである。
結果は,各サブプロブレムの制約や難易度を理解することができるため,NaviFormerの競合精度を示す。
計算速度が優れていることは、リアルタイムのミッションに適していることを証明している。
論文 参考訳(メタデータ) (2026-04-18T11:32:34Z) - SEA-Nav: Efficient Policy Learning for Safe and Agile Quadruped Navigation in Cluttered Environments [16.354808611554805]
SEA-Navは四足歩行のための強化学習フレームワークである。
CBFベースのシールドは、安全な速度コマンドを出力するためにナビゲーションポリシーを制約する。
適応的な衝突再現機構と有害な探索報酬を導入し、学習の確率を高める。
論文 参考訳(メタデータ) (2026-03-10T10:13:49Z) - CORAL: Scalable Multi-Task Robot Learning via LoRA Experts [49.759823970016974]
実世界のロボット工学におけるビジョン・ランゲージ・アクション(VLA)モデルは、コアマルチタスク学習の課題を露呈する。
タスク毎に個別の完全なチェックポイントを維持することは、しばしばストレージとデプロイメントの禁止である。
主にマルチタスク干渉を軽減するために設計されたバックボーンおよび非依存のフレームワークであるCORALを提案する。
論文 参考訳(メタデータ) (2026-03-10T07:28:41Z) - Pro-HOI: Perceptive Root-guided Humanoid-Object Interaction [57.252599851031505]
本稿では,知覚根誘導型ヒューマノイドオブジェクトインタラクション,Pro-HOIを紹介する。
Pro-HOIは、堅牢なヒューマノイドロコ操作のための一般化可能なフレームワークである。
ユニツリーG1ロボットの実証検証は、Pro-HOIが一般化と堅牢性においてベースラインを著しく上回っていることを示す。
論文 参考訳(メタデータ) (2026-03-01T14:19:59Z) - High-Speed Vision-Based Flight in Clutter with Safety-Shielded Reinforcement Learning [7.796497371549364]
モデルに基づく安全機構を付加したエンドツーエンドのRLフレームワークを提案する。
トレーニング中は、グローバルなナビゲーションガイダンスを提供する物理インフォームド報酬構造を設計する。
配置中、我々は、厳密な衝突回避制約を強制するために、ポリシー出力を証明可能な安全なセットに投影するリアルタイム安全フィルタを統合する。
論文 参考訳(メタデータ) (2026-02-09T13:47:02Z) - Mastering Diverse, Unknown, and Cluttered Tracks for Robust Vision-Based Drone Racing [22.63301233637327]
ドローンレースの目標を固定した障害物のないトラックの強化学習手法のほとんどは、未知の乱雑な環境に一般化を残したままであった。
この課題は、レース速度と衝突回避のバランスをとる必要があること、限られた実現可能な空間が、訓練中に地元のオプティマに閉じ込められた政策探索を引き起こすことに起因している。
高速飛行のための政策探索を継続する初期ソフトコリデーショントレーニングフェーズと、堅牢な障害物回避を強制するハードコリデーション改善フェーズの2段階学習フレームワークを提案する。
論文 参考訳(メタデータ) (2025-12-10T12:02:48Z) - ReGentS: Real-World Safety-Critical Driving Scenario Generation Made Stable [88.08120417169971]
機械学習に基づく自律運転システムは、現実世界のデータでは稀な安全クリティカルなシナリオで課題に直面していることが多い。
この研究は、軌道最適化によって複雑な現実世界の通常のシナリオを変更することによって、安全クリティカルな運転シナリオを生成することを検討する。
提案手法は、頑健なプランナーの訓練には役に立たない非現実的な発散軌道と避けられない衝突シナリオに対処する。
論文 参考訳(メタデータ) (2024-09-12T08:26:33Z) - Collision Avoidance and Navigation for a Quadrotor Swarm Using End-to-end Deep Reinforcement Learning [8.864432196281268]
本研究では,障害物のある環境下での四元子群制御のためのエンドツーエンドDRL手法を提案する。
筆者らは, 障害物の多い環境下での性能向上を図るために, 衝突エピソードのカリキュラムと再生バッファを提供する。
我々の研究は、エンドツーエンドDRLで訓練された隣人回避および障害物回避制御ポリシーを学習する可能性を示す最初の研究である。
論文 参考訳(メタデータ) (2023-09-23T06:56:28Z) - Coach-assisted Multi-Agent Reinforcement Learning Framework for
Unexpected Crashed Agents [120.91291581594773]
本稿では,予期せぬクラッシュを伴う協調型マルチエージェント強化学習システムの公式な定式化について述べる。
本稿では,教師支援型多エージェント強化学習フレームワークを提案する。
私たちの知る限りでは、この研究はマルチエージェントシステムにおける予期せぬクラッシュを初めて研究したものです。
論文 参考訳(メタデータ) (2022-03-16T08:22:45Z) - ReLMoGen: Leveraging Motion Generation in Reinforcement Learning for
Mobile Manipulation [99.2543521972137]
ReLMoGenは、サブゴールを予測するための学習されたポリシーと、これらのサブゴールに到達するために必要な動作を計画し実行するためのモーションジェネレータを組み合わせたフレームワークである。
本手法は,フォトリアリスティック・シミュレーション環境における7つのロボットタスクの多種多様なセットをベンチマークする。
ReLMoGenは、テスト時に異なるモーションジェネレータ間で顕著な転送可能性を示し、実際のロボットに転送する大きな可能性を示している。
論文 参考訳(メタデータ) (2020-08-18T08:05:15Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。