Fugu-MT 論文翻訳(概要): Robot Navigation with Entity-Based Collision Avoidance using Deep Reinforcement Learning

論文の概要: Robot Navigation with Entity-Based Collision Avoidance using Deep Reinforcement Learning

arxiv url: http://arxiv.org/abs/2408.14183v1
Date: Mon, 26 Aug 2024 11:16:03 GMT
ステータス: 翻訳完了
システム内更新日: 2024-08-27 14:13:24.773389
Title: Robot Navigation with Entity-Based Collision Avoidance using Deep Reinforcement Learning
Title（参考訳）: 深層強化学習を用いたエンティティベース衝突回避ロボットナビゲーション
Authors: Yury Kolomeytsev, Dmitry Golembiovsky,
Abstract要約: 本稿では,ロボットのさまざまなエージェントや障害物との相互作用を高める新しい手法を提案する。このアプローチでは、エンティティタイプに関する情報を使用し、衝突回避を改善し、より安全なナビゲーションを保証する。本研究では,大人,自転車乗り,子供,静的障害物など,さまざまな物体との衝突に対してロボットをペナルティ化する新たな報酬関数を提案する。
参考スコア（独自算出の注目度）: 0.0
License: http://creativecommons.org/licenses/by/4.0/
Abstract: Efficient navigation in dynamic environments is crucial for autonomous robots interacting with various environmental entities, including both moving agents and static obstacles. In this study, we present a novel methodology that enhances the robot's interaction with different types of agents and obstacles based on specific safety requirements. This approach uses information about the entity types, improving collision avoidance and ensuring safer navigation. We introduce a new reward function that penalizes the robot for collisions with different entities such as adults, bicyclists, children, and static obstacles, and additionally encourages the robot's proximity to the goal. It also penalizes the robot for being close to entities, and the safe distance also depends on the entity type. Additionally, we propose an optimized algorithm for training and testing, which significantly accelerates train, validation, and test steps and enables training in complex environments. Comprehensive experiments conducted using simulation demonstrate that our approach consistently outperforms conventional navigation and collision avoidance methods, including state-of-the-art techniques. To sum up, this work contributes to enhancing the safety and efficiency of navigation systems for autonomous robots in dynamic, crowded environments.
Abstract（参考訳）: 動的環境における効率的なナビゲーションは、移動エージェントと静的障害物の両方を含む様々な環境エンティティと対話する自律ロボットにとって不可欠である。本研究では,特定の安全要件に基づいて,ロボットと異なる種類のエージェントや障害物との相互作用を強化する手法を提案する。このアプローチでは、エンティティタイプに関する情報を使用し、衝突回避を改善し、より安全なナビゲーションを保証する。我々は,大人,自転車,子供,静的障害物など,さまざまな物体と衝突するロボットに対して,新たな報酬関数を導入するとともに,ロボットが目標に近づくことを奨励する。また、ロボットが物体に近いことを罰し、安全な距離は実体の種類にも依存する。さらに、トレーニングとテストのための最適化アルゴリズムを提案する。これは、トレーニング、検証、テストのステップを大幅に加速し、複雑な環境でのトレーニングを可能にする。シミュレーションを用いて実施した総合実験により,従来の航法や衝突回避手法よりも一貫した性能を発揮した。まとめると、この研究は、動的で混み合った環境で自律ロボットのナビゲーションシステムの安全性と効率を高めることに寄与する。

関連論文リスト

Designing Control Barrier Function via Probabilistic Enumeration for Safe Reinforcement Learning Navigation [55.02966123945644]
本稿では,ニューラルネットワーク検証技術を利用して制御障壁関数(CBF)とポリシー修正機構の設計を行う階層型制御フレームワークを提案する。提案手法は,安全なCBFベースの制御層を構築するために使用される,安全でない操作領域を特定するための確率的列挙に依存する。これらの実験は、効率的なナビゲーション動作を維持しながら、安全でない動作を補正する提案手法の能力を実証するものである。
論文参考訳（メタデータ） (2025-04-30T13:47:25Z)
Action Flow Matching for Continual Robot Learning [57.698553219660376]
ロボット工学における継続的な学習は、変化する環境やタスクに常に適応できるシステムを求める。本稿では,オンラインロボット力学モデルアライメントのためのフローマッチングを利用した生成フレームワークを提案する。ロボットは,不整合モデルで探索するのではなく,行動自体を変換することで,より効率的に情報収集を行う。
論文参考訳（メタデータ） (2025-04-25T16:26:15Z)
Safe Human Robot Navigation in Warehouse Scenario [15.277331501780488]
本研究は,制御バリア機能(CBF)を活用し,倉庫ナビゲーションの安全性を高める手法を提案する。学習ベースのCBFとOpen Robotics Middleware Framework(OpenRMF)を統合することで、マルチロボット、マルチエージェントシナリオにおける適応性と安全性向上の制御を実現する。
論文参考訳（メタデータ） (2025-03-27T04:12:27Z)
HEIGHT: Heterogeneous Interaction Graph Transformer for Robot Navigation in Crowded and Constrained Environments [8.974071308749007]
廊下や家具などの環境制約のある密集した対話型群集におけるロボットナビゲーションの問題点について検討する。従来の手法ではエージェントと障害物間のあらゆる種類の相互作用を考慮できないため、安全で非効率なロボット経路につながる。本稿では,ロボットナビゲーションポリシーを強化学習で学習するための構造化フレームワークを提案する。
論文参考訳（メタデータ） (2024-11-19T00:56:35Z)
A Retrospective on the Robot Air Hockey Challenge: Benchmarking Robust, Reliable, and Safe Learning Techniques for Real-world Robotics [53.33976793493801]
私たちは、NeurIPS 2023カンファレンスでRobot Air Hockey Challengeを組織しました。我々は、シム・トゥ・リアルギャップ、低レベルの制御問題、安全性問題、リアルタイム要件、実世界のデータの限られた可用性など、ロボット工学における実践的な課題に焦点を当てる。その結果、学習に基づくアプローチと事前知識を組み合わせたソリューションは、実際のデプロイメントが困難である場合にデータのみに依存するソリューションよりも優れていることがわかった。
論文参考訳（メタデータ） (2024-11-08T17:20:47Z)
Deep Reinforcement Learning with Enhanced PPO for Safe Mobile Robot Navigation [0.6554326244334868]
本研究では,複雑な環境下での自律走行のための移動ロボットの訓練における深層強化学習の適用について検討する。このロボットは、LiDARセンサデータとディープニューラルネットワークを用いて、障害物を回避しつつ、特定の目標に向かって誘導する制御信号を生成する。
論文参考訳（メタデータ） (2024-05-25T15:08:36Z)
Deception Game: Closing the Safety-Learning Loop in Interactive Robot Autonomy [7.915956857741506]
既存の安全手法は、ロボットが実行時に学習し適応する能力を無視することが多く、過度に保守的な行動を引き起こす。本稿では,ロボットの進化する不確実性を明示的に考慮した安全制御ポリシを合成するための,新しいクローズドループパラダイムを提案する。
論文参考訳（メタデータ） (2023-09-03T20:34:01Z)
Safe reinforcement learning of dynamic high-dimensional robotic tasks: navigation, manipulation, interaction [31.553783147007177]
強化学習では、損傷を起こさない環境を探索する上で、安全はより基本的なものである。本稿では,各種ロボット作業の強化学習のための安全探索の新たな定式化について紹介する。我々のアプローチは、幅広い種類のロボットプラットフォームに適用され、データから学んだ複雑な衝突制約の下でも安全を強制する。
論文参考訳（メタデータ） (2022-09-27T11:23:49Z)
Revisiting the Adversarial Robustness-Accuracy Tradeoff in Robot Learning [121.9708998627352]
近年の研究では、現実的なロボット学習の応用において、対人訓練の効果が公平なトレードオフを起こさないことが示されている。本研究は,ロボット学習におけるロバストネスと精度のトレードオフを再考し,最近のロバストトレーニング手法と理論の進歩により,現実のロボット応用に適した対人トレーニングが可能かどうかを解析する。
論文参考訳（メタデータ） (2022-04-15T08:12:15Z)
Socially Compliant Navigation Dataset (SCAND): A Large-Scale Dataset of Demonstrations for Social Navigation [92.66286342108934]
社会ナビゲーションは、ロボットのような自律的なエージェントが、人間のような他の知的エージェントの存在下で、社会的に従順な方法でナビゲートする能力である。私たちのデータセットには8.7時間、128の軌道、25マイルの社会的に適合した人間の遠隔運転デモが含まれています。
論文参考訳（メタデータ） (2022-03-28T19:09:11Z)
SERA: Safe and Efficient Reactive Obstacle Avoidance for Collaborative Robotic Planning in Unstructured Environments [1.5229257192293197]
本稿では,リアクティブな全身障害物回避手法を提案する。ロボットアームは、直接接触することなく、任意の3次元形状の障害物を積極的に回避することができる。本手法は,非定常環境における安全ロボット協調のための堅牢で効果的なソリューションを提供する。
論文参考訳（メタデータ） (2022-03-24T21:11:43Z)
Autonomous Aerial Robot for High-Speed Search and Intercept Applications [86.72321289033562]
高速物体把握のための完全自律飛行ロボットが提案されている。追加のサブタスクとして、我々のシステムは、表面に近い極にある気球を自律的にピアスすることができる。我々のアプローチは、挑戦的な国際競争で検証され、優れた結果が得られました。
論文参考訳（メタデータ） (2021-12-10T11:49:51Z)
SABER: Data-Driven Motion Planner for Autonomously Navigating Heterogeneous Robots [112.2491765424719]
我々は、データ駆動型アプローチを用いて、異種ロボットチームをグローバルな目標に向けてナビゲートする、エンドツーエンドのオンラインモーションプランニングフレームワークを提案する。モデル予測制御(SMPC)を用いて,ロボット力学を満たす制御入力を計算し,障害物回避時の不確実性を考慮した。リカレントニューラルネットワークは、SMPC有限時間地平線解における将来の状態の不確かさを素早く推定するために用いられる。ディープQ学習エージェントがハイレベルパスプランナーとして機能し、SMPCにロボットを望ましいグローバルな目標に向けて移動させる目標位置を提供する。
論文参考訳（メタデータ） (2021-08-03T02:56:21Z)
Bayesian Meta-Learning for Few-Shot Policy Adaptation Across Robotic Platforms [60.59764170868101]
強化学習手法は、重要な性能を達成できるが、同じロボットプラットフォームで収集される大量のトレーニングデータを必要とする。私たちはそれを、さまざまなロボットプラットフォームで共有される共通の構造を捉えるモデルを見つけることを目標とする、数ショットのメタラーニング問題として定式化します。我々は,400個のロボットを用いて,実ロボットピッキング作業とシミュレーションリーチの枠組みを実験的に評価した。
論文参考訳（メタデータ） (2021-03-05T14:16:20Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。