論文の概要: Self-Supervised Learning-Based Path Planning and Obstacle Avoidance Using PPO and B-Splines in Unknown Environments
- arxiv url: http://arxiv.org/abs/2412.02176v1
- Date: Tue, 03 Dec 2024 05:20:29 GMT
- ステータス: 翻訳完了
- システム内更新日: 2024-12-04 15:43:03.358987
- Title: Self-Supervised Learning-Based Path Planning and Obstacle Avoidance Using PPO and B-Splines in Unknown Environments
- Title(参考訳): 未知環境における PPO と B-Splines を用いた自己監督型学習経路計画と障害物回避
- Authors: Shahab Shokouhi, Oguzhan Oruc, May-Win Thein,
- Abstract要約: Smart BSPは、自律ロボット工学におけるリアルタイムパス計画と障害物回避のための高度な自己教師型学習フレームワークである。
提案システムは,PPO(Proximal Policy Optimization)と畳み込みニューラルネットワーク(Convolutional Neural Networks, CNN)とActor-Criticアーキテクチャを統合する。
トレーニングプロセス中に、経路曲率、終端近接、障害物回避を考慮に入れたニュアンスコスト関数を最小化する。
- 参考スコア(独自算出の注目度): 0.0
- License:
- Abstract: This paper introduces SmartBSP, an advanced self-supervised learning framework for real-time path planning and obstacle avoidance in autonomous robotics navigating through complex environments. The proposed system integrates Proximal Policy Optimization (PPO) with Convolutional Neural Networks (CNN) and Actor-Critic architecture to process limited LIDAR inputs and compute spatial decision-making probabilities. The robot's perceptual field is discretized into a grid format, which the CNN analyzes to produce a spatial probability distribution. During the training process a nuanced cost function is minimized that accounts for path curvature, endpoint proximity, and obstacle avoidance. Simulations results in different scenarios validate the algorithm's resilience and adaptability across diverse operational scenarios. Subsequently, Real-time experiments, employing the Robot Operating System (ROS), were carried out to assess the efficacy of the proposed algorithm.
- Abstract(参考訳): 本稿では、複雑な環境をナビゲートする自律ロボットにおける、リアルタイムパス計画と障害物回避のための高度な自己教師型学習フレームワークであるSmartBSPを紹介する。
提案システムは,PPO(Proximal Policy Optimization)とCNN(Convolutional Neural Networks)とActor-Criticアーキテクチャを統合し,限られたLIDAR入力を処理し,空間決定確率を計算する。
ロボットの知覚野はグリッド形式に識別され、CNNが解析して空間確率分布を生成する。
トレーニングプロセス中に、経路曲率、終端近接、障害物回避を考慮に入れたニュアンスコスト関数を最小化する。
シミュレーションの結果、さまざまなシナリオで、さまざまな運用シナリオにわたるアルゴリズムのレジリエンスと適応性を検証する。
その後,ロボット・オペレーティング・システム(ROS)を用いたリアルタイム実験を行い,提案アルゴリズムの有効性を検証した。
関連論文リスト
- Edge AI Collaborative Learning: Bayesian Approaches to Uncertainty Estimation [0.0]
独立エージェントが遭遇するデータの空間的変動を考慮した学習結果における信頼度の決定に焦点をあてる。
協調マッピングタスクをシミュレートするために,Webotsプラットフォームを用いた3次元環境シミュレーションを実装した。
実験により,BNNは分散学習コンテキストにおける不確実性推定を効果的に支援できることが示された。
論文 参考訳(メタデータ) (2024-10-11T09:20:16Z) - Research on Autonomous Robots Navigation based on Reinforcement Learning [13.559881645869632]
我々は、経路計画と意思決定プロセスを最適化するために、Deep Q Network (DQN) と Proximal Policy Optimization (PPO) モデルを使用します。
様々な複雑なシナリオにおいて,これらのモデルの有効性とロバスト性を検証した。
論文 参考訳(メタデータ) (2024-07-02T00:44:06Z) - Learning Coverage Paths in Unknown Environments with Deep Reinforcement Learning [17.69984142788365]
被覆経路計画 (CPP) は、制限された領域の自由空間全体をカバーする経路を見つける問題である。
この課題に対する強化学習の適性について検討する。
本稿では,フロンティアに基づく計算可能なエゴセントリックマップ表現と,全変動に基づく新たな報酬項を提案する。
論文 参考訳(メタデータ) (2023-06-29T14:32:06Z) - CBAGAN-RRT: Convolutional Block Attention Generative Adversarial Network
for Sampling-Based Path Planning [0.0]
本稿では,畳み込みブロック注意生成ネットワークを用いた新しい画像ベース学習アルゴリズム(CBAGAN-RRT)を提案する。
GANモデルから生成された経路の確率分布を用いて,RRTアルゴリズムのサンプリングプロセスを導出する。
我々は、citezhang 2021によって生成されたデータセット上で、我々のネットワークをトレーニングし、テストし、我々のアルゴリズムが過去の最先端アルゴリズムより優れていることを示す。
論文 参考訳(メタデータ) (2023-05-13T20:06:53Z) - Online Learning of Wheel Odometry Correction for Mobile Robots with
Attention-based Neural Network [63.8376359764052]
現代のロボットプラットフォームは、人間の横で毎日運用するために、信頼性の高いローカライゼーションシステムを必要としている。
フィルタされた車輪と慣性オドメトリーに基づく単純なポーズ推定アルゴリズムは、急激なキネマティックな変化とホイールスリップの存在下で失敗することが多い。
本稿では,車輪形状補正のための革新的なオンライン学習手法を提案し,ロバストなマルチソースローカライゼーションシステムを提案する。
論文 参考訳(メタデータ) (2023-03-21T10:30:31Z) - Learning Robust Policy against Disturbance in Transition Dynamics via
State-Conservative Policy Optimization [63.75188254377202]
深層強化学習アルゴリズムは、ソースとターゲット環境の相違により、現実世界のタスクでは不十分な処理を行うことができる。
本研究では,前もって乱れをモデル化せずにロバストなポリシーを学習するための,モデルフリーなアクター批判アルゴリズムを提案する。
いくつかのロボット制御タスクの実験では、SCPOは遷移力学の乱れに対する堅牢なポリシーを学習している。
論文 参考訳(メタデータ) (2021-12-20T13:13:05Z) - SABER: Data-Driven Motion Planner for Autonomously Navigating
Heterogeneous Robots [112.2491765424719]
我々は、データ駆動型アプローチを用いて、異種ロボットチームをグローバルな目標に向けてナビゲートする、エンドツーエンドのオンラインモーションプランニングフレームワークを提案する。
モデル予測制御(SMPC)を用いて,ロボット力学を満たす制御入力を計算し,障害物回避時の不確実性を考慮した。
リカレントニューラルネットワークは、SMPC有限時間地平線解における将来の状態の不確かさを素早く推定するために用いられる。
ディープQ学習エージェントがハイレベルパスプランナーとして機能し、SMPCにロボットを望ましいグローバルな目標に向けて移動させる目標位置を提供する。
論文 参考訳(メタデータ) (2021-08-03T02:56:21Z) - Reconfigurable Intelligent Surface Assisted Mobile Edge Computing with
Heterogeneous Learning Tasks [53.1636151439562]
モバイルエッジコンピューティング(MEC)は、AIアプリケーションに自然なプラットフォームを提供します。
再構成可能なインテリジェントサーフェス(RIS)の助けを借りて、MECで機械学習タスクを実行するインフラストラクチャを提示します。
具体的には,モバイルユーザの送信パワー,基地局のビームフォーミングベクトル,risの位相シフト行列を共同で最適化することにより,参加ユーザの学習誤差を最小化する。
論文 参考訳(メタデータ) (2020-12-25T07:08:50Z) - Risk-Averse MPC via Visual-Inertial Input and Recurrent Networks for
Online Collision Avoidance [95.86944752753564]
本稿では,モデル予測制御(MPC)の定式化を拡張したオンライン経路計画アーキテクチャを提案する。
我々のアルゴリズムは、状態推定の共分散を推論するリカレントニューラルネットワーク(RNN)とオブジェクト検出パイプラインを組み合わせる。
本手法のロバスト性は, 複雑な四足歩行ロボットの力学で検証され, ほとんどのロボットプラットフォームに適用可能である。
論文 参考訳(メタデータ) (2020-07-28T07:34:30Z) - Guided Uncertainty-Aware Policy Optimization: Combining Learning and
Model-Based Strategies for Sample-Efficient Policy Learning [75.56839075060819]
従来のロボットのアプローチは、環境の正確なモデル、タスクの実行方法の詳細な説明、現在の状態を追跡するための堅牢な認識システムに依存している。
強化学習アプローチは、タスクを記述するための報酬信号だけで、生の感覚入力から直接操作することができるが、非常にサンプル非効率で脆弱である。
本研究では,ロボットの知覚・運動パイプラインにおける不正確さを克服できる一般的な手法を得るために,モデルに基づく手法の強みと学習に基づく手法の柔軟性を組み合わせる。
論文 参考訳(メタデータ) (2020-05-21T19:47:05Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。