論文の概要: Deep Reinforcement Learning with anticipatory reward in LSTM for Collision Avoidance of Mobile Robots
- arxiv url: http://arxiv.org/abs/2508.07941v1
- Date: Mon, 11 Aug 2025 12:55:51 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-08-12 21:23:29.100498
- Title: Deep Reinforcement Learning with anticipatory reward in LSTM for Collision Avoidance of Mobile Robots
- Title(参考訳): 移動ロボットの衝突回避のためのLSTMにおける予測報酬による深層強化学習
- Authors: Olivier Poulet, Frédéric Guinand, François Guérin,
- Abstract要約: 本稿では,エージェント位置の短期予測に基づく衝突リスク予測手法を提案する。
過去の軌跡に基づいて訓練されたLong Short-Term Memory(LSTM)モデルを用いて,各ロボットの次の位置を推定する。
この予測により,Deep Q-Learning Network (DQN) エージェントの報酬を動的に調節することで,予測される衝突リスクを定義することができる。
- 参考スコア(独自算出の注目度): 0.0
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: This article proposes a collision risk anticipation method based on short-term prediction of the agents position. A Long Short-Term Memory (LSTM) model, trained on past trajectories, is used to estimate the next position of each robot. This prediction allows us to define an anticipated collision risk by dynamically modulating the reward of a Deep Q-Learning Network (DQN) agent. The approach is tested in a constrained environment, where two robots move without communication or identifiers. Despite a limited sampling frequency (1 Hz), the results show a significant decrease of the collisions number and a stability improvement. The proposed method, which is computationally inexpensive, appears particularly attractive for implementation on embedded systems.
- Abstract(参考訳): 本稿では,エージェント位置の短期予測に基づく衝突リスク予測手法を提案する。
過去の軌跡に基づいて訓練されたLong Short-Term Memory(LSTM)モデルを用いて,各ロボットの次の位置を推定する。
この予測により,Deep Q-Learning Network (DQN) エージェントの報酬を動的に調節することで,予測される衝突リスクを定義することができる。
このアプローチは、コミュニケーションや識別子なしで2つのロボットが動く制約のある環境でテストされる。
サンプリング周波数が1Hzに制限されているにもかかわらず, 衝突数が大きく減少し, 安定性が向上した。
提案手法は計算コストが低く,組込みシステムの実装には特に魅力的である。
関連論文リスト
- Model Predictive Control for Crowd Navigation via Learning-Based Trajectory Prediction [2.8544513613730214]
本研究は,物理的コンチネンタルコリールロボット上でのモデル予測制御(MPC)フレームワークにおける,深層学習に基づくソーシャル・インプシシット(SI)歩行者軌道予測器の統合性を評価する。
その結果、SIは軌道予測を改善し、低密度設定でエラーを最大76%削減し、混雑したシーンでの安全性と動きのスムーズさを高めている。
これらの知見はシステムレベルの評価の重要性を強調し、より安全で適応的なナビゲーションを実現するためのSI-MPCフレームワークの約束を強調している。
論文 参考訳(メタデータ) (2025-08-09T19:11:28Z) - Improving Collision-Free Success Rate For Object Goal Visual Navigation Via Two-Stage Training With Collision Prediction [0.0]
衝突のない成功は、航法モデルが対象物に向かって衝突のない経路を見つける能力を評価するために導入された。
既存の航法モデルの衝突のない成功率を改善するために,衝突予測を伴う2段階の訓練手法を提案する。
論文 参考訳(メタデータ) (2025-02-19T07:33:10Z) - Beyond Detection: Leveraging Large Language Models for Cyber Attack Prediction in IoT Networks [4.836070911511429]
本稿では,Long Short Term Memory(LSTM)ネットワークとLarge Language Models(LLM)を組み合わせた新しいネットワーク侵入予測フレームワークを提案する。
我々のフレームワークは、CICIoT2023 IoT攻撃データセットに基づいて評価され、予測能力の大幅な改善を示し、全体的な精度は98%である。
論文 参考訳(メタデータ) (2024-08-26T06:57:22Z) - Real-Time Anomaly Detection and Reactive Planning with Large Language Models [18.57162998677491]
例えば、大規模な言語モデル(LLM)は、インターネットスケールのデータに基づいて訓練され、ゼロショット機能を持つ。
本稿では,潜在的な異常に関する判断を安全な制御フレームワークに組み込む2段階の推論フレームワークを提案する。
これにより、モニターは、四輪車や自動運転車のような動的ロボットシステムの信頼性を向上させることができる。
論文 参考訳(メタデータ) (2024-07-11T17:59:22Z) - Intelligent Trajectory Design for RIS-NOMA aided Multi-robot
Communications [59.34642007625687]
目的は,ロボットの軌道とNOMA復号命令を協調的に最適化することで,マルチロボットシステムにおける全軌道の総和率を最大化することである。
ARIMAモデルとDouble Deep Q-network (D$3$QN)アルゴリズムを組み合わせたML方式を提案する。
論文 参考訳(メタデータ) (2022-05-03T17:14:47Z) - SABER: Data-Driven Motion Planner for Autonomously Navigating
Heterogeneous Robots [112.2491765424719]
我々は、データ駆動型アプローチを用いて、異種ロボットチームをグローバルな目標に向けてナビゲートする、エンドツーエンドのオンラインモーションプランニングフレームワークを提案する。
モデル予測制御(SMPC)を用いて,ロボット力学を満たす制御入力を計算し,障害物回避時の不確実性を考慮した。
リカレントニューラルネットワークは、SMPC有限時間地平線解における将来の状態の不確かさを素早く推定するために用いられる。
ディープQ学習エージェントがハイレベルパスプランナーとして機能し、SMPCにロボットを望ましいグローバルな目標に向けて移動させる目標位置を提供する。
論文 参考訳(メタデータ) (2021-08-03T02:56:21Z) - Congestion-aware Multi-agent Trajectory Prediction for Collision
Avoidance [110.63037190641414]
渋滞パターンを明示的に学習し、新しい「センス--学習--Reason--予測」フレームワークを考案する。
学習段階を2段階に分解することで、「学生」は「教師」から文脈的手がかりを学習し、衝突のない軌跡を生成する。
実験では,提案モデルが合成データセットにおいて衝突のない軌道予測を生成できることを実証する。
論文 参考訳(メタデータ) (2021-03-26T02:42:33Z) - Risk-Sensitive Sequential Action Control with Multi-Modal Human
Trajectory Forecasting for Safe Crowd-Robot Interaction [55.569050872780224]
本稿では,リスクに敏感な最適制御に基づく安全な群集ロボットインタラクションのためのオンラインフレームワークを提案し,そのリスクをエントロピーリスク尺度でモデル化する。
私たちのモジュラーアプローチは、クラウドとロボットの相互作用を学習ベースの予測とモデルベースの制御に分離します。
シミュレーション研究と実世界の実験により、このフレームワークは、現場にいる50人以上の人間との衝突を避けながら、安全で効率的なナビゲーションを実現することができることが示された。
論文 参考訳(メタデータ) (2020-09-12T02:02:52Z) - Risk-Averse MPC via Visual-Inertial Input and Recurrent Networks for
Online Collision Avoidance [95.86944752753564]
本稿では,モデル予測制御(MPC)の定式化を拡張したオンライン経路計画アーキテクチャを提案する。
我々のアルゴリズムは、状態推定の共分散を推論するリカレントニューラルネットワーク(RNN)とオブジェクト検出パイプラインを組み合わせる。
本手法のロバスト性は, 複雑な四足歩行ロボットの力学で検証され, ほとんどのロボットプラットフォームに適用可能である。
論文 参考訳(メタデータ) (2020-07-28T07:34:30Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。