論文の概要: Reinforcement Learning for Active Perception in Autonomous Navigation
- arxiv url: http://arxiv.org/abs/2602.01266v1
- Date: Sun, 01 Feb 2026 14:54:40 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-03-23 08:17:41.067215
- Title: Reinforcement Learning for Active Perception in Autonomous Navigation
- Title(参考訳): 自律ナビゲーションにおける能動的知覚のための強化学習
- Authors: Grzegorz Malczyk, Mihir Kulkarni, Kostas Alexis,
- Abstract要約: 本稿では,複雑で未知の環境での自律ナビゲーションにおける能動的認識の課題に対処する。
本稿では,ロボットが目標を達成するだけでなく,カメラを積極的に制御して状況認識を高める,エンドツーエンドの強化学習フレームワークを提案する。
- 参考スコア(独自算出の注目度): 12.508044072300839
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: This paper addresses the challenge of active perception within autonomous navigation in complex, unknown environments. Revisiting the foundational principles of active perception, we introduce an end-to-end reinforcement learning framework in which a robot must not only reach a goal while avoiding obstacles, but also actively control its onboard camera to enhance situational awareness. The policy receives observations comprising the robot state, the current depth frame, and a particularly local geometry representation built from a short history of depth readings. To couple collision-free motion planning with information-driven active camera control, we augment the navigation reward with a voxel-based information metric. This enables an aerial robot to learn a robust policy that balances goal-directed motion with exploratory sensing. Extensive evaluation demonstrates that our strategy achieves safer flight compared to using fixed, non-actuated camera baselines while also inducing intrinsic exploratory behaviors.
- Abstract(参考訳): 本稿では,複雑で未知の環境での自律ナビゲーションにおける能動的認識の課題に対処する。
アクティブな知覚の基本的な原理を再考し、ロボットが障害物を避けながら目標を達成するだけでなく、状況認識を高めるためにカメラのオンボード制御を積極的に行う、エンドツーエンドの強化学習フレームワークを導入する。
このポリシーは、ロボットの状態、現在の深度フレーム、特に深度読み取りの短い歴史から構築された局所的な幾何学的表現を含む観察を受信する。
衝突のないモーションプランニングと情報駆動型アクティブカメラ制御を併用するため,ボクセル情報量計を用いてナビゲーション報酬を増大させる。
これにより、飛行ロボットは、目標指向の運動と探索的なセンシングのバランスをとるための堅牢なポリシーを学ぶことができる。
広汎な評価により,本手法は固定的,非作動的カメラベースラインよりも安全な飛行を実現するとともに,本質的な探索行動も引き起こすことが示された。
関連論文リスト
- SPOT: Spatio-Temporal Obstacle-free Trajectory Planning for UAVs in an Unknown Dynamic Environment [1.9181913148426697]
我々は、視覚に基づくセーフフライト・コリドール(SFC)世代と統合した4次元プランナーを開発した。
シミュレーションおよび実世界のハードウェア実験において,本手法を広範囲に検証し,最先端の手法と比較した。
論文 参考訳(メタデータ) (2026-02-01T12:24:12Z) - Sight Over Site: Perception-Aware Reinforcement Learning for Efficient Robotic Inspection [57.37596278863949]
本研究では,認識・認識の観点からの検査を再考する。
本稿では,目標視認性を主目的とするエンドツーエンド強化学習フレームワークを提案する。
提案手法は,既存の古典的および学習的ナビゲーション手法よりも優れていることを示す。
論文 参考訳(メタデータ) (2025-09-22T15:14:02Z) - Human-Robot Navigation using Event-based Cameras and Reinforcement Learning [1.7614751781649955]
この研究は、イベントカメラと他のセンサーと強化学習を組み合わせたロボットナビゲーションコントローラを導入し、リアルタイムの人間中心ナビゲーションと障害物回避を可能にした。
固定レートで動作し、動きのぼやけや遅延に悩まされる従来のイメージベースコントローラとは異なり、このアプローチはイベントカメラの非同期特性を活用して、フレキシブルな時間間隔で視覚情報を処理する。
論文 参考訳(メタデータ) (2025-06-12T15:03:08Z) - Designing Control Barrier Function via Probabilistic Enumeration for Safe Reinforcement Learning Navigation [55.02966123945644]
本稿では,ニューラルネットワーク検証技術を利用して制御障壁関数(CBF)とポリシー修正機構の設計を行う階層型制御フレームワークを提案する。
提案手法は,安全なCBFベースの制御層を構築するために使用される,安全でない操作領域を特定するための確率的列挙に依存する。
これらの実験は、効率的なナビゲーション動作を維持しながら、安全でない動作を補正する提案手法の能力を実証するものである。
論文 参考訳(メタデータ) (2025-04-30T13:47:25Z) - Hierarchical Reinforcement Learning for Safe Mapless Navigation with Congestion Estimation [7.339743259039457]
本稿では,階層的強化学習(HRL)を利用した安全な地図レスナビゲーションフレームワークを提案する。
その結果,HRLに基づくナビゲーションフレームワークは静的シナリオと動的シナリオの両方で優れていることがわかった。
本研究では,物理的な検証実験を行うために,TurtleBot3ロボット上にHRLベースのナビゲーションフレームワークを実装した。
論文 参考訳(メタデータ) (2025-03-15T08:03:50Z) - Open-World Drone Active Tracking with Goal-Centered Rewards [62.21394499788672]
Drone Visual Active Trackingは、視覚的な観察に基づいてモーションシステムを制御することで、対象物を自律的に追跡することを目的としている。
DATは,世界初となるエア・ツー・グラウンド・トラッキング・ベンチマークである。
また,複雑なシナリオにおけるドローン追跡目標の性能向上を目的としたGC-VATを提案する。
論文 参考訳(メタデータ) (2024-12-01T09:37:46Z) - Robot Navigation with Entity-Based Collision Avoidance using Deep Reinforcement Learning [0.0]
本稿では,ロボットナビゲーションと各種エージェントや障害物とのインタラクションを改善するための,新しい深層強化学習手法を提案する。
このアプローチでは、エンティティタイプに関する情報を使用し、衝突回避を改善し、より安全なナビゲーションを確保する。
ロボットに近づいたり、異なる物体と衝突したりすることを罰する新たな報酬関数を導入する。
論文 参考訳(メタデータ) (2024-08-26T11:16:03Z) - Camera-Radar Perception for Autonomous Vehicles and ADAS: Concepts,
Datasets and Metrics [77.34726150561087]
本研究の目的は、ADASおよび自動運転車のカメラおよびレーダーによる認識の現在のシナリオに関する研究を行うことである。
両センサと融合に関する概念と特徴を提示する。
本稿では、ディープラーニングに基づく検出とセグメンテーションタスクの概要と、車両の認識における主要なデータセット、メトリクス、課題、オープンな質問について説明する。
論文 参考訳(メタデータ) (2023-03-08T00:48:32Z) - Learning Deep Sensorimotor Policies for Vision-based Autonomous Drone
Racing [52.50284630866713]
既存のシステムは、状態推定、計画、制御のために手作業によるコンポーネントを必要とすることが多い。
本稿では、深層感触者ポリシーを学習することで、視覚に基づく自律ドローンレース問題に取り組む。
論文 参考訳(メタデータ) (2022-10-26T19:03:17Z) - Vision-Based Mobile Robotics Obstacle Avoidance With Deep Reinforcement
Learning [49.04274612323564]
障害物回避は、移動ロボットの自律ナビゲーションのための根本的かつ困難な問題です。
本稿では,ロボットが単一眼カメラにのみ依存しなければならない単純な3D環境における障害物回避の問題を検討する。
データ駆動型エンドツーエンドディープラーニングアプローチとして,障害回避問題に取り組む。
論文 参考訳(メタデータ) (2021-03-08T13:05:46Z) - Robot Perception enables Complex Navigation Behavior via Self-Supervised
Learning [23.54696982881734]
本稿では、強化学習(RL)によるアクティブな目標駆動ナビゲーションタスクのためのロボット認識システムの統合手法を提案する。
提案手法は,1つの画像列から直接自己スーパービジョンを用いて得られる,コンパクトな動きと視覚知覚データを時間的に組み込む。
我々は,新しいインタラクティブなCityLearnフレームワークを用いて,実世界の運転データセットであるKITTIとOxford RobotCarのアプローチを実証した。
論文 参考訳(メタデータ) (2020-06-16T07:45:47Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。