論文の概要: Policy Learning for Active Target Tracking over Continuous SE(3)
Trajectories
- arxiv url: http://arxiv.org/abs/2212.01498v2
- Date: Tue, 16 May 2023 18:25:19 GMT
- ステータス: 処理完了
- システム内更新日: 2023-05-18 20:36:53.042924
- Title: Policy Learning for Active Target Tracking over Continuous SE(3)
Trajectories
- Title(参考訳): 連続SE(3)軌道上のアクティブターゲット追跡のためのポリシー学習
- Authors: Pengzhi Yang, Shumon Koga, Arash Asgharivaskasi, Nikolay Atanasov
- Abstract要約: 本稿では,移動ロボットを用いた動的目標追跡のためのモデルベースポリシー勾配アルゴリズムを提案する。
この課題は、目標分布エントロピーによって測定された目標状態の不確実性を低減するセンサ測定を収集する、移動ロボットの継続的な制御ポリシーを得ることである。
- 参考スコア(独自算出の注目度): 17.02349693502558
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: This paper proposes a novel model-based policy gradient algorithm for
tracking dynamic targets using a mobile robot, equipped with an onboard sensor
with limited field of view. The task is to obtain a continuous control policy
for the mobile robot to collect sensor measurements that reduce uncertainty in
the target states, measured by the target distribution entropy. We design a
neural network control policy with the robot $SE(3)$ pose and the mean vector
and information matrix of the joint target distribution as inputs and attention
layers to handle variable numbers of targets. We also derive the gradient of
the target entropy with respect to the network parameters explicitly, allowing
efficient model-based policy gradient optimization.
- Abstract(参考訳): 本稿では,移動ロボットを用いた動的目標追跡のための新しいモデルベースポリシー勾配アルゴリズムを提案する。
課題は,目標分布エントロピーによって測定された対象状態の不確実性を低減するセンサ計測を,移動ロボットが収集するための連続制御ポリシーを得ることである。
我々は、ロボットの$SE(3)$ poseと、入力層とアテンション層として結合対象分布の平均ベクトルと情報行列を用いてニューラルネットワーク制御ポリシーを設計し、ターゲットの変動数を処理する。
また、ネットワークパラメータに対する対象エントロピーの勾配を明示的に導出し、効率的なモデルに基づくポリシー勾配最適化を可能にした。
関連論文リスト
- Exploring the Adversarial Vulnerabilities of Vision-Language-Action Models in Robotics [70.93622520400385]
本稿では,VLAに基づくロボットシステムのロバスト性を体系的に評価する。
本研究では,ロボット行動の不安定化に空間的基盤を活用する,標的のない位置認識型攻撃目標を提案する。
また、カメラの視野内に小さなカラフルなパッチを配置し、デジタル環境と物理環境の両方で効果的に攻撃を実行する逆パッチ生成アプローチを設計する。
論文 参考訳(メタデータ) (2024-11-18T01:52:20Z) - A Multi-Stage Goal-Driven Network for Pedestrian Trajectory Prediction [6.137256382926171]
本稿では,多段階目標駆動ネットワーク(MGNet)と呼ばれる,歩行者軌道予測の新しい手法を提案する。
ネットワークは、条件付き変分オートエンコーダ(CVAE)、アテンションモジュール、多段階ゴール評価器の3つの主要コンポーネントから構成される。
MGNetの有効性は、JAADおよびPIEデータセットに関する総合的な実験を通して示される。
論文 参考訳(メタデータ) (2024-06-26T03:59:21Z) - Imitating Graph-Based Planning with Goal-Conditioned Policies [72.61631088613048]
本稿では,目標目標条件ポリシにサブゴール条件ポリシを蒸留する自己シミュレーション方式を提案する。
提案手法は,既存の目標条件付きRL手法のサンプル効率を大幅に向上させることができることを実証的に示す。
論文 参考訳(メタデータ) (2023-03-20T14:51:10Z) - TarGF: Learning Target Gradient Field for Object Rearrangement [8.49306925839127]
我々は、オブジェクト配置のより実用的な設定、すなわち、シャッフルされたレイアウトから規範的なターゲット分布へオブジェクトを並べ替えることに焦点を当てる。
報酬工学の目標分布(目標仕様)を記述したり、専門家の軌跡を実証として収集することは困難である。
我々は、目標勾配場(TarGF)の学習にスコアマッチングの目的を用い、目標分布の可能性を高めるために各対象の方向を示す。
論文 参考訳(メタデータ) (2022-09-02T07:20:34Z) - Neural Motion Fields: Encoding Grasp Trajectories as Implicit Value
Functions [65.84090965167535]
本稿では,ニューラルネットワークによってパラメータ化される暗黙的値関数として,オブジェクト点群と相対的タスク軌跡の両方を符号化する新しいオブジェクト表現であるNeural Motion Fieldsを提案する。
このオブジェクト中心表現は、SE(3)空間上の連続分布をモデル化し、サンプリングベースのMPCを利用して、この値関数を最適化することで、反応的に把握することができる。
論文 参考訳(メタデータ) (2022-06-29T18:47:05Z) - SABER: Data-Driven Motion Planner for Autonomously Navigating
Heterogeneous Robots [112.2491765424719]
我々は、データ駆動型アプローチを用いて、異種ロボットチームをグローバルな目標に向けてナビゲートする、エンドツーエンドのオンラインモーションプランニングフレームワークを提案する。
モデル予測制御(SMPC)を用いて,ロボット力学を満たす制御入力を計算し,障害物回避時の不確実性を考慮した。
リカレントニューラルネットワークは、SMPC有限時間地平線解における将来の状態の不確かさを素早く推定するために用いられる。
ディープQ学習エージェントがハイレベルパスプランナーとして機能し、SMPCにロボットを望ましいグローバルな目標に向けて移動させる目標位置を提供する。
論文 参考訳(メタデータ) (2021-08-03T02:56:21Z) - Risk-Averse MPC via Visual-Inertial Input and Recurrent Networks for
Online Collision Avoidance [95.86944752753564]
本稿では,モデル予測制御(MPC)の定式化を拡張したオンライン経路計画アーキテクチャを提案する。
我々のアルゴリズムは、状態推定の共分散を推論するリカレントニューラルネットワーク(RNN)とオブジェクト検出パイプラインを組み合わせる。
本手法のロバスト性は, 複雑な四足歩行ロボットの力学で検証され, ほとんどのロボットプラットフォームに適用可能である。
論文 参考訳(メタデータ) (2020-07-28T07:34:30Z) - Learning to Track Dynamic Targets in Partially Known Environments [48.49957897251128]
我々は、アクティブな目標追跡を解決するために、深層強化学習アプローチを用いる。
特に,アクティブ・トラッカー・ターゲティング・ネットワーク(ATTN)を導入し,アクティブ・ターゲティング・ターゲティングの主要なタスクを解決するための統一的なRLポリシーを提案する。
論文 参考訳(メタデータ) (2020-06-17T22:45:24Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。