論文の概要: Towards Real-World Aerial Vision Guidance with Categorical 6D Pose
Tracker
- arxiv url: http://arxiv.org/abs/2401.04377v1
- Date: Tue, 9 Jan 2024 06:52:23 GMT
- ステータス: 処理完了
- システム内更新日: 2024-01-10 16:42:29.267865
- Title: Towards Real-World Aerial Vision Guidance with Categorical 6D Pose
Tracker
- Title(参考訳): カテゴリー6Dポッドトラッカーを用いた実世界空中視誘導に向けて
- Authors: Jingtao Sun, Yaonan Wang, Danwei Wang
- Abstract要約: オブジェクト6-DoFのポーズを追跡することは、さまざまな下流ロボットタスクや現実世界のアプリケーションに不可欠である。
頑健なカテゴリーレベル6-DoFポーズトラッカー(Robust6DoF)を導入する。
また、Pose-Aware Discrete Servo Strategy (PAD-Servo)を提案する。
- 参考スコア(独自算出の注目度): 25.557500307143446
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Tracking the object 6-DoF pose is crucial for various downstream robot tasks
and real-world applications. In this paper, we investigate the real-world robot
task of aerial vision guidance for aerial robotics manipulation, utilizing
category-level 6-DoF pose tracking. Aerial conditions inevitably introduce
special challenges, such as rapid viewpoint changes in pitch and roll. To
support this task and challenge, we firstly introduce a robust category-level
6-DoF pose tracker (Robust6DoF). This tracker leverages shape and temporal
prior knowledge to explore optimal inter-frame keypoint pairs, generated under
a priori structural adaptive supervision in a coarse-to-fine manner. Notably,
our Robust6DoF employs a Spatial-Temporal Augmentation module to deal with the
problems of the inter-frame differences and intra-class shape variations
through both temporal dynamic filtering and shape-similarity filtering. We
further present a Pose-Aware Discrete Servo strategy (PAD-Servo), serving as a
decoupling approach to implement the final aerial vision guidance task. It
contains two servo action policies to better accommodate the structural
properties of aerial robotics manipulation. Exhaustive experiments on four
well-known public benchmarks demonstrate the superiority of our Robust6DoF.
Real-world tests directly verify that our Robust6DoF along with PAD-Servo can
be readily used in real-world aerial robotic applications.
- Abstract(参考訳): オブジェクト6-DoFのポーズを追跡することは、さまざまな下流ロボットタスクや現実世界のアプリケーションに不可欠である。
本稿では,カテゴリーレベルの6-DoFポーズトラッキングを利用して,空中ロボット操作のための空中視覚誘導の現実ロボットタスクについて検討する。
航空条件は、ピッチやロールの迅速な視点変化など、必然的に特別な課題をもたらす。
この課題と課題を支援するために、まず、ロバスト6DoF(Robust6DoF)というロバストなカテゴリレベルのポーズトラッカーを導入する。
このトラッカーは、形状と時間的事前知識を利用して、粗大な方法で事前構造適応監視の下で生成される最適なフレーム間キーポイントペアを探索する。
特に,我々のRobust6DoFでは,時間的動的フィルタリングと形状相似フィルタリングの両方によるフレーム間差とクラス内形状変化の問題に対処するために,空間時間拡張モジュールを採用している。
さらに,Pose-Aware Discrete Servo(PAD-Servo)戦略について述べる。
エアロロボティクスの操作の構造的特性をよりよく適合させるために、2つのサーボアクションポリシーを含んでいる。
4つのよく知られた公開ベンチマークでの発掘実験は、我々のRobust6DoFの優位性を示している。
実世界のテストは、我々のRobust6DoFとPAD-Servoが現実世界の空中ロボットアプリケーションで容易に利用できることを直接確認します。
関連論文リスト
- Enhancing Autonomous Navigation by Imaging Hidden Objects using Single-Photon LiDAR [12.183773707869069]
単一光子LiDARを用いたNon-Line-of-Sight(NLOS)センシングによる視認性の向上と自律ナビゲーションの向上を目的とした新しいアプローチを提案する。
本手法は,マルチバウンス光情報を利用することで,移動ロボットを「隅々まで見る」ことを可能にする。
論文 参考訳(メタデータ) (2024-10-04T16:03:13Z) - FAFA: Frequency-Aware Flow-Aided Self-Supervision for Underwater Object Pose Estimation [65.01601309903971]
無人水中車両(UUV)の6次元ポーズ推定のための周波数認識フロー支援フレームワークであるFAFAを紹介する。
我々のフレームワークは、3DモデルとRGB画像のみに依存しており、実際のポーズアノテーションや奥行きのような非モダリティデータの必要性を軽減しています。
本研究では,一般的な水中オブジェクトポーズベンチマークにおけるFAFAの有効性を評価し,最先端手法と比較して顕著な性能向上を示した。
論文 参考訳(メタデータ) (2024-09-25T03:54:01Z) - Toward a Plug-and-Play Vision-Based Grasping Module for Robotics [0.0]
本稿では,複数のマニピュレータ間で容易に移動可能な視覚ベースの把握フレームワークを提案する。
このフレームワークは、オープンループ把持軌跡の多様なレパートリーを生成し、把握の多様性を維持しつつ、適応性を向上させる。
論文 参考訳(メタデータ) (2023-10-06T16:16:00Z) - Geometric-aware Pretraining for Vision-centric 3D Object Detection [77.7979088689944]
GAPretrainと呼ばれる新しい幾何学的事前学習フレームワークを提案する。
GAPretrainは、複数の最先端検出器に柔軟に適用可能なプラグアンドプレイソリューションとして機能する。
BEVFormer法を用いて, nuScenes val の 46.2 mAP と 55.5 NDS を実現し, それぞれ 2.7 と 2.1 点を得た。
論文 参考訳(メタデータ) (2023-04-06T14:33:05Z) - GraspNeRF: Multiview-based 6-DoF Grasp Detection for Transparent and
Specular Objects Using Generalizable NeRF [7.47805672405939]
本稿では,マルチビューRGBベースの6-DoFグリップ検出ネットワークGraspNeRFを提案する。
既存のNeRFベースの3-DoFグリップ検出手法と比較して,RGB入力の少ないゼロショットNeRF構成を実現し,リアルタイムに6-DoFグリップを確実に検出できる。
学習データには, 散らばったテーブルトップシーンで把握する大規模フォトリアリスティックなドメインランダム化合成データセットを生成する。
論文 参考訳(メタデータ) (2022-10-12T20:31:23Z) - Inverted Landing in a Small Aerial Robot via Deep Reinforcement Learning
for Triggering and Control of Rotational Maneuvers [11.29285364660789]
高速で頑健な逆着陸は、特に機内でのセンシングと計算に完全に依存しながらも、空中ロボットにとって難しい偉業である。
これまでの研究では、一連の視覚的手がかりとキネマティックな動作の間に直接的な因果関係が特定され、小型の空中ロボットでこの困難なエアロバティックな操作を確実に実行することができた。
本研究では、まずDeep Reinforcement Learningと物理シミュレーションを用いて、頑健な逆着陸のための汎用的最適制御ポリシーを得る。
論文 参考訳(メタデータ) (2022-09-22T14:38:10Z) - VAE-Loco: Versatile Quadruped Locomotion by Learning a Disentangled Gait
Representation [78.92147339883137]
本研究では,特定の歩行を構成する主要姿勢位相を捕捉する潜在空間を学習することにより,制御器のロバスト性を高めることが重要であることを示す。
本研究では,ドライブ信号マップの特定の特性が,歩幅,歩幅,立位などの歩行パラメータに直接関係していることを示す。
生成モデルを使用することで、障害の検出と緩和が容易になり、汎用的で堅牢な計画フレームワークを提供する。
論文 参考訳(メタデータ) (2022-05-02T19:49:53Z) - Autonomous Aerial Robot for High-Speed Search and Intercept Applications [86.72321289033562]
高速物体把握のための完全自律飛行ロボットが提案されている。
追加のサブタスクとして、我々のシステムは、表面に近い極にある気球を自律的にピアスすることができる。
我々のアプローチは、挑戦的な国際競争で検証され、優れた結果が得られました。
論文 参考訳(メタデータ) (2021-12-10T11:49:51Z) - OSCAR: Data-Driven Operational Space Control for Adaptive and Robust
Robot Manipulation [50.59541802645156]
オペレーショナル・スペース・コントロール(OSC)は、操作のための効果的なタスクスペース・コントローラとして使われてきた。
本稿では,データ駆動型OSCのモデル誤差を補償するOSC for Adaptation and Robustness (OSCAR)を提案する。
本手法は,様々なシミュレーション操作問題に対して評価し,制御器のベースラインの配列よりも大幅に改善されていることを示す。
論文 参考訳(メタデータ) (2021-10-02T01:21:38Z) - ReLMoGen: Leveraging Motion Generation in Reinforcement Learning for
Mobile Manipulation [99.2543521972137]
ReLMoGenは、サブゴールを予測するための学習されたポリシーと、これらのサブゴールに到達するために必要な動作を計画し実行するためのモーションジェネレータを組み合わせたフレームワークである。
本手法は,フォトリアリスティック・シミュレーション環境における7つのロボットタスクの多種多様なセットをベンチマークする。
ReLMoGenは、テスト時に異なるモーションジェネレータ間で顕著な転送可能性を示し、実際のロボットに転送する大きな可能性を示している。
論文 参考訳(メタデータ) (2020-08-18T08:05:15Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。