論文の概要: Real-Time Hybrid Mapping of Populated Indoor Scenes using a Low-Cost
Monocular UAV
- arxiv url: http://arxiv.org/abs/2203.02453v1
- Date: Fri, 4 Mar 2022 17:31:26 GMT
- ステータス: 処理完了
- システム内更新日: 2022-03-07 16:27:34.632211
- Title: Real-Time Hybrid Mapping of Populated Indoor Scenes using a Low-Cost
Monocular UAV
- Title(参考訳): 低速度単眼UAVを用いた屋内空間のリアルタイムハイブリッドマッピング
- Authors: Stuart Golodetz, Madhu Vankadari, Aluna Everitt, Sangyun Shin, Andrew
Markham and Niki Trigoni
- Abstract要約: 単一UAVに搭載された単眼カメラから同時マッピングと複数人によるポーズ推定を行う最初のシステムを提案する。
特に,身近な室内シーンのハイブリッドマップをリアルタイムに再構築するために,最先端のモノキュラー深度推定とモノキュラー人間のポーズ推定を緩やかに組み合わせる方法について述べる。
- 参考スコア(独自算出の注目度): 42.850288938936075
- License: http://creativecommons.org/licenses/by-nc-sa/4.0/
- Abstract: Unmanned aerial vehicles (UAVs) have been used for many applications in
recent years, from urban search and rescue, to agricultural surveying, to
autonomous underground mine exploration. However, deploying UAVs in tight,
indoor spaces, especially close to humans, remains a challenge. One solution,
when limited payload is required, is to use micro-UAVs, which pose less risk to
humans and typically cost less to replace after a crash. However, micro-UAVs
can only carry a limited sensor suite, e.g. a monocular camera instead of a
stereo pair or LiDAR, complicating tasks like dense mapping and markerless
multi-person 3D human pose estimation, which are needed to operate in tight
environments around people. Monocular approaches to such tasks exist, and dense
monocular mapping approaches have been successfully deployed for UAV
applications. However, despite many recent works on both marker-based and
markerless multi-UAV single-person motion capture, markerless single-camera
multi-person 3D human pose estimation remains a much earlier-stage technology,
and we are not aware of existing attempts to deploy it in an aerial context. In
this paper, we present what is thus, to our knowledge, the first system to
perform simultaneous mapping and multi-person 3D human pose estimation from a
monocular camera mounted on a single UAV. In particular, we show how to loosely
couple state-of-the-art monocular depth estimation and monocular 3D human pose
estimation approaches to reconstruct a hybrid map of a populated indoor scene
in real time. We validate our component-level design choices via extensive
experiments on the large-scale ScanNet and GTA-IM datasets. To evaluate our
system-level performance, we also construct a new Oxford Hybrid Mapping dataset
of populated indoor scenes.
- Abstract(参考訳): 無人航空機(UAV)は近年、都市探索や救助、農業調査、自律的な地下地雷探査など、多くの用途に利用されている。
しかし、特に人間に近い密集した屋内空間にUAVを配備することは依然として困難である。
制限されたペイロードが必要な場合、マイクロUAVを使用することで、人間にはリスクが低く、クラッシュ後に置き換えるコストも低い。
しかし、マイクロuavは、ステレオペアやライダーではなく単眼カメラのような限られたセンサースイートしか持たず、密接なマッピングや、人を取り巻く狭い環境での操作に必要なマーカーレスマルチパーソン3dポーズ推定などのタスクを複雑にする。
このようなタスクに対する単分子的アプローチが存在し、UAVアプリケーションに高密度な単分子マッピングアプローチが成功している。
しかし、マーカーベースおよびマーカーレスマルチuav単眼モーションキャプチャに関する最近の多くの研究にもかかわらず、マーカーレス単眼3d人間のポーズ推定は、まだかなり初期段階の技術であり、既存の空中環境への展開の試みには気づいていない。
本稿では,一台のuavに搭載された単眼カメラから,同時マッピングと多人数3次元ポーズ推定を行う最初のシステムについて述べる。
特に,最先端のモノキュラー深度推定とモノキュラー3次元人間のポーズ推定を緩やかに組み合わせ,人口密集した屋内シーンのハイブリッドマップをリアルタイムに再構築する方法を示す。
大規模ScanNetおよびGTA-IMデータセットの広範な実験を通じて,コンポーネントレベルの設計選択を検証する。
また,システムレベルの性能を評価するために,屋内環境の人口分布を考慮した新しいオックスフォードハイブリッドマッピングデータセットを構築した。
関連論文リスト
- UAV3D: A Large-scale 3D Perception Benchmark for Unmanned Aerial Vehicles [12.278437831053985]
無人航空機(UAV)は、航空写真、監視、農業など多くの用途で使用されている。
UAVアプリケーションの既存のベンチマークは、主に従来の2D認識タスクのために設計されている。
UAV3Dは1000のシーンで構成され、それぞれに20のフレームと完全な注釈付き3Dバウンディングボックスがある。
論文 参考訳(メタデータ) (2024-10-14T22:24:11Z) - Fully Convolutional One-Stage 3D Object Detection on LiDAR Range Images [96.66271207089096]
FCOS-LiDARは、自律走行シーンのLiDAR点雲のための完全な1段式3Dオブジェクト検出器である。
標準的な2Dコンボリューションを持つRVベースの3D検出器は、最先端のBEVベースの検出器と同等の性能を発揮することを示す。
論文 参考訳(メタデータ) (2022-05-27T05:42:16Z) - AirPose: Multi-View Fusion Network for Aerial 3D Human Pose and Shape
Estimation [51.17610485589701]
本研究では,非構造屋外環境のための新しいマーカーレス3次元モーションキャプチャ(MoCap)システムを提案する。
AirPoseは複数の無人飛行カメラで撮影された画像を使って人間のポーズと形状を推定する。
AirPose自体は、事前校正に頼らずに、人のカメラを校正する。
論文 参考訳(メタデータ) (2022-01-20T09:46:20Z) - Multi-modal 3D Human Pose Estimation with 2D Weak Supervision in
Autonomous Driving [74.74519047735916]
自動運転車(AV)における3次元ポーズ推定(HPE)は,多くの要因において他のユースケースと異なる。
他のユースケース(仮想現実、ゲーム、アニメーションなど)のために収集されたデータは、AVアプリケーションには使用できない可能性がある。
本稿では,この問題をAV設定で緩和するための最初のアプローチの1つを提案する。
論文 参考訳(メタデータ) (2021-12-22T18:57:16Z) - A Multi-UAV System for Exploration and Target Finding in Cluttered and
GPS-Denied Environments [68.31522961125589]
複雑なGPSを用いた複雑な環境において,UAVのチームが協調して目標を探索し,発見するための枠組みを提案する。
UAVのチームは自律的にナビゲートし、探索し、検出し、既知の地図で散らばった環境でターゲットを見つける。
その結果, 提案方式は, 時間的コスト, 調査対象地域の割合, 捜索・救助ミッションの成功率などの面で改善されていることがわかった。
論文 参考訳(メタデータ) (2021-07-19T12:54:04Z) - UAV-ReID: A Benchmark on Unmanned Aerial Vehicle Re-identification [21.48667873335246]
近年のディープラーニング開発により、視覚ベースの対UAVシステムは単一のカメラでUAVを検出し、追跡することができる。
単一のカメラのカバー範囲は限られており、カメラ間のUAVにマッチするマルチカメラ構成が必要である。
我々は,この新興地域での機械学習ソリューションの開発を容易にする,UAV-reIDという新しいUAV再識別データセットを提案する。
論文 参考訳(メタデータ) (2021-04-13T14:13:09Z) - Generalizable Multi-Camera 3D Pedestrian Detection [1.8303072203996347]
本稿では,対象シーンからのデータを用いて訓練する必要がないマルチカメラ3D歩行者検出手法を提案する。
既製の単眼検出器から人体のポーズと人のバウンディングボックスに基づく小説を用いて、地上平面上の歩行者の位置を推定する。
次に、これらの場所をワールドグランドプレーンに投影し、クライクカバー問題の新たな定式化と融合させます。
論文 参考訳(メタデータ) (2021-04-12T20:58:25Z) - Distributed Variable-Baseline Stereo SLAM from two UAVs [17.513645771137178]
本稿では,単眼カメラを1台,IMUを1台搭載した2台のUAVを用いて,視界の重なりと相対距離の測定を行った。
本稿では,glsuavエージェントを自律的に制御するために,分散協調推定方式を提案する。
我々は,高度160mまでの飛行におけるアプローチの有効性を実証し,最先端のVIO手法の能力を大きく超えている。
論文 参考訳(メタデータ) (2020-09-10T12:16:10Z) - DronePose: Photorealistic UAV-Assistant Dataset Synthesis for 3D Pose
Estimation via a Smooth Silhouette Loss [27.58747838557417]
UAVアシスタントの3Dローカライゼーションは,ユーザとUAV間の空間情報の交換を容易にする重要なタスクである。
我々はデータ合成パイプラインを設計し、エキソセントリックなユーザビューとエゴセントリックなUAVビューの両方を含む現実的なマルチモーダルデータセットを作成する。
次に,フォトリアリスティックな入力と合成された入力を併用して,単発単眼ポーズ推定モデルを訓練する。
論文 参考訳(メタデータ) (2020-08-20T07:54:56Z) - Unsupervised Cross-Modal Alignment for Multi-Person 3D Pose Estimation [52.94078950641959]
マルチパーソン・ヒューマン・ポーズ推定のためのデプロイフレンドリーで高速なボトムアップ・フレームワークを提案する。
我々は,人物の位置を対応する3Dポーズ表現と統一する,多人数の3Dポーズのニューラル表現を採用する。
ペア化された2Dまたは3Dポーズアノテーションが利用できない実用的な配置パラダイムを提案する。
論文 参考訳(メタデータ) (2020-08-04T07:54:25Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。