論文の概要: FlyPose: Towards Robust Human Pose Estimation From Aerial Views
- arxiv url: http://arxiv.org/abs/2601.05747v1
- Date: Fri, 09 Jan 2026 12:01:36 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-01-12 17:41:49.963289
- Title: FlyPose: Towards Robust Human Pose Estimation From Aerial Views
- Title(参考訳): FlyPose:空中からの人間の姿勢推定を頑丈に
- Authors: Hassaan Farooq, Marvin Brenner, Peter St\ütz,
- Abstract要約: 航空画像のための軽量なトップダウン人間のポーズ推定パイプラインであるFlyPoseを訓練し、デプロイする。
我々は,Manipal-UAV,VisDrone,HIT-UAV,および我々のカスタムデータセットを用いて,人物検出における平均6.8mAPの改善を実現した。
FlyPoseは、Jetson Orin AGX Developer Kitでの事前処理を含む、20ミリ秒の推論遅延で動作する。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Unmanned Aerial Vehicles (UAVs) are increasingly deployed in close proximity to humans for applications such as parcel delivery, traffic monitoring, disaster response and infrastructure inspections. Ensuring safe and reliable operation in these human-populated environments demands accurate perception of human poses and actions from an aerial viewpoint. This perspective challenges existing methods with low resolution, steep viewing angles and (self-)occlusion, especially if the application demands realtime feasibile models. We train and deploy FlyPose, a lightweight top-down human pose estimation pipeline for aerial imagery. Through multi-dataset training, we achieve an average improvement of 6.8 mAP in person detection across the test-sets of Manipal-UAV, VisDrone, HIT-UAV as well as our custom dataset. For 2D human pose estimation we report an improvement of 16.3 mAP on the challenging UAV-Human dataset. FlyPose runs with an inference latency of ~20 milliseconds including preprocessing on a Jetson Orin AGX Developer Kit and is deployed onboard a quadrotor UAV during flight experiments. We also publish FlyPose-104, a small but challenging aerial human pose estimation dataset, that includes manual annotations from difficult aerial perspectives: https://github.com/farooqhassaan/FlyPose.
- Abstract(参考訳): 無人航空機(UAV)は、パーセル配送、交通監視、災害対応、インフラ検査などの用途のために、人間に近づきつつある。
これらの人口の多い環境で安全かつ信頼性の高い操作を確実にするには、人間のポーズや行動の正確な認識を航空的観点から要求する。
このパースペクティブは、特にアプリケーションがリアルタイムのファジブルモデルを必要とする場合、解像度が低く、視角が急勾配で、そして(自己)隠蔽で既存の手法に挑戦する。
航空画像のための軽量なトップダウン人間のポーズ推定パイプラインであるFlyPoseを訓練し、デプロイする。
マルチデータセットトレーニングにより,Manipal-UAV,VisDrone,HIT-UAV,および当社のカスタムデータセットを用いて,人物検出における平均6.8mAPの改善を実現した。
2次元人間のポーズ推定では、挑戦的なUAV-Humanデータセットにおいて16.3 mAPの改善が報告されている。
FlyPoseは、Jetson Orin AGX Developer Kitでの事前処理を含む約20ミリ秒の遅延で動作し、飛行実験中に四重項UAVに展開される。
また、FlyPose-104も公開しています。これは、小さなが挑戦的な空中ポーズ推定データセットで、難しい空中視点からの手動アノテーションが含まれています。
関連論文リスト
- How Far are Modern Trackers from UAV-Anti-UAV? A Million-Scale Benchmark and New Baseline [74.4054700050366]
無人航空機(UAV)は広範囲のアプリケーションを提供するが、安全性とプライバシー侵害のリスクも大きい。
現在の反UAV研究は、主に固定地上カメラで撮影したRGB、赤外線(IR)、またはRGB-IRビデオに焦点を当てている。
本稿では,UAV-Anti-UAVと呼ばれるマルチモーダル視覚追跡タスクを提案する。
論文 参考訳(メタデータ) (2025-12-08T10:19:54Z) - AeroLite-MDNet: Lightweight Multi-task Deviation Detection Network for UAV Landing [9.858832286469765]
本稿では,AeroLite-MDNetと呼ばれる新しい視覚モデルを用いたUAV着陸の偏差警報システムを提案する。
AWD(Average Warning Delay)と呼ばれる新しい評価指標を導入し,着陸偏差に対するシステムの感度を定量化する。
実験の結果, 偏差検出精度98.6%で0.7秒のAWDを実現した。
論文 参考訳(メタデータ) (2025-06-25T13:48:30Z) - Active Human Pose Estimation via an Autonomous UAV Agent [13.188563931419056]
本稿では,人の行動を捉えた映像から人間のポーズ推定を行うタスクに焦点を当てる。
これを解決するためには、ビューを明確にするために、カメラを新しいベタージュポイントに移す必要がある。
提案手法は、NeRFベースのDrone-Viewデータ生成フレームワーク、カメラビューエラー推定のためのOn-Drone Network、複合プランナーの3つの主要コンポーネントから構成される。
論文 参考訳(メタデータ) (2024-07-01T21:20:52Z) - Angle Robustness Unmanned Aerial Vehicle Navigation in GNSS-Denied
Scenarios [66.05091704671503]
本稿では、ポイントツーポイントナビゲーションタスクにおける飛行偏差に対処する新しい角度ナビゲーションパラダイムを提案する。
また、Adaptive Feature Enhance Module、Cross-knowledge Attention-guided Module、Robust Task-oriented Head Moduleを含むモデルを提案する。
論文 参考訳(メタデータ) (2024-02-04T08:41:20Z) - Bottom-Up 2D Pose Estimation via Dual Anatomical Centers for Small-Scale
Persons [75.86463396561744]
マルチパーソン2Dポーズ推定では、ボトムアップ手法は同時にすべての人のポーズを予測する。
本手法は,バウンディングボックス精度を38.4%改善し,バウンディングボックスリコールを39.1%改善した。
ヒトのポーズAP評価では,COCOテストデフセット上で新しいSOTA(71.0 AP)を単一スケールテストで達成する。
論文 参考訳(メタデータ) (2022-08-25T10:09:10Z) - Real-Time Hybrid Mapping of Populated Indoor Scenes using a Low-Cost
Monocular UAV [42.850288938936075]
単一UAVに搭載された単眼カメラから同時マッピングと複数人によるポーズ推定を行う最初のシステムを提案する。
特に,身近な室内シーンのハイブリッドマップをリアルタイムに再構築するために,最先端のモノキュラー深度推定とモノキュラー人間のポーズ推定を緩やかに組み合わせる方法について述べる。
論文 参考訳(メタデータ) (2022-03-04T17:31:26Z) - AirPose: Multi-View Fusion Network for Aerial 3D Human Pose and Shape
Estimation [51.17610485589701]
本研究では,非構造屋外環境のための新しいマーカーレス3次元モーションキャプチャ(MoCap)システムを提案する。
AirPoseは複数の無人飛行カメラで撮影された画像を使って人間のポーズと形状を推定する。
AirPose自体は、事前校正に頼らずに、人のカメラを校正する。
論文 参考訳(メタデータ) (2022-01-20T09:46:20Z) - Rethinking Drone-Based Search and Rescue with Aerial Person Detection [79.76669658740902]
航空ドローンの映像の視覚検査は、現在土地捜索救助(SAR)活動に不可欠な部分である。
本稿では,この空中人物検出(APD)タスクを自動化するための新しいディープラーニングアルゴリズムを提案する。
本稿では,Aerial Inspection RetinaNet (AIR) アルゴリズムについて述べる。
論文 参考訳(メタデータ) (2021-11-17T21:48:31Z) - UAV-Human: A Large Benchmark for Human Behavior Understanding with
Unmanned Aerial Vehicles [12.210724541266183]
UAVを用いた人間の行動理解のための新しいベンチマークUAVHumanを提案する。
本データセットは,67,428件のマルチモーダルビデオシーケンスと119件のアクション認識対象を含む。
フラットRGB映像による学習変換により,魚眼映像の歪みを緩和する魚眼行動認識手法を提案する。
論文 参考訳(メタデータ) (2021-04-02T08:54:04Z) - Perceiving Traffic from Aerial Images [86.994032967469]
本研究では,空中画像中の物体を検出するために,バタフライ検出器と呼ばれる物体検出手法を提案する。
UAVDT(UAVDT)とVisDrone 2019(VisDrone 2019)の2つのUAVデータセット上でButterfly Detectorを評価し、従来の最先端の手法よりも高速に動作し、かつリアルタイムに動作可能であることを示す。
論文 参考訳(メタデータ) (2020-09-16T11:37:43Z) - Distributed Variable-Baseline Stereo SLAM from two UAVs [17.513645771137178]
本稿では,単眼カメラを1台,IMUを1台搭載した2台のUAVを用いて,視界の重なりと相対距離の測定を行った。
本稿では,glsuavエージェントを自律的に制御するために,分散協調推定方式を提案する。
我々は,高度160mまでの飛行におけるアプローチの有効性を実証し,最先端のVIO手法の能力を大きく超えている。
論文 参考訳(メタデータ) (2020-09-10T12:16:10Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。