Fugu-MT 論文翻訳(概要): Open-World Drone Active Tracking with Goal-Centered Rewards

論文の概要: Open-World Drone Active Tracking with Goal-Centered Rewards

arxiv url: http://arxiv.org/abs/2412.00744v2
Date: Wed, 22 Oct 2025 07:43:03 GMT
ステータス: 翻訳完了
システム内更新日: 2025-10-25 03:08:02.819048
Title: Open-World Drone Active Tracking with Goal-Centered Rewards
Title（参考訳）: Goal-Centered Rewardsを用いたオープンワールドドローンアクティブトラッキング
Authors: Haowei Sun, Jinwu Hu, Zhirui Zhang, Haoyuan Tian, Xinze Xie, Yufeng Wang, Xiaohua Xie, Yun Lin, Zhuliang Yu, Mingkui Tan,
Abstract要約: Drone Visual Active Trackingは、視覚的な観察に基づいてモーションシステムを制御することで、対象物を自律的に追跡することを目的としている。 DATは,世界初となるエア・ツー・グラウンド・トラッキング・ベンチマークである。また,複雑なシナリオにおけるドローン追跡目標の性能向上を目的としたGC-VATを提案する。
参考スコア（独自算出の注目度）: 62.21394499788672
License: http://creativecommons.org/licenses/by-nc-sa/4.0/
Abstract: Drone Visual Active Tracking aims to autonomously follow a target object by controlling the motion system based on visual observations, providing a more practical solution for effective tracking in dynamic environments. However, accurate Drone Visual Active Tracking using reinforcement learning remains challenging due to the absence of a unified benchmark and the complexity of open-world environments with frequent interference. To address these issues, we pioneer a systematic solution. First, we propose DAT, the first open-world drone active air-to-ground tracking benchmark. It encompasses 24 city-scale scenes, featuring targets with human-like behaviors and high-fidelity dynamics simulation. DAT also provides a digital twin tool for unlimited scene generation. Additionally, we propose a novel reinforcement learning method called GC-VAT, which aims to improve the performance of drone tracking targets in complex scenarios. Specifically, we design a Goal-Centered Reward to provide precise feedback across viewpoints to the agent, enabling it to expand perception and movement range through unrestricted perspectives. Inspired by curriculum learning, we introduce a Curriculum-Based Training strategy that progressively enhances the tracking performance in complex environments. Besides, experiments on simulator and real-world images demonstrate the superior performance of GC-VAT, achieving a Tracking Success Rate of approximately 72% on the simulator. The benchmark and code are available at https://github.com/SHWplus/DAT_Benchmark.
Abstract（参考訳）: Drone Visual Active Trackingは、視覚的な観察に基づいてモーションシステムを制御することで、対象物を自律的に追跡することを目的としており、動的環境における効果的なトラッキングのためのより実用的なソリューションを提供する。しかし、統合ベンチマークの欠如と、頻繁な干渉を伴うオープンワールド環境の複雑さのため、強化学習を用いた正確なDrone Visual Active Trackingは依然として困難である。これらの問題に対処するために、私たちは体系的な解決策を開拓しました。まず、DATを提案する。これは、世界初のオープンワールドドローンアクティブエア・ツー・グラウンド・トラッキング・ベンチマークである。 24の都市規模のシーンを包含し、人間のような振る舞いと高忠実度ダイナミクスのシミュレーションを対象とする。 DATはまた、無制限のシーン生成のためのデジタルツインツールも提供する。さらに,複雑なシナリオにおけるドローン追跡目標の性能向上を目的とした,GC-VATと呼ばれる新しい強化学習手法を提案する。具体的には、エージェントに視点をまたいだ正確なフィードバックを提供するために、ゴール中心のリワードを設計し、制約のない視点を通して知覚と移動範囲を拡大できるようにする。カリキュラム学習に触発されて,複雑な環境下でのトラッキング性能を徐々に向上させるカリキュラムベーストレーニング戦略を導入する。さらに、シミュレータと実世界の画像の実験により、GC-VATの優れた性能を示し、シミュレータ上での追従成功率を約72%達成した。ベンチマークとコードはhttps://github.com/SHWplus/DAT_Benchmarkで公開されている。

関連論文リスト

NOVA: Navigation via Object-Centric Visual Autonomy for High-Speed Target Tracking in Unstructured GPS-Denied Environments [56.35569661650558]
我々はNOVAというオブジェクト中心のフレームワークを導入し、ロバストな目標追跡と衝突認識ナビゲーションを可能にした。グローバルマップを構築するのではなく、NOVAはターゲットの参照フレーム内での知覚、推定、制御を定式化する。我々は,都市迷路や森林の小道,間欠的なGPS損失を伴う建物内の繰り返し遷移など,現実の挑戦的なシナリオにまたがってNOVAを検証する。
論文参考訳（メタデータ） (2025-06-23T14:28:30Z)
A Simple Detector with Frame Dynamics is a Strong Tracker [43.912410355089634]
赤外線物体追跡は、反無人航空機(Anti-UAV)の用途において重要な役割を担っている。既存のトラッカーは、しばしば収穫されたテンプレート領域に依存し、モーションモデリング機能に制限がある。我々は,グローバルな検出と動き認識学習を統合することで,トラッキング性能を向上させる,シンプルで効果的な赤外線小物体トラッカーを提案する。
論文参考訳（メタデータ） (2025-05-08T03:16:03Z)
Leveraging Event Streams with Deep Reinforcement Learning for End-to-End UAV Tracking [1.8297494098768172]
我々は,無人航空機(UAV)の自律性を高めるために,イベントカメラ,低エネルギー撮像センサを用いたアクティブトラッキング手法を提案する。提案したトラッキングコントローラは、搭載されたイベントセンサからの視覚的フィードバックに応答し、ドローンの動きを目標に追従するように調整するように設計されている。
論文参考訳（メタデータ） (2024-10-03T07:56:40Z)
Learning Motion Blur Robust Vision Transformers with Dynamic Early Exit for Real-Time UAV Tracking [14.382072224997074]
トレーニング済みのViTバックボーンを使用したシングルストリームアーキテクチャでは、パフォーマンス、効率、堅牢性が改善されている。リアルタイムなUAV追跡のためにTransformerブロックを動的に終了する適応型フレームワークにすることで、このフレームワークの効率を向上する。また, 動きのぼかし処理におけるViTsの有効性も改善した。これは, UAV, 追跡対象の速さ, あるいはその両方によって生じるUAVトラッキングの共通問題である。
論文参考訳（メタデータ） (2024-07-07T14:10:04Z)
MotionTrack: Learning Motion Predictor for Multiple Object Tracking [68.68339102749358]
本研究では,学習可能なモーション予測器を中心に,新しいモーショントラッカーであるMotionTrackを紹介する。実験結果から、MotionTrackはDancetrackやSportsMOTといったデータセット上での最先端のパフォーマンスを示す。
論文参考訳（メタデータ） (2023-06-05T04:24:11Z)
An Effective Motion-Centric Paradigm for 3D Single Object Tracking in Point Clouds [50.19288542498838]
LiDARポイントクラウド(LiDAR SOT)における3Dシングルオブジェクトトラッキングは、自動運転において重要な役割を果たす。現在のアプローチはすべて、外観マッチングに基づくシームズパラダイムに従っている。我々は新たな視点からLiDAR SOTを扱うための動き中心のパラダイムを導入する。
論文参考訳（メタデータ） (2023-03-21T17:28:44Z)
Propagate And Calibrate: Real-time Passive Non-line-of-sight Tracking [84.38335117043907]
本研究では,リレー壁のみを観察することで,見えない部屋を歩いている人を追跡する純粋受動的手法を提案する。本研究では,リレー壁の映像の非知覚的変化を発掘するため,時間的局所的な動きの伝達に欠かせない特徴として差分フレームを導入する。提案手法を評価するため,最初の動的受動NLOS追跡データセットであるNLOS-Trackを構築し,公開する。
論文参考訳（メタデータ） (2023-03-21T12:18:57Z)
SGDViT: Saliency-Guided Dynamic Vision Transformer for UAV Tracking [12.447854608181833]
本研究は、UAV追跡のための新しいサリエンシ誘導動的視覚変換器(SGDViT)を提案する。提案手法は,クロスコリレーション操作を洗練させるために,タスク固有の新たなオブジェクト・サリエンシ・マイニング・ネットワークを設計する。軽量な塩分フィルタリング変換器は、さらに塩分情報を洗練し、外観情報に焦点を当てる。
論文参考訳（メタデータ） (2023-03-08T05:01:00Z)
Space Non-cooperative Object Active Tracking with Deep Reinforcement Learning [1.212848031108815]
DRLAVTと命名されたDQNアルゴリズムに基づくエンドツーエンドのアクティブなトラッキング手法を提案する。追尾宇宙船のアプローチを、色やRGBD画像にのみ依存した任意の空間の非協力目標に導くことができる。位置ベースのビジュアルサーボベースラインアルゴリズムでは、最先端の2DモノクロトラッカーであるSiamRPNをはるかに上回っている。
論文参考訳（メタデータ） (2021-12-18T06:12:24Z)
Nonprehensile Riemannian Motion Predictive Control [57.295751294224765]
本稿では,リアル・ツー・シムの報酬分析手法を導入し,リアルなロボット・プラットフォームに対する行動の可能性を確実に予測する。連続的なアクション空間でオブジェクトを反応的にプッシュするクローズドループコントローラを作成します。我々は,RMPCが乱雑な環境だけでなく,乱雑な環境においても頑健であり,ベースラインよりも優れていることを観察した。
論文参考訳（メタデータ） (2021-11-15T18:50:04Z)
TRiPOD: Human Trajectory and Pose Dynamics Forecasting in the Wild [77.59069361196404]
TRiPODは、グラフの注目ネットワークに基づいて身体のダイナミクスを予測する新しい方法です。実世界の課題を取り入れるために,各フレームで推定された身体関節が可視・視認可能かどうかを示す指標を学習する。評価の結果,TRiPODは,各軌道に特化して設計され,予測タスクに特化している。
論文参考訳（メタデータ） (2021-04-08T20:01:00Z)
Dynamic Attention guided Multi-Trajectory Analysis for Single Object Tracking [62.13213518417047]
動的注意誘導型マルチ軌道追跡戦略を考案し,さらにダイナミクスを導入することを提案する。特に、複数のターゲットテンプレートを含む動的外観モデルを構築し、それぞれが新しいフレーム内のターゲットを特定するのに独自の注意を払っています。シーケンス全体にまたがった後、マルチ軌道選択ネットワークを導入し、トラッキング性能を向上させた最適な軌道を見つけます。
論文参考訳（メタデータ） (2021-03-30T05:36:31Z)
Decentralized Reinforcement Learning for Multi-Target Search and Detection by a Team of Drones [12.055303570215335]
対象の探索と検出は、カバレッジ、監視、探索、観測、追跡回避など、さまざまな決定問題を含む。我々は,未知の領域における静的な目標のセットを特定するために,航空機群(ドローン)を協調させるマルチエージェント深部強化学習法(MADRL)を開発した。
論文参考訳（メタデータ） (2021-03-17T09:04:47Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。