Fugu-MT 論文翻訳(概要): Decoupling Ego-Motion from Target Dynamics via Dual-Interval Motion Cues for UAV Detection

論文の概要: Decoupling Ego-Motion from Target Dynamics via Dual-Interval Motion Cues for UAV Detection

arxiv url: http://arxiv.org/abs/2605.22605v1
Date: Thu, 21 May 2026 15:18:34 GMT
ステータス: 翻訳完了
システム内更新日: 2026-05-22 16:35:42.320805
Title: Decoupling Ego-Motion from Target Dynamics via Dual-Interval Motion Cues for UAV Detection
Title（参考訳）: UAV検出のためのデュアルインターバルモーションキューによる目標運動からのエゴ運動の分離
Authors: Liuyang Wang, Feitian Zhang,
Abstract要約: 無人航空機(UAV)からの物体検出は、激しいエゴモーション、カメラジッタ、大規模変動によって困難にさらされている。本稿では、カメラによる乱れから目標運動を分離する視覚のみのモーションガイド検出フレームワークを提案する。 VisDrone-VIDデータセットの実験では、強いエゴモーションの下で強いYOLOv8ベースラインに対して一貫した改善が示されている。
参考スコア（独自算出の注目度）: 0.5371337604556311
License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
Abstract: Object detection from Unmanned Aerial Vehicles (UAVs) is challenged by severe ego-motion, camera jitter, and large scale variations. While modern detectors perform well on static images, their direct application to UAV video often fails, particularly for small objects in dynamic scenes. Existing motion-based methods either rely on computationally expensive optical flow or use single-interval differencing, which is sensitive to jitter and limited in capturing diverse motion patterns. We propose a vision-only motion-guided detection framework that decouples target motion from camera-induced disturbances. A homography-based Global Motion Compensation (GMC) first aligns adjacent frames. We then introduce a Dual-Interval Motion Extraction strategy that captures both short-term and long-term motion cues. To integrate these cues, a lightweight Motion-Guided Attention (MGA) module enhances feature representations within a Feature Pyramid Network. Experiments on the VisDrone-VID dataset demonstrate consistent improvements over a strong YOLOv8 baseline under severe ego-motion. Ablation studies further confirm the effectiveness of the dual-interval design and the proposed motion-guided attention mechanism.
Abstract（参考訳）: 無人航空機(UAV)からの物体検出は、激しいエゴモーション、カメラジッタ、大規模変動によって困難にさらされている。現代の検出器は静止画像でよく機能するが、UAVビデオへの直接の応用はしばしば失敗する。既存の動きに基づく手法は、計算に高価な光学フローに依存するか、単一間隔の差分を用いるかのいずれかであり、ジッタに敏感であり、多様な動きパターンを捉えることに制限される。本稿では、カメラによる乱れから目標運動を分離する視覚のみのモーションガイド検出フレームワークを提案する。ホモグラフィに基づくGlobal Motion Compensation (GMC) は、まず隣接フレームをアライメントする。次に、短期動作と長期動作の両方をキャプチャするデュアル・インターバル動作抽出戦略を導入する。これらのキューを統合するために、軽量なMotion-Guided Attention (MGA)モジュールは、Feature Pyramid Network内のフィーチャ表現を強化する。 VisDrone-VIDデータセットの実験では、強いエゴモーションの下で強いYOLOv8ベースラインに対して一貫した改善が示されている。アブレーション研究は、デュアルインターバル設計の有効性と、提案した動き誘導型アテンション機構の有効性をさらに確認する。

関連論文リスト

Tracking the Unstable: Appearance-Guided Motion Modeling for Robust Multi-Object Tracking in UAV-Captured Videos [58.156141601478794]
マルチオブジェクトトラッキング(UAVT)は、ビデオのフレーム間で一貫したアイデンティティを維持しながら、複数のオブジェクトを追跡することを目的としている。既存の手法は、通常、動作キューと外観を別々にモデル化し、それらの相互作用を見渡して、最適下追跡性能をもたらす。本稿では、AMC行列とMTCモジュールの2つの主要コンポーネントを通して、外観と動きの手がかりを利用するAMOTを提案する。
論文参考訳（メタデータ） (2025-08-03T12:06:47Z)
MotionPro: A Precise Motion Controller for Image-to-Video Generation [108.63100943070592]
我々は、画像間(I2V)生成のための正確なモーションコントローラであるMotionProを提案する。局所軌道と運動マスクは、微細な運動合成を制御するために用いられる。 WebVid-10MとMC-Benchで行った実験は、MotionProの有効性を実証している。
論文参考訳（メタデータ） (2025-05-26T17:59:03Z)
A Simple Detector with Frame Dynamics is a Strong Tracker [43.912410355089634]
赤外線物体追跡は、反無人航空機(Anti-UAV)の用途において重要な役割を担っている。既存のトラッカーは、しばしば収穫されたテンプレート領域に依存し、モーションモデリング機能に制限がある。我々は,グローバルな検出と動き認識学習を統合することで,トラッキング性能を向上させる,シンプルで効果的な赤外線小物体トラッカーを提案する。
論文参考訳（メタデータ） (2025-05-08T03:16:03Z)
MM-Tracker: Motion Mamba with Margin Loss for UAV-platform Multiple Object Tracking [12.326023523101806]
無人航空機プラットフォームからの複数の物体追跡(MOT)には、効率的なモーションモデリングが必要である。本研究では,ローカル・グローバル両方の動作特徴を探索するMotion Mamba Moduleを提案する。また,動きのぼやけた物体の検出精度を効果的に向上するために,運動マージンの損失を設計する。 Motion Mambaモジュールとモーションマージンの損失に基づいて、提案したMM-Trackerは、2つの広くオープンソースUAV-MOTデータセットで最先端のデータを上回ります。
論文参考訳（メタデータ） (2024-07-15T07:13:27Z)
Traffic Video Object Detection using Motion Prior [16.63738085066699]
本稿では,先行動作を利用した2つの革新的な手法を提案し,トラヒックビデオオブジェクト検出の性能を向上する。まず、時間情報統合を導く前に動きを利用する新しい自己認識モジュールを導入する。次に、擬似ラベリング機構を用いて、半教師付き設定のためのノイズの多い擬似ラベルを除去する。
論文参考訳（メタデータ） (2023-11-16T18:59:46Z)
MotionTrack: Learning Motion Predictor for Multiple Object Tracking [68.68339102749358]
本研究では,学習可能なモーション予測器を中心に,新しいモーショントラッカーであるMotionTrackを紹介する。実験結果から、MotionTrackはDancetrackやSportsMOTといったデータセット上での最先端のパフォーマンスを示す。
論文参考訳（メタデータ） (2023-06-05T04:24:11Z)
Implicit Motion Handling for Video Camouflaged Object Detection [60.98467179649398]
本稿では,新しいビデオカモフラージュオブジェクト検出(VCOD)フレームワークを提案する。短期的および長期的整合性を利用して、ビデオフレームからカモフラージュされたオブジェクトを検出する。
論文参考訳（メタデータ） (2022-03-14T17:55:41Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。