論文の概要: HDST-GNN: Heterogeneous Dynamic Spatiotemporal Graph Neural Networks for Multi-Object Tracking in UAV Aerial Imagery
- arxiv url: http://arxiv.org/abs/2606.05587v1
- Date: Thu, 04 Jun 2026 02:04:52 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-06-05 22:39:44.485403
- Title: HDST-GNN: Heterogeneous Dynamic Spatiotemporal Graph Neural Networks for Multi-Object Tracking in UAV Aerial Imagery
- Title(参考訳): HDST-GNN:UAV空中画像における多物体追跡のための異種動的時空間グラフニューラルネットワーク
- Authors: Phillip Jiang,
- Abstract要約: HDST-GNNは3つの新しいコントリビューションを持つ異種動的時空間グラフニューラルネットワークである。
HDST-GNNは94.51%のMOTAと97.24%のIDF1を達成し、SORTを+5.0のMOTAポイントで上回り、アイデンティティスイッチを81%削減した。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Multi-object tracking (MOT) from UAV imagery presents unique challenges: altitude varies across sequences, objects are small and densely packed, and frequent occlusion causes identity switches. Existing graph-based trackers assume fixed spatial context and treat all objects uniformly, ignoring the heterogeneous lifecycle states of detections, active tracklets, and lost targets. We propose HDST-GNN, a Heterogeneous Dynamic Spatiotemporal Graph Neural Network with three novel contributions. First, Altitude-Adaptive Edge Construction estimates a camera-altitude proxy from mean object area and adjusts the graph connectivity radius accordingly. Second, Heterogeneous Node Representation models detections (Type-D), confirmed tracklets (Type-T), and lost tracklets (Type-L) as distinct node types with dedicated projections and typed edge relations. Third, Occlusion-Gated Temporal Aggregation gates each node's attention contribution by its occlusion confidence, preventing occluded nodes from corrupting neighbour embeddings. HDST-GNN is trained end-to-end with a differentiable Sinkhorn head using joint cross-entropy and triplet loss. On VisDrone2019-MOT with oracle detections, HDST-GNN achieves 94.51% MOTA and 97.24% IDF1, outperforming SORT by +5.0 MOTA points and reducing identity switches by 81%. With real YOLOv8n detections, HDST-GNN reduces identity switches by 49% vs. SORT. Ablation studies confirm the independent contribution of each component.
- Abstract(参考訳): UAV画像からのマルチオブジェクト追跡(MOT)は、シーケンスの高度が異なり、オブジェクトは小さくて密に詰め込まれており、頻繁なオクルージョンはアイデンティティスイッチを引き起こす。
既存のグラフベースのトラッカーは、固定された空間コンテキストを仮定し、全てのオブジェクトを均一に扱う。
異種動的時空間グラフニューラルネットワーク HDST-GNN を提案する。
まず、Altitude-Adaptive Edge Constructionは、平均対象領域からカメラ高度プロキシを推定し、それに応じてグラフ接続半径を調整する。
第二に、不均一なノード表現モデル検出(Type-D)、確認されたトラックレット(Type-T)、失われたトラックレット(Type-L)は、専用のプロジェクションと型付きエッジ関係を持つ異なるノードタイプである。
第三に、Occlusion-Gated Temporal Aggregationは、そのOcclusion confidenceによって各ノードの注意貢献をゲートし、閉鎖されたノードが隣の埋め込みを損なうのを防ぐ。
HDST-GNNは、関節のクロスエントロピーと三重項の損失を用いて、異なるSinkhornヘッドでエンドツーエンドに訓練されている。
VisDrone2019-MOTとオラクル検出では、HDST-GNNは94.51%のMOTAと97.24%のIDF1を達成し、SORTを+5.0のMOTAポイントで上回り、アイデンティティスイッチを81%削減した。
実際のYOLOv8n検出では、HDST-GNNはSORTと比較してIDスイッチを49%削減する。
アブレーション研究は各成分の独立な寄与を裏付ける。
関連論文リスト
- COVTrack++: Learning Open-Vocabulary Multi-Object Tracking from Continuous Videos via a Synergistic Paradigm [59.26203051651017]
C-TAOはOpen-Vocabulary Multi-Object Tracking (OVMOT)のための最初の連続アノテーション付きトレーニングセットである
フレームワークボトルネックに対するCOVTrack++は,3つのモジュールによる検出とアソシエーションの双方向相互機構を実現するための相乗的フレームワークである。
TAOの実験では、新しいTAAは検証とテストセットで35.4%、30.5%に達し、新しいAssocAは4.8%、新しいLocAは5.8%向上した。
論文 参考訳(メタデータ) (2026-03-25T07:20:27Z) - Detecting Anomalies in Dynamic Graphs via Memory enhanced Normality [39.476378833827184]
動的グラフにおける異常検出は、グラフ構造と属性の時間的進化によって大きな課題となる。
時空間記憶強調グラフオートエンコーダ(STRIPE)について紹介する。
STRIPEは、AUCスコアが5.8%改善し、トレーニング時間が4.62倍速く、既存の手法よりも大幅に優れている。
論文 参考訳(メタデータ) (2024-03-14T02:26:10Z) - BOURNE: Bootstrapped Self-supervised Learning Framework for Unified
Graph Anomaly Detection [50.26074811655596]
自己指導型自己学習(BOURNE)に基づく新しい統合グラフ異常検出フレームワークを提案する。
ノードとエッジ間のコンテキスト埋め込みを交換することで、ノードとエッジの異常を相互に検出できる。
BOURNEは、負のサンプリングを必要としないため、大きなグラフを扱う際の効率を高めることができる。
論文 参考訳(メタデータ) (2023-07-28T00:44:57Z) - GAD-NR: Graph Anomaly Detection via Neighborhood Reconstruction [34.82023223790515]
グラフオートエンコーダ(GAE)はグラフデータをノード表現にエンコードし、これらの表現に基づいてグラフの再構成品質を評価することで異常を識別する。
グラフ異常検出のための近傍再構成を組み込んだ新しいGAEであるGAD-NRを提案する。
6つの実世界のデータセットで実施された大規模な実験は、GAD-NRの有効性を検証し、最先端の競合相手よりも顕著な改善(AUCでは最大30%)を示す。
論文 参考訳(メタデータ) (2023-06-02T23:23:34Z) - Minkowski Tracker: A Sparse Spatio-Temporal R-CNN for Joint Object
Detection and Tracking [53.64390261936975]
我々はオブジェクトの検出と追跡を共同で解決するスパース時間R-CNNであるMinkowski Trackerを提案する。
領域ベースCNN(R-CNN)に着想を得て,物体検出器R-CNNの第2段階として動きを追跡することを提案する。
大規模実験では,本手法の総合的な性能向上は4つの要因によることがわかった。
論文 参考訳(メタデータ) (2022-08-22T04:47:40Z) - Detection Recovery in Online Multi-Object Tracking with Sparse Graph
Tracker [17.00871668925939]
既存の共同検出・追跡手法では、従来のトラックレットと現在の検出とを一致させるために、ペアワイズ・リレーショナルな特徴を用いる。
Sparse Graph Tracker (SGT) はより差別的な高次関係特徴を用いた新しいオンライングラフトラッカーである。
MOT16/17/20とHiEve Challengeでは、SGTはリアルタイムの推論速度で最先端のトラッカーを上回っている。
論文 参考訳(メタデータ) (2022-05-02T15:09:36Z) - GPS-Net: Graph Property Sensing Network for Scene Graph Generation [91.60326359082408]
シーングラフ生成(SGG)は、画像内のオブジェクトとそれらのペア関係を検出することを目的としている。
GPS-Netは、エッジ方向情報、ノード間の優先度の差、長期にわたる関係の分布という、SGGの3つの特性を網羅している。
GPS-Netは、VG、OI、VRDの3つの一般的なデータベース上での最先端のパフォーマンスを、さまざまな設定とメトリクスで大幅に向上させる。
論文 参考訳(メタデータ) (2020-03-29T07:22:31Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。