論文の概要: DaDiff: Domain-aware Diffusion Model for Nighttime UAV Tracking
- arxiv url: http://arxiv.org/abs/2410.12270v1
- Date: Wed, 16 Oct 2024 06:14:15 GMT
- ステータス: 翻訳完了
- システム内更新日: 2024-10-17 13:42:18.008028
- Title: DaDiff: Domain-aware Diffusion Model for Nighttime UAV Tracking
- Title(参考訳): DaDiff:夜間UAV追跡のためのドメイン認識拡散モデル
- Authors: Haobo Zuo, Changhong Fu, Guangze Zheng, Liangliang Yao, Kunhan Lu, Jia Pan,
- Abstract要約: 本研究はドメイン認識拡散モデル(DaDiff)という,新しいプログレッシブアライメントパラダイムを提案する。
デイディフは、進行性および安定な世代により、夜間LRオブジェクトを昼間に整列させる。
100個のアノテートシーケンスからなるLRオブジェクトに対して、詳細な夜間UAV追跡ベンチマークを構築する。
- 参考スコア(独自算出の注目度): 21.255323355862057
- License:
- Abstract: Domain adaptation is an inspiring solution to the misalignment issue of day/night image features for nighttime UAV tracking. However, the one-step adaptation paradigm is inadequate in addressing the prevalent difficulties posed by low-resolution (LR) objects when viewed from the UAVs at night, owing to the blurry edge contour and limited detail information. Moreover, these approaches struggle to perceive LR objects disturbed by nighttime noise. To address these challenges, this work proposes a novel progressive alignment paradigm, named domain-aware diffusion model (DaDiff), aligning nighttime LR object features to the daytime by virtue of progressive and stable generations. The proposed DaDiff includes an alignment encoder to enhance the detail information of nighttime LR objects, a tracking-oriented layer designed to achieve close collaboration with tracking tasks, and a successive distribution discriminator presented to distinguish different feature distributions at each diffusion timestep successively. Furthermore, an elaborate nighttime UAV tracking benchmark is constructed for LR objects, namely NUT-LR, consisting of 100 annotated sequences. Exhaustive experiments have demonstrated the robustness and feature alignment ability of the proposed DaDiff. The source code and video demo are available at https://github.com/vision4robotics/DaDiff.
- Abstract(参考訳): ドメイン適応は、夜間UAV追跡のための昼夜画像の特徴の不整合問題に対するインスピレーションとなる解決策である。
しかし、一段階適応のパラダイムは、ぼやけた縁の輪郭と限られた詳細情報により、夜間のUAVから見る場合、低分解能(LR)オブジェクトによって引き起こされる一般的な困難に対処するには不十分である。
さらに、これらのアプローチは、夜間ノイズによって乱されるLRオブジェクトを知覚するのに苦労する。
これらの課題に対処するため,本研究では,夜間LRオブジェクトの特徴を,進行的・安定的な世代によって昼間に整列させる,ドメイン認識拡散モデル(DaDiff)という,新しいプログレッシブアライメントパラダイムを提案する。
提案するDaDiffは、夜間LRオブジェクトの詳細な情報を強化するアライメントエンコーダと、追跡タスクとの密接な協調を実現するために設計されたトラッキング指向層と、拡散時間毎に異なる特徴分布を連続的に識別する連続分布判別器とを含む。
さらに、100の注釈付きシーケンスからなるLRオブジェクト、すなわちNUT-LRに対して、詳細な夜間UAV追跡ベンチマークを構築する。
掘削実験により提案したダディフの強靭性と特徴アライメント能力が実証された。
ソースコードとビデオのデモはhttps://github.com/vision4robotics/DaDiffで公開されている。
関連論文リスト
- DINTR: Tracking via Diffusion-based Interpolation [12.130669304428565]
本研究は,トラッキングタスクを定式化するための拡散に基づく新しい手法を提案する。
我々のInterpolation TrackeR(DINTR)は、将来性のある新しいパラダイムを示し、5つの指標表現にまたがる7つのベンチマークにおいて優れた乗法を実現する。
論文 参考訳(メタデータ) (2024-10-14T00:41:58Z) - Prompt-Driven Temporal Domain Adaptation for Nighttime UAV Tracking [21.09039345888337]
低照度シナリオ下での夜間UAV追跡は、ドメイン適応(DA)によって大きな進歩を遂げた。
従来のDAトレーニングに基づく研究は、UAVトラッカーの時間的文脈の相違を狭めるには不十分である。
本研究は、夜間UAV追跡に挑戦する時間的コンテキストをフル活用するための、プロンプト駆動型時間的ドメイン適応トレーニングフレームワークを提案する。
論文 参考訳(メタデータ) (2024-09-27T08:12:28Z) - Enhancing Nighttime UAV Tracking with Light Distribution Suppression [6.950880335490385]
本研究は,光分布抑制による夜間UAV追跡を向上する新しいエンハンサー,LDEnhancerを提案する。
具体的には、光配信情報と画像コンテンツ情報とを分解する新規な画像コンテンツ改善モジュールを開発する。
NAT2024-2という不均一な光分布を持つ夜間UAV追跡データセットは、包括的な評価を提供するために構築されている。
論文 参考訳(メタデータ) (2024-09-25T05:19:35Z) - STCMOT: Spatio-Temporal Cohesion Learning for UAV-Based Multiple Object Tracking [13.269416985959404]
無人航空機(UAV)ビデオにおける複数物体追跡(MOT)は、コンピュータビジョンにおける多様な用途において重要である。
時空間結合型多目的追跡フレームワーク(STCMOT)を提案する。
歴史的埋め込み機能を用いて,ReIDの表現と検出機能を逐次的にモデル化する。
我々のフレームワークはMOTAとIDF1メトリクスで新しい最先端のパフォーマンスを設定します。
論文 参考訳(メタデータ) (2024-09-17T14:34:18Z) - Exploring Reliable Matching with Phase Enhancement for Night-time Semantic Segmentation [58.180226179087086]
夜間セマンティックセマンティックセグメンテーションに適した新しいエンドツーエンド最適化手法であるNightFormerを提案する。
具体的には,画素レベルのテクスチャ・エンハンスメント・モジュールを設計し,フェーズ・エンハンスメントとアンプリメント・アテンションとともに階層的にテクスチャ・アウェア機能を取得する。
提案手法は、最先端の夜間セマンティックセグメンテーション手法に対して好意的に機能する。
論文 参考訳(メタデータ) (2024-08-25T13:59:31Z) - LEAP-VO: Long-term Effective Any Point Tracking for Visual Odometry [52.131996528655094]
本稿では,LEAP(Long-term Effective Any Point Tracking)モジュールについて述べる。
LEAPは、動的トラック推定のために、視覚的、トラック間、時間的キューと慎重に選択されたアンカーを革新的に組み合わせている。
これらの特徴に基づき,強靭な視力計測システムLEAP-VOを開発した。
論文 参考訳(メタデータ) (2024-01-03T18:57:27Z) - Towards High-quality HDR Deghosting with Conditional Diffusion Models [88.83729417524823]
高ダイナミックレンジ(LDR)画像は、既存のディープニューラルネットワーク(DNN)技術により、複数の低ダイナミックレンジ(LDR)画像から復元することができる。
DNNは、LDR画像が飽和度と大きな動きを持つ場合、ゴーストアーティファクトを生成する。
拡散モデルの条件としてLDR特徴を利用する画像生成としてHDRデゴースト問題を定式化する。
論文 参考訳(メタデータ) (2023-11-02T01:53:55Z) - Advancing Unsupervised Low-light Image Enhancement: Noise Estimation, Illumination Interpolation, and Self-Regulation [55.07472635587852]
低光画像強調(LLIE)技術は、画像の詳細の保存とコントラストの強化に顕著な進歩をもたらした。
これらのアプローチは、動的ノイズを効率的に緩和し、様々な低照度シナリオを収容する上で、永続的な課題に直面する。
まず,低照度画像の雑音レベルを迅速かつ高精度に推定する方法を提案する。
次に、照明と入力の一般的な制約を満たすために、Learningable Illumination Interpolator (LII) を考案する。
論文 参考訳(メタデータ) (2023-05-17T13:56:48Z) - Adaptive Rotated Convolution for Rotated Object Detection [96.94590550217718]
本稿では、回転物体検出問題に対処するために、適応回転変換(ARC)モジュールを提案する。
ARCモジュールでは、コンボリューションカーネルが適応的に回転し、異なる画像に異なる向きのオブジェクト特徴を抽出する。
提案手法は,81.77%mAPのDOTAデータセット上での最先端性能を実現する。
論文 参考訳(メタデータ) (2023-03-14T11:53:12Z) - Unsupervised Domain Adaptation for Nighttime Aerial Tracking [27.595253191781904]
本研究は、夜間航空追跡のための新しい教師なしドメイン適応フレームワークを開発する。
ユニークなオブジェクト発見アプローチが提供され、生の夜間追跡ビデオからトレーニングパッチを生成する。
Transformerの昼夜の特徴判別器では、昼夜追跡モデルは夜間追跡のために逆向きに訓練される。
論文 参考訳(メタデータ) (2022-03-20T12:35:09Z) - Asynchronous Tracking-by-Detection on Adaptive Time Surfaces for
Event-based Object Tracking [87.0297771292994]
本稿では,イベントベースのトラッキング・バイ・ディテクト(ETD)手法を提案する。
この目的を達成するために,線形時間決定(ATSLTD)イベント・ツー・フレーム変換アルゴリズムを用いた適応時間曲面を提案する。
提案手法と,従来のカメラやイベントカメラをベースとした7種類のオブジェクト追跡手法と,ETDの2種類のバリエーションを比較した。
論文 参考訳(メタデータ) (2020-02-13T15:58:31Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。