論文の概要: AG-VPReID.VIR: Bridging Aerial and Ground Platforms for Video-based Visible-Infrared Person Re-ID
- arxiv url: http://arxiv.org/abs/2507.17995v1
- Date: Thu, 24 Jul 2025 00:13:25 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-07-25 15:10:42.718667
- Title: AG-VPReID.VIR: Bridging Aerial and Ground Platforms for Video-based Visible-Infrared Person Re-ID
- Title(参考訳): AG-VPReID.VIR: 可視光赤外線リIDのための航空・地上プラットフォーム
- Authors: Huy Nguyen, Kien Nguyen, Akila Pemasiri, Akmal Jahan, Clinton Fookes, Sridha Sridharan,
- Abstract要約: 我々は,最初の空対地ビデオベース人物Re-IDデータセットであるAG-VPReID.VIRを提示する。
このデータセットは、4,861個のトラックレット(124,855フレーム)にまたがる1,837個のアイデンティティを、UAV搭載と固定CCTVカメラの両方をRGBおよび赤外線モダリティでキャプチャする。
提案手法は, 空間的視点とRGB-IRモダリティの領域ギャップを, スタイルロバストな特徴学習, メモリベース・クロスビュー適応, 中間誘導時間モデルにより埋める。
- 参考スコア(独自算出の注目度): 36.00219379027019
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Person re-identification (Re-ID) across visible and infrared modalities is crucial for 24-hour surveillance systems, but existing datasets primarily focus on ground-level perspectives. While ground-based IR systems offer nighttime capabilities, they suffer from occlusions, limited coverage, and vulnerability to obstructions--problems that aerial perspectives uniquely solve. To address these limitations, we introduce AG-VPReID.VIR, the first aerial-ground cross-modality video-based person Re-ID dataset. This dataset captures 1,837 identities across 4,861 tracklets (124,855 frames) using both UAV-mounted and fixed CCTV cameras in RGB and infrared modalities. AG-VPReID.VIR presents unique challenges including cross-viewpoint variations, modality discrepancies, and temporal dynamics. Additionally, we propose TCC-VPReID, a novel three-stream architecture designed to address the joint challenges of cross-platform and cross-modality person Re-ID. Our approach bridges the domain gaps between aerial-ground perspectives and RGB-IR modalities, through style-robust feature learning, memory-based cross-view adaptation, and intermediary-guided temporal modeling. Experiments show that AG-VPReID.VIR presents distinctive challenges compared to existing datasets, with our TCC-VPReID framework achieving significant performance gains across multiple evaluation protocols. Dataset and code are available at https://github.com/agvpreid25/AG-VPReID.VIR.
- Abstract(参考訳): 可視・赤外線モダリティをまたいだ人物の再識別(Re-ID)は24時間監視システムにとって重要であるが、既存のデータセットは主に地上レベルの視点に焦点を当てている。
地上の赤外線システムは夜間機能を提供しているが、それらは閉塞性、限られた範囲、障害物に対する脆弱性に悩まされている。
これらの制約に対処するため、最初の地上横断ビデオベース人物Re-IDデータセットであるAG-VPReID.VIRを紹介する。
このデータセットは、4,861個のトラックレット(124,855フレーム)にまたがる1,837個のアイデンティティを、UAV搭載と固定CCTVカメラの両方をRGBおよび赤外線モダリティでキャプチャする。
AG-VPReID.VIRは、クロスプラットフォームのバリエーション、モダリティの相違、時間的ダイナミクスなど、ユニークな課題を提示している。
さらに,クロスプラットフォームおよびクロスプラットフォームのRe-IDの課題に対処するために設計された,新しい3ストリームアーキテクチャであるTCC-VPReIDを提案する。
提案手法は, 空間的視点とRGB-IRモダリティの領域ギャップを, スタイルロバストな特徴学習, メモリベース・クロスビュー適応, 中間誘導時間モデルにより埋める。
実験の結果,AG-VPReID.VIRは既存のデータセットと比較して顕著な課題を示し,TCC-VPReIDフレームワークは複数の評価プロトコルで大幅な性能向上を実現していることがわかった。
データセットとコードはhttps://github.com/agvpreid25/AG-VPReID.VIRで入手できる。
関連論文リスト
- Cross-Spectral Body Recognition with Side Information Embedding: Benchmarks on LLCM and Analyzing Range-Induced Occlusions on IJB-MDF [51.36007967653781]
ViT(Vision Transformers)は、顔や身体の認識を含む幅広い生体計測タスクにおいて、印象的なパフォーマンスを誇示している。
本研究では、視認性(VIS)画像に事前訓練されたVTモデルを、クロススペクトル体認識の難しい問題に適用する。
このアイデアに基づいて、我々はSide Information Embedding (SIE)を統合し、ドメインとカメラ情報のエンコーディングの影響を調べ、スペクトル間マッチングを強化する。
驚くべきことに、我々の結果は、ドメイン情報を明示的に組み込むことなく、カメラ情報のみを符号化することで、LLCMデータセット上で最先端のパフォーマンスが得られることを示している。
論文 参考訳(メタデータ) (2025-06-10T16:20:52Z) - SD-ReID: View-aware Stable Diffusion for Aerial-Ground Person Re-Identification [61.753607285860944]
本稿では,AG-ReIDのためのSD-ReIDという2段階特徴学習フレームワークを提案する。
第1段階では、粗粒度表現と制御可能な条件を抽出するために、簡単なViTベースモデルを訓練する。
第2段階では、制御可能な条件で導かれる補完表現を学習するためにSDモデルを微調整する。
論文 参考訳(メタデータ) (2025-04-13T12:44:50Z) - Multi-modal Multi-platform Person Re-Identification: Benchmark and Method [58.59888754340054]
MP-ReIDは、マルチモダリティとマルチプラットフォームReIDに特化した新しいデータセットである。
このベンチマークは、RGB、赤外線、サーマルイメージングなど、さまざまなモードで1,930のIDからデータをコンパイルする。
クロスモダリティとクロスプラットフォームシナリオに適した,特定設計のプロンプトを備えたフレームワークであるUni-Prompt ReIDを紹介する。
論文 参考訳(メタデータ) (2025-03-21T12:27:49Z) - Multi-Domain Biometric Recognition using Body Embeddings [51.36007967653781]
身体埋め込みは中波長赤外線(MWIR)領域と長波長赤外線(LWIR)領域の顔埋め込みよりも優れていた。
我々は、IJB-MDFデータセット上でのベンチマーク結果を確立するために、ビジョントランスフォーマーアーキテクチャを活用している。
また, クロスエントロピーとトリプルト損失の単純な組み合わせで, VISデータにのみ事前訓練された体モデルを微調整することで, 最先端のmAPスコアが得られることを示す。
論文 参考訳(メタデータ) (2025-03-13T22:38:18Z) - AG-VPReID: A Challenging Large-Scale Benchmark for Aerial-Ground Video-based Person Re-Identification [39.350429734981184]
我々は,地上ビデオに基づく人物識別(ReID)のための大規模データセット AG-VPReID を紹介する。
このデータセットは6,632人の被験者、32,321のトラックレット、960万フレーム以上をドローン(高度15-120m)、CCTV、ウェアラブルカメラで捉えている。
本稿では,3つの補完ストリームからなるエンドツーエンドフレームワーク AG-VPReID-Net を提案する。
論文 参考訳(メタデータ) (2025-03-11T07:38:01Z) - View-decoupled Transformer for Person Re-identification under Aerial-ground Camera Network [87.36616083812058]
地上人物再識別のための簡易かつ効果的なフレームワークとして,ビューデカップリングトランス (VDT) が提案されている。
2つの主要なコンポーネントは、ビュー関連とビュー非関連の機能を切り離すためにVDTで設計されている。
さらに,5/8の空中/地上カメラ,5,000のアイデンティティ,108,563のイメージからなる大規模AGPReIDデータセットCARGOをコントリビュートした。
論文 参考訳(メタデータ) (2024-03-21T16:08:21Z) - AG-ReID.v2: Bridging Aerial and Ground Views for Person Re-identification [39.58286453178339]
空中人物再識別(Re-ID)は、コンピュータビジョンにおいて固有の課題を提示する。
AG-ReID.v2は、空中および地上の混合シナリオにおいて、人物Re-ID用に特別に設計されたデータセットである。
このデータセットは、1,615人のユニークな個人の100,502枚の画像で構成され、それぞれに一致するIDと15のソフト属性ラベルが付加されている。
論文 参考訳(メタデータ) (2024-01-05T04:53:33Z) - Visible-Infrared Person Re-Identification Using Privileged Intermediate
Information [10.816003787786766]
クロスモーダルな人物再識別(ReID)は、RGBとIRモダリティ間のデータ分散の大きなドメインシフトのために困難である。
本稿では2つのメインドメイン間のブリッジとして機能する中間仮想ドメインを作成するための新しいアプローチを提案する。
我々は、深いReIDモデルをトレーニングするための追加情報を提供する、可視領域と赤外線領域間の画像を生成する新しい手法を考案した。
論文 参考訳(メタデータ) (2022-09-19T21:08:14Z) - Learning Modal-Invariant and Temporal-Memory for Video-based
Visible-Infrared Person Re-Identification [46.49866514866999]
主にビデオベースのクロスモーダル人物Re-ID法について研究する。
トラックレット内のフレームの増加により,性能が向上することが証明された。
モーダル不変部分空間に2つのモダリティを投影する新しい手法を提案する。
論文 参考訳(メタデータ) (2022-08-04T04:43:52Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。