Fugu-MT 論文翻訳(概要): MTMMC: A Large-Scale Real-World Multi-Modal Camera Tracking Benchmark

論文の概要: MTMMC: A Large-Scale Real-World Multi-Modal Camera Tracking Benchmark

arxiv url: http://arxiv.org/abs/2403.20225v1
Date: Fri, 29 Mar 2024 15:08:37 GMT
ステータス: 翻訳完了
システム内更新日: 2024-04-01 15:14:57.455406
Title: MTMMC: A Large-Scale Real-World Multi-Modal Camera Tracking Benchmark
Title（参考訳）: MTMMC: 大規模実世界のマルチモードカメラ追跡ベンチマーク
Authors: Sanghyun Woo, Kwanyong Park, Inkyu Shin, Myungchul Kim, In So Kweon,
Abstract要約: マルチターゲットマルチカメラトラッキングは、複数のカメラからのビデオストリームを使用して個人を特定し、追跡する重要なタスクである。このタスクの既存のデータセットは、制御されたカメラネットワーク設定内で合成または人工的に構築される。我々は16台のマルチモーダルカメラで2つの異なる環境でキャプチャされた長いビデオシーケンスを含む実世界の大規模データセットであるMTMMCを紹介する。
参考スコア（独自算出の注目度）: 63.878793340338035
License: http://creativecommons.org/licenses/by-nc-sa/4.0/
Abstract: Multi-target multi-camera tracking is a crucial task that involves identifying and tracking individuals over time using video streams from multiple cameras. This task has practical applications in various fields, such as visual surveillance, crowd behavior analysis, and anomaly detection. However, due to the difficulty and cost of collecting and labeling data, existing datasets for this task are either synthetically generated or artificially constructed within a controlled camera network setting, which limits their ability to model real-world dynamics and generalize to diverse camera configurations. To address this issue, we present MTMMC, a real-world, large-scale dataset that includes long video sequences captured by 16 multi-modal cameras in two different environments - campus and factory - across various time, weather, and season conditions. This dataset provides a challenging test-bed for studying multi-camera tracking under diverse real-world complexities and includes an additional input modality of spatially aligned and temporally synchronized RGB and thermal cameras, which enhances the accuracy of multi-camera tracking. MTMMC is a super-set of existing datasets, benefiting independent fields such as person detection, re-identification, and multiple object tracking. We provide baselines and new learning setups on this dataset and set the reference scores for future studies. The datasets, models, and test server will be made publicly available.
Abstract（参考訳）: マルチターゲットマルチカメラトラッキングは、複数のカメラからのビデオストリームを使用して個人を特定し、追跡する重要なタスクである。このタスクは、視覚的監視、群衆行動分析、異常検出など、様々な分野で実用化されている。しかし、データの収集とラベル付けの難しさとコストのため、既存のデータセットは、制御されたカメラネットワーク設定内で合成または人工的に構築され、現実世界のダイナミクスをモデル化し、多様なカメラ構成に一般化する能力を制限する。この問題に対処するため、MTMMCは実世界の大規模データセットで、キャンパスと工場の2つの異なる環境で16台のマルチモーダルカメラが捉えた長いビデオシーケンスを含む。このデータセットは、様々な実世界の複雑さの下でマルチカメラトラッキングを研究する上で困難なテストベッドを提供し、空間的に整列し、時間的に同期されたRGBとサーマルカメラの入力モードを追加し、マルチカメラトラッキングの精度を高める。 MTMMCは既存のデータセットのスーパーセットであり、人物検出、再識別、複数のオブジェクト追跡といった独立した分野の恩恵を受けている。このデータセットにベースラインと新たな学習設定を提供し、将来の研究のための基準スコアを設定します。データセット、モデル、テストサーバが公開される。

関連論文リスト

Multi-modal Multi-platform Person Re-Identification: Benchmark and Method [58.59888754340054]
MP-ReIDは、マルチモダリティとマルチプラットフォームReIDに特化した新しいデータセットである。このベンチマークは、RGB、赤外線、サーマルイメージングなど、さまざまなモードで1,930のIDからデータをコンパイルする。クロスモダリティとクロスプラットフォームシナリオに適した,特定設計のプロンプトを備えたフレームワークであるUni-Prompt ReIDを紹介する。
論文参考訳（メタデータ） (2025-03-21T12:27:49Z)
MCTR: Multi Camera Tracking Transformer [45.66952089591361]
Multi-Camera Tracking tRansformer (MCTR)は、マルチオブジェクト検出と複数のカメラ間のトラッキングに適した、エンドツーエンドのアプローチである。 MCTRは、Detector TRansformer (DETR)のようなエンドツーエンドの検出器を利用して、カメラビューごとに独立して検出および検出埋め込みを生成する。このフレームワークは、追跡されたオブジェクトに関するグローバル情報を付加する一連のトラック埋め込みを維持し、ビュー固有の検出埋め込みからローカル情報を統合することで、各フレームでそれらを更新する。
論文参考訳（メタデータ） (2024-08-23T17:37:03Z)
GMT: A Robust Global Association Model for Multi-Target Multi-Camera Tracking [13.305411087116635]
本稿では,第1追跡段階への依存を2段階の手法で解決し,クロスカメラマッチングを向上するオンラインMTMC追跡モデルを提案する。具体的には,トランスフォーマーをベースとしたグローバルMTMCアソシエーションモジュールを提案し,様々なカメラやフレームを対象とするアソシエーションを探索する。高シーンの多様性と複雑な照明条件の変化に対応するため、VisionTrackデータセットを構築した。
論文参考訳（メタデータ） (2024-07-01T06:39:14Z)
Learning Online Policies for Person Tracking in Multi-View Environments [4.62316736194615]
MVSparseは、複数の同期カメラにまたがる協調的多人数追跡のための新しいフレームワークである。 MVSparseシステムは、エッジサーバベースのモデルと分散軽量強化学習(RL)エージェントを組み合わせた、慎重にオーケストレーションされたパイプラインで構成されている。私たちの貢献には、マルチカメラの歩行者追跡データセットの実証分析、マルチカメラの開発、マルチパーソナリティ検出パイプラインの開発、MVSparseの実装などが含まれています。
論文参考訳（メタデータ） (2023-12-26T02:57:11Z)
SpikeMOT: Event-based Multi-Object Tracking with Sparse Motion Features [52.213656737672935]
SpikeMOTはイベントベースのマルチオブジェクトトラッカーである。 SpikeMOTはスパイクニューラルネットワークを使用して、オブジェクトに関連するイベントストリームからスパーステンポラルな特徴を抽出する。
論文参考訳（メタデータ） (2023-09-29T05:13:43Z)
End-to-end Tracking with a Multi-query Transformer [96.13468602635082]
マルチオブジェクトトラッキング(MOT)は、時間とともにシーン内のオブジェクトの位置、外観、アイデンティティを同時に推論する必要がある課題である。本研究の目的は、トラッキング・バイ・ディテクト・アプローチを超えて、未知のオブジェクト・クラスに対してもよく機能するクラスに依存しないトラッキングへと移行することである。
論文参考訳（メタデータ） (2022-10-26T10:19:37Z)
Synthehicle: Multi-Vehicle Multi-Camera Tracking in Virtual Cities [4.4855664250147465]
複数の車両の追跡とセグメンテーションのための大規模な合成データセットを複数重なり合うカメラビューと非重なり合うカメラビューで提示する。データセットは17時間のラベル付きビデオ素材で構成され、64の異なる日、雨、夜のシーンで340台のカメラから記録されている。
論文参考訳（メタデータ） (2022-08-30T11:36:07Z)
Scalable and Real-time Multi-Camera Vehicle Detection, Re-Identification, and Tracking [58.95210121654722]
理想化されたビデオストリームやキュレートされたビデオストリームの代わりに,リアルタイムで低解像度のCCTVを処理する,リアルタイムな都市規模のマルチカメラ車両追跡システムを提案する。私たちの手法は、公共のリーダーボードで上位5人のパフォーマーにランク付けされています。
論文参考訳（メタデータ） (2022-04-15T12:47:01Z)
Know Your Surroundings: Panoramic Multi-Object Tracking by Multimodality Collaboration [56.01625477187448]
MMPAT(MultiModality PAnoramic Multi-object Tracking framework)を提案する。 2次元パノラマ画像と3次元点雲を入力とし、マルチモーダルデータを用いて目標軌道を推定する。提案手法は,検出タスクと追跡タスクの両方においてMMPATが最高性能を達成するJRDBデータセット上で評価する。
論文参考訳（メタデータ） (2021-05-31T03:16:38Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。