論文の概要: Multi-Camera Multi-Person Association using Transformer-Based Dense Pixel Correspondence Estimation and Detection-Based Masking
- arxiv url: http://arxiv.org/abs/2408.09295v1
- Date: Sat, 17 Aug 2024 20:58:16 GMT
- ステータス: 処理完了
- システム内更新日: 2024-08-20 21:29:47.443888
- Title: Multi-Camera Multi-Person Association using Transformer-Based Dense Pixel Correspondence Estimation and Detection-Based Masking
- Title(参考訳): 変圧器を用いた高密度画素対応推定と検出に基づくマスキングを用いたマルチカメラ・マルチパーソンアソシエーション
- Authors: Daniel Kathein, Byron Hernandez, Henry Medeiros,
- Abstract要約: マルチカメラアソシエーション (Multi-camera Association, MCA) は、カメラビューを通してオブジェクトや個人を識別するタスクである。
我々は,高密度画素対応推定に基づく新しいマルチカメラマルチターゲットアソシエーションアルゴリズムについて検討する。
以上の結果から,このアルゴリズムは互いに近接するカメラ対の歩行者と極めてよく関連していることがわかった。
- 参考スコア(独自算出の注目度): 1.0937094979510213
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Multi-camera Association (MCA) is the task of identifying objects and individuals across camera views and is an active research topic, given its numerous applications across robotics, surveillance, and agriculture. We investigate a novel multi-camera multi-target association algorithm based on dense pixel correspondence estimation with a Transformer-based architecture and underlying detection-based masking. After the algorithm generates a set of corresponding keypoints and their respective confidence levels between every pair of detections in the camera views are computed, an affinity matrix is determined containing the probabilities of matches between each pair. Finally, the Hungarian algorithm is applied to generate an optimal assignment matrix with all the predicted associations between the camera views. Our method is evaluated on the WILDTRACK Seven-Camera HD Dataset, a high-resolution dataset containing footage of walking pedestrians as well as precise annotations and camera calibrations. Our results conclude that the algorithm performs exceptionally well associating pedestrians on camera pairs that are positioned close to each other and observe the scene from similar perspectives. On camera pairs with orientations that are drastically different in distance or angle, there is still significant room for improvement.
- Abstract(参考訳): マルチカメラアソシエーション(Multi-camera Association、MCA)は、カメラビュー全体にわたってオブジェクトや個人を識別するタスクであり、ロボット工学、監視、農業にまたがる多くの応用を考えると、活発な研究トピックである。
トランスフォーマーに基づくアーキテクチャと基礎となる検出に基づくマスキングを用いた高密度画素対応推定に基づく,新しいマルチカメラマルチターゲットアソシエーションアルゴリズムについて検討する。
アルゴリズムが対応するキーポイントのセットを生成し、カメラビュー内の各ペア検出間の各信頼度を算出すると、各ペア間のマッチングの確率を含む親和性行列が決定される。
最後に、ハンガリーのアルゴリズムを適用して、カメラビュー間の予測されたすべての関連性を持つ最適な代入行列を生成する。
本手法は,歩行歩行者の映像と正確なアノテーションとカメラキャリブレーションを含む高解像度データセットであるWILDTRACK Seven-Camera HD Datasetを用いて評価を行った。
以上の結果から,このアルゴリズムは,互いに近距離に位置するカメラペアの歩行者と,類似した視点でシーンを観察する上で,極めて良好な関連性を示すことが示唆された。
距離や角度が大幅に異なるカメラペアでは、改善の余地は依然として大きい。
関連論文リスト
- Redundancy-Aware Camera Selection for Indoor Scene Neural Rendering [54.468355408388675]
カメラの空間的多様性と画像の意味的変動の両方を取り入れた類似度行列を構築した。
カメラ選択を最適化するために,多様性に基づくサンプリングアルゴリズムを適用した。
IndoorTrajという新しいデータセットも開発しています。仮想屋内環境で人間が捉えた、長くて複雑なカメラの動きが含まれています。
論文 参考訳(メタデータ) (2024-09-11T08:36:49Z) - Enhancing Multi-Camera People Tracking with Anchor-Guided Clustering and
Spatio-Temporal Consistency ID Re-Assignment [22.531044994763487]
本稿では,アンカークラスタリング誘導を用いたマルチカメラによる複数人物追跡手法を提案する。
提案手法は,各個人固有の重要な特徴を特定することによって,トラッキングの精度を向上させることを目的としている。
この手法は, 合成データと実世界のデータの両方を扱う上で, 堅牢性と有効性を示した。
論文 参考訳(メタデータ) (2023-04-19T07:38:15Z) - Tracking Passengers and Baggage Items using Multiple Overhead Cameras at
Security Checkpoints [2.021502591596062]
空港の検問所のセキュリティシナリオのために,オーバーヘッドカメラビデオ中の複数のオブジェクトを追跡する新しいフレームワークを提案する。
オーバヘッド画像からのインスタンスセグメンテーションの不確実性に関するモデル情報を提供するために,自己監視学習(SSL)手法を提案する。
この結果から,自己超越はモデルの推定時間を増大させることなく,オブジェクト検出精度を最大42%向上させることがわかった。
論文 参考訳(メタデータ) (2022-12-31T12:57:09Z) - CASAPose: Class-Adaptive and Semantic-Aware Multi-Object Pose Estimation [2.861848675707602]
CASAPoseと呼ばれる新しい単一ステージアーキテクチャを提案する。
RGB画像中の複数の異なるオブジェクトのポーズ推定のための2D-3D対応を1パスで決定する。
高速でメモリ効率が高く、複数のオブジェクトに対して高い精度を実現する。
論文 参考訳(メタデータ) (2022-10-11T10:20:01Z) - Multi-Camera Collaborative Depth Prediction via Consistent Structure
Estimation [75.99435808648784]
本稿では,新しいマルチカメラ協調深度予測法を提案する。
カメラ間の構造的整合性を維持しながら、大きな重なり合う領域を必要としない。
DDADおよびNuScenesデータセットの実験結果から,本手法の優れた性能を示す。
論文 参考訳(メタデータ) (2022-10-05T03:44:34Z) - SurroundDepth: Entangling Surrounding Views for Self-Supervised
Multi-Camera Depth Estimation [101.55622133406446]
本研究では,複数の周囲からの情報を組み込んだSurroundDepth法を提案し,カメラ間の深度マップの予測を行う。
具体的には、周囲のすべてのビューを処理し、複数のビューから情報を効果的に融合するクロスビュー変換器を提案する。
実験において,本手法は,挑戦的なマルチカメラ深度推定データセット上での最先端性能を実現する。
論文 参考訳(メタデータ) (2022-04-07T17:58:47Z) - Graph Neural Networks for Cross-Camera Data Association [3.490148531239259]
多くのマルチカメラコンピュータビジョンタスクには、クロスカメラ画像データアソシエーションが不可欠である。
本稿では,グローバルソリューションに着目したクロスカメラデータアソシエーションのための効率的なアプローチを提案する。
論文 参考訳(メタデータ) (2022-01-17T09:52:39Z) - Cross-Camera Feature Prediction for Intra-Camera Supervised Person
Re-identification across Distant Scenes [70.30052164401178]
人物再識別(Re-ID)は、重複しないカメラビュー間で人物画像をマッチングすることを目的としている。
ICS-DS Re-IDは、カメラ内IDラベル付きクロスカメラアンペアデータを使用してトレーニングを行う。
カメラ横断型自己監視情報マイニングのためのクロスカメラ特徴予測法
グローバルレベルの特徴とローカルレベルの特徴の合同学習は、グローバルなローカルなクロスカメラ特徴予測スキームを形成する。
論文 参考訳(メタデータ) (2021-07-29T11:27:50Z) - DeepI2P: Image-to-Point Cloud Registration via Deep Classification [71.3121124994105]
DeepI2Pは、イメージとポイントクラウドの間のクロスモダリティ登録のための新しいアプローチです。
本手法は,カメラとライダーの座標フレーム間の相対的剛性変換を推定する。
登録問題を分類および逆カメラ投影最適化問題に変換することで難易度を回避する。
論文 参考訳(メタデータ) (2021-04-08T04:27:32Z) - Multi-View Multi-Person 3D Pose Estimation with Plane Sweep Stereo [71.59494156155309]
既存のマルチビュー3Dポーズ推定手法は、複数のカメラビューからグループ2Dポーズ検出に対するクロスビュー対応を明確に確立する。
平面スイープステレオに基づくマルチビュー3Dポーズ推定手法を提案し、クロスビュー融合と3Dポーズ再構築を1ショットで共同で解決します。
論文 参考訳(メタデータ) (2021-04-06T03:49:35Z) - YCB-M: A Multi-Camera RGB-D Dataset for Object Recognition and 6DoF Pose
Estimation [2.9972063833424216]
7つの異なる3Dカメラで撮影され、合計49,294フレームで撮影された32のシーンのデータセットを提示する。
これにより、使用するカメラの仕様に対するポーズ推定アルゴリズムの感度を評価することができる。
論文 参考訳(メタデータ) (2020-04-24T11:14:04Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。