論文の概要: Graph Neural Networks for Cross-Camera Data Association
- arxiv url: http://arxiv.org/abs/2201.06311v1
- Date: Mon, 17 Jan 2022 09:52:39 GMT
- ステータス: 処理完了
- システム内更新日: 2022-01-19 15:50:27.405920
- Title: Graph Neural Networks for Cross-Camera Data Association
- Title(参考訳): クロスカメラデータアソシエーションのためのグラフニューラルネットワーク
- Authors: Elena Luna, Juan C. SanMiguel, Jos\'e M. Mart\'inez, and Pablo
Carballeira
- Abstract要約: 多くのマルチカメラコンピュータビジョンタスクには、クロスカメラ画像データアソシエーションが不可欠である。
本稿では,グローバルソリューションに着目したクロスカメラデータアソシエーションのための効率的なアプローチを提案する。
- 参考スコア(独自算出の注目度): 3.490148531239259
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Cross-camera image data association is essential for many multi-camera
computer vision tasks, such as multi-camera pedestrian detection, multi-camera
multi-target tracking, 3D pose estimation, etc. This association task is
typically stated as a bipartite graph matching problem and often solved by
applying minimum-cost flow techniques, which may be computationally inefficient
with large data. Furthermore, cameras are usually treated by pairs, obtaining
local solutions, rather than finding a global solution at once. Other key issue
is that of the affinity measurement: the widespread usage of non-learnable
pre-defined distances, such as the Euclidean and Cosine ones. This paper
proposes an efficient approach for cross-cameras data-association focused on a
global solution, instead of processing cameras by pairs. To avoid the usage of
fixed distances, we leverage the connectivity of Graph Neural Networks,
previously unused in this scope, using a Message Passing Network to jointly
learn features and similarity. We validate the proposal for pedestrian
multi-view association, showing results over the EPFL multi-camera pedestrian
dataset. Our approach considerably outperforms the literature data association
techniques, without requiring to be trained in the same scenario in which it is
tested. Our code is available at
\url{http://www-vpu.eps.uam.es/publications/gnn_cca}.
- Abstract(参考訳): クロスカメラ画像データアソシエーションは、マルチカメラの歩行者検出、マルチカメラのマルチターゲットトラッキング、3Dポーズ推定など、多くのマルチカメラコンピュータビジョンタスクに不可欠である。
このアソシエーションタスクは一般に二部グラフマッチング問題として記述され、大容量データでは計算効率が劣る最小コストフロー手法を適用することでしばしば解決される。
さらに、カメラは通常、一度にグローバルソリューションを見つけるのではなく、ペアで処理し、ローカルソリューションを得る。
その他の重要な問題はアフィニティ測定のそれであり、ユークリッド距離やコサイン距離など、説明不能な事前定義距離が広く使われている。
本稿では,ペアでカメラを処理するのではなく,グローバルなソリューションに焦点を当てたクロスカメラデータアソシエーションの効率的なアプローチを提案する。
固定距離の使用を避けるため,これまで未使用であったグラフニューラルネットワークの接続を活用し,メッセージパッシングネットワークを用いて特徴と類似性を共同で学習する。
我々は,EPFL多カメラ歩行者データセットを用いた歩行者多視点アソシエーションの提案を検証した。
また,本手法は文献データアソシエーション技術よりもかなり優れており,テストのシナリオでトレーニングを行う必要がなくなる。
私たちのコードは \url{http://www-vpu.eps.uam.es/publications/gnn_cca} で利用可能です。
関連論文リスト
- Cross-Camera Data Association via GNN for Supervised Graph Clustering [0.0]
クロスカメラデータアソシエーションは、マルチカメラコンピュータビジョン分野の基盤の1つである。
ノードは全カメラが捕捉するインスタンスであるアフィニティグラフの教師付きクラスタリングを提案する。
我々はGNN(Graph Neural Network)アーキテクチャの利点を活用し、ノードの関係を調べ、代表的エッジ埋め込みを生成する。
提案手法は,SGC-CCAと命名され,すべてのクラスタリング指標において,GNN-CCAという最先端の手法よりも優れていた。
論文 参考訳(メタデータ) (2024-10-01T12:52:54Z) - Multi-Camera Multi-Person Association using Transformer-Based Dense Pixel Correspondence Estimation and Detection-Based Masking [1.0937094979510213]
マルチカメラアソシエーション (Multi-camera Association, MCA) は、カメラビューを通してオブジェクトや個人を識別するタスクである。
我々は,高密度画素対応推定に基づく新しいマルチカメラマルチターゲットアソシエーションアルゴリズムについて検討する。
以上の結果から,このアルゴリズムは互いに近接するカメラ対の歩行者と極めてよく関連していることがわかった。
論文 参考訳(メタデータ) (2024-08-17T20:58:16Z) - Multi-View Person Matching and 3D Pose Estimation with Arbitrary
Uncalibrated Camera Networks [36.49915280876899]
マルチカメラネットワークにおける人物マッチングと人物の3次元ポーズ推定は、カメラが外在的に校正されていない場合、困難である。
既存の取り組みでは、ニューラルネットワークや既知のカメラのトレーニングに大量の3Dデータが必要である。
どちらの情報も必要とせずに2つの課題を解く手法であるPMEを提案する。
論文 参考訳(メタデータ) (2023-12-04T01:28:38Z) - Enhancing Multi-Camera People Tracking with Anchor-Guided Clustering and
Spatio-Temporal Consistency ID Re-Assignment [22.531044994763487]
本稿では,アンカークラスタリング誘導を用いたマルチカメラによる複数人物追跡手法を提案する。
提案手法は,各個人固有の重要な特徴を特定することによって,トラッキングの精度を向上させることを目的としている。
この手法は, 合成データと実世界のデータの両方を扱う上で, 堅牢性と有効性を示した。
論文 参考訳(メタデータ) (2023-04-19T07:38:15Z) - Robust Multi-Object Tracking by Marginal Inference [92.48078680697311]
ビデオにおける多目的追跡は、隣接するフレーム内のオブジェクト間の1対1の割り当てに関する根本的な問題を解決する必要がある。
本稿では,各オブジェクトの限界確率をリアルタイムに計算する効率的な手法を提案する。
MOT17とMOT20ベンチマークで競合する結果を得る。
論文 参考訳(メタデータ) (2022-08-07T14:04:45Z) - Cross-Camera Trajectories Help Person Retrieval in a Camera Network [124.65912458467643]
既存の手法では、純粋な視覚的マッチングや時間的制約を考慮することが多いが、カメラネットワークの空間情報は無視する。
本稿では,時間的情報と空間的情報を統合したクロスカメラ生成に基づく歩行者検索フレームワークを提案する。
本手法の有効性を検証するため,最初のカメラ横断歩行者軌跡データセットを構築した。
論文 参考訳(メタデータ) (2022-04-27T13:10:48Z) - Cross-Camera Feature Prediction for Intra-Camera Supervised Person
Re-identification across Distant Scenes [70.30052164401178]
人物再識別(Re-ID)は、重複しないカメラビュー間で人物画像をマッチングすることを目的としている。
ICS-DS Re-IDは、カメラ内IDラベル付きクロスカメラアンペアデータを使用してトレーニングを行う。
カメラ横断型自己監視情報マイニングのためのクロスカメラ特徴予測法
グローバルレベルの特徴とローカルレベルの特徴の合同学習は、グローバルなローカルなクロスカメラ特徴予測スキームを形成する。
論文 参考訳(メタデータ) (2021-07-29T11:27:50Z) - DeepI2P: Image-to-Point Cloud Registration via Deep Classification [71.3121124994105]
DeepI2Pは、イメージとポイントクラウドの間のクロスモダリティ登録のための新しいアプローチです。
本手法は,カメラとライダーの座標フレーム間の相対的剛性変換を推定する。
登録問題を分類および逆カメラ投影最適化問題に変換することで難易度を回避する。
論文 参考訳(メタデータ) (2021-04-08T04:27:32Z) - Self-supervised Human Detection and Segmentation via Multi-view
Consensus [116.92405645348185]
本稿では,トレーニング中に幾何学的制約を多視点一貫性という形で組み込むマルチカメラフレームワークを提案する。
本手法は,標準ベンチマークから視覚的に外れた画像に対して,最先端の自己監視的人物検出とセグメンテーション技術に勝ることを示す。
論文 参考訳(メタデータ) (2020-12-09T15:47:21Z) - Anchor-free Small-scale Multispectral Pedestrian Detection [88.7497134369344]
適応型単一段アンカーフリーベースアーキテクチャにおける2つのモードの効果的かつ効率的な多重スペクトル融合法を提案する。
我々は,直接的境界ボックス予測ではなく,対象の中心と規模に基づく歩行者表現の学習を目指す。
その結果,小型歩行者の検出における本手法の有効性が示唆された。
論文 参考訳(メタデータ) (2020-08-19T13:13:01Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。