論文の概要: CalibFree: Self-Supervised View Feature Separation for Calibration-Free Multi-Camera Multi-Object Tracking
- arxiv url: http://arxiv.org/abs/2605.09245v1
- Date: Sun, 10 May 2026 01:04:12 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-05-12 23:28:50.142752
- Title: CalibFree: Self-Supervised View Feature Separation for Calibration-Free Multi-Camera Multi-Object Tracking
- Title(参考訳): CalibFree: キャリブレーションフリーマルチカメラマルチオブジェクトトラッキングのためのセルフスーパービジョンビュー特徴分離
- Authors: Ruiqi Xian, Deep Patel, Iain Melvin, Sanjoy Kundu, Martin Renqiang Min, Dinesh Manocha,
- Abstract要約: CalibFreeは、MCMOTタスクのキャリブレーションや手動ラベリングを必要としない自己教師型表現学習フレームワークである。
MMP-MvMHATデータセットの実験では、全体の精度が3%向上し、最先端のアプローチよりも平均F1スコアが7.5%向上した。
- 参考スコア(独自算出の注目度): 50.354685761416484
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Multi-camera multi-object tracking (MCMOT) faces significant challenges in maintaining consistent object identities across varying camera perspectives, particularly when precise calibration and extensive annotations are required. In this paper, we present CalibFree, a self-supervised representation learning framework that does not need any calibration or manual labeling for the MCMOT task. By promoting feature separation between view-agnostic and view-specific representations through single-view distillation and cross-view reconstruction, our method adapts to complex, dynamic scenarios with minimal overhead. Experiments on the MMP-MvMHAT dataset show a 3% improvement in overall accuracy and a 7.5% increase in the average F1 score over state-of-the-art approaches, confirming the effectiveness of our calibration-free design. Moreover, on the more diverse MvMHAT dataset, our approach demonstrates superior over-time tracking and strong cross-view performance, highlighting its adaptability to a wide range of camera configurations. Code will be publicly available upon acceptance.
- Abstract(参考訳): マルチカメラ・マルチオブジェクト・トラッキング(MCMOT)は、特に正確な校正と広範囲のアノテーションを必要とする場合、様々なカメラ視点で一貫したオブジェクトの同一性を維持する上で大きな課題に直面している。
本稿では,MCMOTタスクのキャリブレーションや手動ラベリングを必要としない自己指導型表現学習フレームワークCalibFreeを提案する。
シングルビュー蒸留とクロスビュー再構成によるビュー非依存表現とビュー固有表現の分離を促進することにより,本手法はオーバーヘッドを最小限に抑えた複雑な動的シナリオに適応する。
MMP-MvMHATデータセットによる実験では、全体の精度が3%向上し、最先端のアプローチよりも平均F1スコアが7.5%向上し、キャリブレーションのない設計の有効性が確認された。
さらに、より多様なMvMHATデータセットでは、より優れたオーバータイムトラッキングと強力なクロスビュー性能を示し、幅広いカメラ構成への適応性を強調している。
コードは受理時に公開される。
関連論文リスト
- MAVR-Net: Robust Multi-View Learning for MAV Action Recognition with Cross-View Attention [0.5156484100374058]
本稿では,マルチビュー学習に基づく行動認識フレームワークMAVR-Netを提案する。
従来の単一ビュー方式とは異なり、提案手法は生フレーム、光フロー、RGBセグメンテーションマスクを含む3種類の補完的なデータを組み合わせている。
具体的には、ResNetベースのエンコーダを用いて各ビューから異種特徴を抽出し、MAV動作パターンの詳細を保存するためにマルチスケールの特徴ピラミッドを採用する。
論文 参考訳(メタデータ) (2025-10-17T09:04:51Z) - Multi-LVI-SAM: A Robust LiDAR-Visual-Inertial Odometry for Multiple Fisheye Cameras [24.95534498798919]
マルチカメラLiDAR-visual-inertial odometryフレームワークであるMulti-LVI-SAMを提案する。
複数の魚眼カメラからの視覚情報の効率よく一貫した統合を実現するため,パノラマ画像特徴モデルを導入し,マルチカメラ観測を単一の表現に統一する。
論文 参考訳(メタデータ) (2025-09-06T15:06:55Z) - LAMIC: Layout-Aware Multi-Image Composition via Scalability of Multimodal Diffusion Transformer [32.9330637921386]
LAMICはレイアウト対応のマルチイメージコンポジションフレームワークである。
単一の参照拡散モデルをトレーニング不要な方法でマルチ参照シナリオに拡張する。
ID-S、BG-S、IN-R、AVGのスコアにおいて、既存のマルチ参照ベースラインを一貫して上回る。
論文 参考訳(メタデータ) (2025-08-01T09:51:54Z) - Balanced Multi-view Clustering [56.17836963920012]
マルチビュークラスタリング(MvC)は、さまざまなビューからの情報を統合して、基盤となるデータ構造をキャプチャするモデルの能力を高めることを目的としている。
MvCで広く使われているジョイントトレーニングパラダイムは、多視点情報を十分に活用していない可能性がある。
本稿では,ビュー固有のコントラスト正規化(VCR)を導入し,各ビューの最適化を最適化する新しいマルチビュークラスタリング(BMvC)手法を提案する。
論文 参考訳(メタデータ) (2025-01-05T14:42:47Z) - MVUDA: Unsupervised Domain Adaptation for Multi-view Pedestrian Detection [4.506083131558207]
我々は、ラベル付きデータをテストで使用するものと異なるマルチカメラ設定を用いて収集する環境で、多視点歩行者検出に対処する。
ラベル付きデータを追加することなく新しいリグにモデルを適応させる,教師なしドメイン適応(UDA)手法を提案する。
論文 参考訳(メタデータ) (2024-12-05T12:36:12Z) - DealMVC: Dual Contrastive Calibration for Multi-view Clustering [78.54355167448614]
マルチビュークラスタリングのための新しいデュアルコントラストキャリブレーションネットワーク(DealMVC)を提案する。
まず、グローバルなクロスビュー特徴を得るための融合機構を設計し、その上で、ビュー特徴類似性グラフと高信頼な擬ラベルグラフを整列させることにより、グローバルなコントラストキャリブレーション損失を提案する。
トレーニング手順の間、対話型クロスビュー機能は、ローカルレベルとグローバルレベルの両方で共同最適化される。
論文 参考訳(メタデータ) (2023-08-17T14:14:28Z) - Self-supervised Human Detection and Segmentation via Multi-view
Consensus [116.92405645348185]
本稿では,トレーニング中に幾何学的制約を多視点一貫性という形で組み込むマルチカメラフレームワークを提案する。
本手法は,標準ベンチマークから視覚的に外れた画像に対して,最先端の自己監視的人物検出とセグメンテーション技術に勝ることを示す。
論文 参考訳(メタデータ) (2020-12-09T15:47:21Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。