論文の概要: Custom Object Detection via Multi-Camera Self-Supervised Learning
- arxiv url: http://arxiv.org/abs/2102.03442v1
- Date: Fri, 5 Feb 2021 23:11:14 GMT
- ステータス: 処理完了
- システム内更新日: 2021-02-09 16:09:38.341218
- Title: Custom Object Detection via Multi-Camera Self-Supervised Learning
- Title(参考訳): マルチカメラ自己監督学習によるカスタムオブジェクト検出
- Authors: Yan Lu and Yuanchao Shu
- Abstract要約: MCSSLは、マルチカメラネットワークでカスタムオブジェクト検出モデルを構築するための自己教師付き学習アプローチである。
従来の自己学習手法と比較して,MCSSLはWildTrackおよびCityFlowデータセット上で平均mAPを5.44%,6.76%改善している。
- 参考スコア(独自算出の注目度): 15.286868970188223
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: This paper proposes MCSSL, a self-supervised learning approach for building
custom object detection models in multi-camera networks. MCSSL associates
bounding boxes between cameras with overlapping fields of view by leveraging
epipolar geometry and state-of-the-art tracking and reID algorithms, and
prudently generates two sets of pseudo-labels to fine-tune backbone and
detection networks respectively in an object detection model. To train
effectively on pseudo-labels,a powerful reID-like pretext task with consistency
loss is constructed for model customization. Our evaluation shows that compared
with legacy selftraining methods, MCSSL improves average mAP by 5.44% and 6.76%
on WildTrack and CityFlow dataset, respectively.
- Abstract(参考訳): 本稿では,マルチカメラネットワーク上でカスタムオブジェクト検出モデルを構築するための自己監視型学習手法MCSSLを提案する。
MCSSLは、エピポーラ形状と最先端のトラッキングおよびreIDアルゴリズムを利用して、カメラ間のバウンディングボックスと重複する視野を関連付け、オブジェクト検出モデルでそれぞれバックボーンと検出ネットワークを微調整するための2つの擬似ラベルを慎重に生成する。
擬似ラベル上で効果的にトレーニングするため、モデルカスタマイズのために一貫性損失を伴う強力なreidライクなプリテキストタスクを構築する。
MCSSLは,従来のセルフトレーニング方式と比較して,WildTrackデータセットとCityFlowデータセットで平均mAPを5.44%,6.76%向上させた。
関連論文リスト
- MTP: Advancing Remote Sensing Foundation Model via Multi-Task Pretraining [73.81862342673894]
ファンデーションモデルは、様々な画像解釈タスクを強化することで、リモートセンシング(RS)のランドスケープを再構築した。
事前訓練されたモデルを下流のタスクに転送することは、イメージ分類やオブジェクト識別タスクとして事前訓練の定式化によるタスクの相違に遭遇する可能性がある。
SAMRSデータセット上で、セマンティックセグメンテーション、インスタンスセグメンテーション、回転オブジェクト検出を含むマルチタスクによる事前トレーニングを行う。
我々のモデルは、シーン分類、水平・回転物体検出、セマンティックセグメンテーション、変化検出など、様々なRS下流タスクに基づいて微調整される。
論文 参考訳(メタデータ) (2024-03-20T09:17:22Z) - S$^3$Track: Self-supervised Tracking with Soft Assignment Flow [45.77333923477176]
ビデオレベルのアソシエーションラベルを使わずに、自己監督型複数物体追跡について検討する。
オブジェクトアソシエーションのための微分可能なソフトオブジェクト割り当てを提案する。
提案手法は,KITTI,nuScenes,Argoverseのデータセットを用いて評価する。
論文 参考訳(メタデータ) (2023-05-17T06:25:40Z) - De-coupling and De-positioning Dense Self-supervised Learning [65.56679416475943]
Dense Self-Supervised Learning (SSL)メソッドは、複数のオブジェクトでイメージを処理する際に、画像レベルの特徴表現を使用する際の制限に対処する。
本研究は, 層深度やゼロパディングに伴う受容野の増大によって生じる, 結合と位置バイアスに悩まされていることを示す。
我々はCOCOにおける本手法の利点と、オブジェクト分類、セマンティックセグメンテーション、オブジェクト検出のための新しい挑戦的ベンチマークであるOpenImage-MINIについて示す。
論文 参考訳(メタデータ) (2023-03-29T18:07:25Z) - Cut and Learn for Unsupervised Object Detection and Instance
Segmentation [65.43627672225624]
Cut-and-LeaRn(CutLER)は、教師なしオブジェクトの検出とセグメンテーションモデルをトレーニングするためのシンプルなアプローチである。
CutLERはゼロショット非監視検出器であり、11のベンチマークでAP50を2.7倍以上改善している。
論文 参考訳(メタデータ) (2023-01-26T18:57:13Z) - Tracking Passengers and Baggage Items using Multiple Overhead Cameras at
Security Checkpoints [2.021502591596062]
空港の検問所のセキュリティシナリオのために,オーバーヘッドカメラビデオ中の複数のオブジェクトを追跡する新しいフレームワークを提案する。
オーバヘッド画像からのインスタンスセグメンテーションの不確実性に関するモデル情報を提供するために,自己監視学習(SSL)手法を提案する。
この結果から,自己超越はモデルの推定時間を増大させることなく,オブジェクト検出精度を最大42%向上させることがわかった。
論文 参考訳(メタデータ) (2022-12-31T12:57:09Z) - 3DMODT: Attention-Guided Affinities for Joint Detection & Tracking in 3D
Point Clouds [95.54285993019843]
本稿では,3次元点雲における複数物体の同時検出と追跡手法を提案する。
本モデルでは,複数のフレームを用いた時間情報を利用してオブジェクトを検出し,一つのネットワーク上で追跡する。
論文 参考訳(メタデータ) (2022-11-01T20:59:38Z) - Know Your Surroundings: Panoramic Multi-Object Tracking by Multimodality
Collaboration [56.01625477187448]
MMPAT(MultiModality PAnoramic Multi-object Tracking framework)を提案する。
2次元パノラマ画像と3次元点雲を入力とし、マルチモーダルデータを用いて目標軌道を推定する。
提案手法は,検出タスクと追跡タスクの両方においてMMPATが最高性能を達成するJRDBデータセット上で評価する。
論文 参考訳(メタデータ) (2021-05-31T03:16:38Z) - One-Shot Object Detection without Fine-Tuning [62.39210447209698]
本稿では,第1ステージのMatching-FCOSネットワークと第2ステージのStructure-Aware Relation Moduleからなる2段階モデルを提案する。
また,検出性能を効果的に向上する新たなトレーニング戦略を提案する。
提案手法は,複数のデータセット上で一貫した最先端のワンショット性能を上回る。
論文 参考訳(メタデータ) (2020-05-08T01:59:23Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。