論文の概要: FairMOT: On the Fairness of Detection and Re-Identification in Multiple
Object Tracking
- arxiv url: http://arxiv.org/abs/2004.01888v6
- Date: Tue, 19 Oct 2021 05:37:18 GMT
- ステータス: 処理完了
- システム内更新日: 2022-12-16 23:09:25.675140
- Title: FairMOT: On the Fairness of Detection and Re-Identification in Multiple
Object Tracking
- Title(参考訳): FairMOT:複数物体追跡における検出と再同定の公正性について
- Authors: Yifu Zhang and Chunyu Wang and Xinggang Wang and Wenjun Zeng and Wenyu
Liu
- Abstract要約: マルチオブジェクトトラッキング(MOT)はコンピュータビジョンにおいて重要な問題である。
本稿では,FairMOTと呼ばれる,アンカーフリーなオブジェクト検出アーキテクチャCenterNetをベースとした,シンプルかつ効果的なアプローチを提案する。
このアプローチは、検出と追跡の両方において高い精度を達成する。
- 参考スコア(独自算出の注目度): 92.48078680697311
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Multi-object tracking (MOT) is an important problem in computer vision which
has a wide range of applications. Formulating MOT as multi-task learning of
object detection and re-ID in a single network is appealing since it allows
joint optimization of the two tasks and enjoys high computation efficiency.
However, we find that the two tasks tend to compete with each other which need
to be carefully addressed. In particular, previous works usually treat re-ID as
a secondary task whose accuracy is heavily affected by the primary detection
task. As a result, the network is biased to the primary detection task which is
not fair to the re-ID task. To solve the problem, we present a simple yet
effective approach termed as FairMOT based on the anchor-free object detection
architecture CenterNet. Note that it is not a naive combination of CenterNet
and re-ID. Instead, we present a bunch of detailed designs which are critical
to achieve good tracking results by thorough empirical studies. The resulting
approach achieves high accuracy for both detection and tracking. The approach
outperforms the state-of-the-art methods by a large margin on several public
datasets. The source code and pre-trained models are released at
https://github.com/ifzhang/FairMOT.
- Abstract(参考訳): マルチオブジェクトトラッキング(MOT)は、幅広い用途を持つコンピュータビジョンにおいて重要な問題である。
1つのネットワークにおけるオブジェクト検出とre-IDのマルチタスク学習としてのMOTの定式化は、2つのタスクを共同で最適化でき、高い計算効率を享受できるため、魅力的である。
しかし、2つのタスクは互いに競合する傾向にあり、慎重に対処する必要がある。
特に、以前の研究は通常、re-IDを一次検出タスクに大きく影響された二次タスクとして扱う。
その結果、ネットワークは、re-IDタスクに不公平な一次検出タスクにバイアスされる。
この問題を解決するために,アンカーフリーなオブジェクト検出アーキテクチャ・センターネットに基づくfairmotと呼ばれる,単純かつ効果的なアプローチを提案する。
CenterNetとre-IDの単純な組み合わせではないことに注意してください。
その代わり、徹底的な実証研究によって良好な追跡結果を達成するために重要な詳細な設計を多数提示する。
その結果,検出と追跡の両面で高い精度が得られた。
このアプローチは、いくつかのパブリックデータセットで最先端のメソッドを大きなマージンで上回っている。
ソースコードと事前訓練されたモデルはhttps://github.com/ifzhang/FairMOT.comで公開されている。
関連論文リスト
- DeTra: A Unified Model for Object Detection and Trajectory Forecasting [68.85128937305697]
提案手法は,2つのタスクの結合を軌道修正問題として定式化する。
この統合タスクに対処するために、オブジェクトの存在, ポーズ, マルチモーダルな将来の振る舞いを推測する精細化変換器を設計する。
実験では、我々のモデルはArgoverse 2 Sensor and Openデータセットの最先端性よりも優れています。
論文 参考訳(メタデータ) (2024-06-06T18:12:04Z) - UniFormaly: Towards Task-Agnostic Unified Framework for Visual Anomaly
Detection [6.260747047974035]
We present UniFormaly, a universal and powerful anomaly detection framework。
我々は,オンラインエンコーダ方式の準最適問題を指摘することによって,オフ・ザ・シェルフアプローチの必要性を強調した。
UniFormalyは様々なタスクやデータセットで優れた結果を得る。
論文 参考訳(メタデータ) (2023-07-24T06:04:12Z) - Transformer-based assignment decision network for multiple object
tracking [0.0]
本稿では,データアソシエーションに取り組むトランスフォーマーベースのアサインメント決定ネットワーク(TADN)について,推論中に明示的な最適化を必要とせずに紹介する。
提案手法は,トラッカーとしての単純な性質にもかかわらず,ほとんどの評価指標において最先端の手法よりも優れている。
論文 参考訳(メタデータ) (2022-08-06T19:47:32Z) - Efficient Person Search: An Anchor-Free Approach [86.45858994806471]
パーソンサーチは、クエリーの人物を、リアルで切り刻まれていない画像から、同時にローカライズし、識別することを目的としている。
この目標を達成するために、最先端モデルは通常、Faster R-CNNのような2段階検出器にre-idブランチを追加する。
本研究では,この課題に対処するためのアンカーフリーな手法を提案する。
論文 参考訳(メタデータ) (2021-09-01T07:01:33Z) - Decoupled and Memory-Reinforced Networks: Towards Effective Feature
Learning for One-Step Person Search [65.51181219410763]
歩行者検出と識別サブタスクを1つのネットワークで処理するワンステップ方式を開発しました。
現在のワンステップアプローチには2つの大きな課題があります。
本稿では,これらの問題を解決するために,分離メモリ強化ネットワーク(DMRNet)を提案する。
論文 参考訳(メタデータ) (2021-02-22T06:19:45Z) - MRDet: A Multi-Head Network for Accurate Oriented Object Detection in
Aerial Images [51.227489316673484]
水平アンカーから変換された指向性提案を生成するために、任意指向領域提案ネットワーク(AO-RPN)を提案する。
正確なバウンディングボックスを得るために,検出タスクを複数のサブタスクに分離し,マルチヘッドネットワークを提案する。
各ヘッドは、対応するタスクに最適な特徴を学習するために特別に設計されており、ネットワークがオブジェクトを正確に検出することができる。
論文 参考訳(メタデータ) (2020-12-24T06:36:48Z) - Multi-object tracking with self-supervised associating network [5.947279761429668]
人間のラベリングを伴わない短い動画を多数使用して,新たな自己教師型学習手法を提案する。
再識別ネットワークは自己管理方式で訓練されているが、MOTA 62.0% と IDF1 62.6% の最先端性能をMOT17テストベンチマークで達成している。
論文 参考訳(メタデータ) (2020-10-26T08:48:23Z) - Anchor-free Small-scale Multispectral Pedestrian Detection [88.7497134369344]
適応型単一段アンカーフリーベースアーキテクチャにおける2つのモードの効果的かつ効率的な多重スペクトル融合法を提案する。
我々は,直接的境界ボックス予測ではなく,対象の中心と規模に基づく歩行者表現の学習を目指す。
その結果,小型歩行者の検出における本手法の有効性が示唆された。
論文 参考訳(メタデータ) (2020-08-19T13:13:01Z) - RetinaTrack: Online Single Stage Joint Detection and Tracking [22.351109024452462]
両タスクがミッションクリティカルな自律運転におけるトラッキング・バイ・検出パラダイムに注目した。
本稿では、一般的な単一ステージのRetinaNetアプローチを改良したRetinaTrackと呼ばれる、概念的にシンプルで効率的な検出と追跡のジョイントモデルを提案する。
論文 参考訳(メタデータ) (2020-03-30T23:46:29Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。