論文の概要: Plug & Play Convolutional Regression Tracker for Video Object Detection
- arxiv url: http://arxiv.org/abs/2003.00981v1
- Date: Mon, 2 Mar 2020 15:57:55 GMT
- ステータス: 処理完了
- システム内更新日: 2022-12-27 05:33:28.314986
- Title: Plug & Play Convolutional Regression Tracker for Video Object Detection
- Title(参考訳): ビデオオブジェクト検出のためのPlug & Play Convolutional Regression Tracker
- Authors: Ye Lyu, Michael Ying Yang, George Vosselman, Gui-Song Xia
- Abstract要約: ビデオオブジェクト検出ターゲットは、オブジェクトのバウンディングボックスを同時にローカライズし、所定のビデオ内のクラスを識別する。
ビデオオブジェクト検出の課題のひとつは、ビデオ全体にわたるすべてのオブジェクトを一貫して検出することだ。
ビデオオブジェクト検出タスクのためのPlug & Playスケール適応型畳み込みレグレッショントラッカーを提案する。
- 参考スコア(独自算出の注目度): 37.47222104272429
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Video object detection targets to simultaneously localize the bounding boxes
of the objects and identify their classes in a given video. One challenge for
video object detection is to consistently detect all objects across the whole
video. As the appearance of objects may deteriorate in some frames, features or
detections from the other frames are commonly used to enhance the prediction.
In this paper, we propose a Plug & Play scale-adaptive convolutional regression
tracker for the video object detection task, which could be easily and
compatibly implanted into the current state-of-the-art detection networks. As
the tracker reuses the features from the detector, it is a very light-weighted
increment to the detection network. The whole network performs at the speed
close to a standard object detector. With our new video object detection
pipeline design, image object detectors can be easily turned into efficient
video object detectors without modifying any parameters. The performance is
evaluated on the large-scale ImageNet VID dataset. Our Plug & Play design
improves mAP score for the image detector by around 5% with only little speed
drop.
- Abstract(参考訳): ビデオオブジェクト検出ターゲットは、オブジェクトのバウンディングボックスを同時にローカライズし、所定のビデオ内のクラスを識別する。
ビデオオブジェクト検出の課題のひとつは、ビデオ全体のすべてのオブジェクトを一貫して検出することである。
一部のフレームではオブジェクトの外観が悪化する可能性があるため、他のフレームの特徴や検出は予測を強化するために一般的に使用される。
本稿では,映像物体検出タスクのためのプラグ・アンド・プレイ・スケール適応畳み込み回帰トラッカを提案する。
トラッカーは検出器の機能を再利用するので、検出ネットワークに対する非常に軽量なインクリメントである。
ネットワーク全体が、標準オブジェクト検出器に近い速度で動作します。
新しいビデオオブジェクト検出パイプラインの設計により、画像オブジェクト検出器はパラメータを変更することなく、容易に効率的なビデオオブジェクト検出器に変換できる。
大規模なImageNet VIDデータセットで性能を評価する。
当社のPlug & Play設計では、画像検出器のmAPスコアを5%程度改善し、速度低下は少ない。
関連論文リスト
- FADE: A Dataset for Detecting Falling Objects around Buildings in Video [75.48118923174712]
建物から落下する物体は、大きな衝撃力によって歩行者に重傷を負わせる可能性がある。
FADEには18のシーンから1,881本のビデオがあり、8つの落下物カテゴリー、4つの気象条件、4つのビデオ解像度がある。
動作情報を効果的に活用するFADE-Netと呼ばれる新しい物体検出手法を開発した。
論文 参考訳(メタデータ) (2024-08-11T11:43:56Z) - FOLT: Fast Multiple Object Tracking from UAV-captured Videos Based on
Optical Flow [27.621524657473945]
複数物体追跡(MOT)はコンピュータビジョンにおいてよく研究されている。
しかし、無人航空機(UAV)が撮影したビデオのMOTは、小さな物体の大きさ、ぼやけた物体の外観、そして非常に大きくて不規則な動きのために依然として困難である。
我々はこれらの問題を緩和し、UAVビューで高速かつ正確なMOTに到達するためにFOLTを提案する。
論文 参考訳(メタデータ) (2023-08-14T15:24:44Z) - Memory Maps for Video Object Detection and Tracking on UAVs [14.573513188682183]
本稿では,無人航空機(UAV)における映像物体の検出と追跡のための新しい手法を提案する。
メタデータを取り入れることで、実際の世界座標におけるオブジェクト位置のメモリマップを作成する。
我々は,この表現を用いて信頼度を高め,時間的コンピュータビジョンタスクの性能を向上させる。
論文 参考訳(メタデータ) (2023-03-06T21:29:45Z) - Implicit Motion Handling for Video Camouflaged Object Detection [60.98467179649398]
本稿では,新しいビデオカモフラージュオブジェクト検出(VCOD)フレームワークを提案する。
短期的および長期的整合性を利用して、ビデオフレームからカモフラージュされたオブジェクトを検出する。
論文 参考訳(メタデータ) (2022-03-14T17:55:41Z) - Recent Trends in 2D Object Detection and Applications in Video Event
Recognition [0.76146285961466]
物体検出における先駆的な研究について論じるとともに,近年のディープラーニングを活用したブレークスルーも取り上げている。
本稿では、画像とビデオの両方で2次元物体検出のための最近のデータセットを強調し、様々な最先端物体検出技術の比較性能の概要を示す。
論文 参考訳(メタデータ) (2022-02-07T14:15:11Z) - Finding a Needle in a Haystack: Tiny Flying Object Detection in 4K
Videos using a Joint Detection-and-Tracking Approach [19.59528430884104]
本稿では,検出と追跡を共同で行うrecurrent correlational networkと呼ばれるニューラルネットワークモデルを提案する。
鳥や無人航空機などの小さな飛行物体の画像を含むデータセットを用いた実験では、提案手法は一貫した改善をもたらした。
我々のネットワークは、鳥の画像データセットのトラッカーとして評価されたとき、最先端の汎用オブジェクトトラッカと同様に機能します。
論文 参考訳(メタデータ) (2021-05-18T03:22:03Z) - Few-Shot Learning for Video Object Detection in a Transfer-Learning
Scheme [70.45901040613015]
ビデオ物体検出のための数発学習の新たな課題について検討する。
我々は,多数のベースクラスオブジェクトに対して映像物体検出を効果的に訓練するトランスファー学習フレームワークと,ノベルクラスオブジェクトのいくつかのビデオクリップを用いる。
論文 参考訳(メタデータ) (2021-03-26T20:37:55Z) - Ensembling object detectors for image and video data analysis [98.26061123111647]
本稿では,複数の物体検出器の出力をアンサンブルすることで,画像データ上の境界ボックスの検出性能と精度を向上させる手法を提案する。
本研究では,2段階追跡に基づく検出精度向上手法を提案することで,映像データに拡張する。
論文 参考訳(メタデータ) (2021-02-09T12:38:16Z) - Single Shot Video Object Detector [215.06904478667337]
Single Shot Video Object Detector (SSVD)は、新しいアーキテクチャであり、ビデオ内のオブジェクト検出のための1段階の検出器に機能集約を新規に統合する。
448の448ドルの入力で、SSVDはImageNet VIDデータセットで79.2%のmAPを達成した。
論文 参考訳(メタデータ) (2020-07-07T15:36:26Z) - Joint Detection and Tracking in Videos with Identification Features [36.55599286568541]
本稿では,ビデオ検出,追跡,再識別機能の最初の共同最適化を提案する。
提案手法はMOTの最先端に到達し,オンライントラッカーにおけるUA-DETRAC'18追跡課題のうち,第1位,第3位にランクインした。
論文 参考訳(メタデータ) (2020-05-21T21:06:40Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。