論文の概要: Finding a Needle in a Haystack: Tiny Flying Object Detection in 4K
Videos using a Joint Detection-and-Tracking Approach
- arxiv url: http://arxiv.org/abs/2105.08253v1
- Date: Tue, 18 May 2021 03:22:03 GMT
- ステータス: 処理完了
- システム内更新日: 2021-05-20 00:40:09.570603
- Title: Finding a Needle in a Haystack: Tiny Flying Object Detection in 4K
Videos using a Joint Detection-and-Tracking Approach
- Title(参考訳): ヘイスタックにおける針の発見:共同検出・追跡による4Kビデオにおけるニーフライング物体検出
- Authors: Ryota Yoshihashi, Rei Kawakami, Shaodi You, Tu Tuan Trinh, Makoto
Iida, Takeshi Naemura
- Abstract要約: 本稿では,検出と追跡を共同で行うrecurrent correlational networkと呼ばれるニューラルネットワークモデルを提案する。
鳥や無人航空機などの小さな飛行物体の画像を含むデータセットを用いた実験では、提案手法は一貫した改善をもたらした。
我々のネットワークは、鳥の画像データセットのトラッカーとして評価されたとき、最先端の汎用オブジェクトトラッカと同様に機能します。
- 参考スコア(独自算出の注目度): 19.59528430884104
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Detecting tiny objects in a high-resolution video is challenging because the
visual information is little and unreliable. Specifically, the challenge
includes very low resolution of the objects, MPEG artifacts due to compression
and a large searching area with many hard negatives. Tracking is equally
difficult because of the unreliable appearance, and the unreliable motion
estimation. Luckily, we found that by combining this two challenging tasks
together, there will be mutual benefits. Following the idea, in this paper, we
present a neural network model called the Recurrent Correlational Network,
where detection and tracking are jointly performed over a multi-frame
representation learned through a single, trainable, and end-to-end network. The
framework exploits a convolutional long short-term memory network for learning
informative appearance changes for detection, while the learned representation
is shared in tracking for enhancing its performance. In experiments with
datasets containing images of scenes with small flying objects, such as birds
and unmanned aerial vehicles, the proposed method yielded consistent
improvements in detection performance over deep single-frame detectors and
existing motion-based detectors. Furthermore, our network performs as well as
state-of-the-art generic object trackers when it was evaluated as a tracker on
a bird image dataset.
- Abstract(参考訳): 高解像度ビデオで小さな物体を検出することは、視覚情報がほとんど信頼できないため難しい。
特に、課題には、非常に低い解像度のオブジェクト、圧縮によるmpegアーティファクト、多くのハードネガティブな検索領域が含まれる。
追跡は、信頼性の低い外観と信頼性の低い動作推定のため等しく困難である。
幸いなことに、この2つの困難なタスクを組み合わせることで、相互に利益が得られます。
そこで,本論文では,単一,トレーニング可能な,エンドツーエンドのネットワークを通じて学習した多フレーム表現を用いて,検出と追跡を共同で行うリカレント相関ネットワークというニューラルネットワークモデルを提案する。
このフレームワークは、長期にわたる畳み込みメモリネットワークを利用して、検出のための情報的外観変化を学習し、学習された表現は、その性能を高めるために追跡において共有される。
鳥や無人航空機などの小型飛行物体を含むシーンの画像を含むデータセットを用いた実験において、提案手法は、深部単一フレーム検出器や既存のモーションベース検出器に対する検出性能の一貫した改善をもたらした。
さらに,鳥画像データセットのトラッカとして評価された場合,ネットワークは最先端の汎用オブジェクトトラッカと同様に動作する。
関連論文リスト
- Visible and Clear: Finding Tiny Objects in Difference Map [50.54061010335082]
本稿では,検出モデルに自己再構成機構を導入し,それと微小物体との強い相関関係を明らかにする。
具体的には、再構成画像と入力の差分マップを構築して、検出器の首の内側に再構成ヘッドを配置し、小さな物体に対して高い感度を示す。
さらに、小さな特徴表現をより明確にするために、差分マップガイド機能拡張(DGFE)モジュールを開発する。
論文 参考訳(メタデータ) (2024-05-18T12:22:26Z) - Lifting Multi-View Detection and Tracking to the Bird's Eye View [5.679775668038154]
マルチビュー検出と3Dオブジェクト認識の最近の進歩により、性能が大幅に向上した。
パラメータフリーとパラメータ化の両方の現代的なリフト法とマルチビューアグリゲーションを比較した。
堅牢な検出を学習するために,複数のステップの特徴を集約するアーキテクチャを提案する。
論文 参考訳(メタデータ) (2024-03-19T09:33:07Z) - Single-Shot and Multi-Shot Feature Learning for Multi-Object Tracking [55.13878429987136]
そこで本研究では,異なる目標に対して,単発と複数発の特徴を共同で学習するための,シンプルで効果的な2段階特徴学習パラダイムを提案する。
提案手法は,DanceTrackデータセットの最先端性能を達成しつつ,MOT17およびMOT20データセットの大幅な改善を実現している。
論文 参考訳(メタデータ) (2023-11-17T08:17:49Z) - ByteTrackV2: 2D and 3D Multi-Object Tracking by Associating Every
Detection Box [81.45219802386444]
マルチオブジェクトトラッキング(MOT)は、ビデオフレーム間のオブジェクトのバウンディングボックスとIDを推定することを目的としている。
低スコア検出ボックス内の真のオブジェクトをマイニングするための階層型データアソシエーション戦略を提案する。
3次元のシナリオでは、トラッカーが世界座標の物体速度を予測するのがずっと簡単である。
論文 参考訳(メタデータ) (2023-03-27T15:35:21Z) - Minkowski Tracker: A Sparse Spatio-Temporal R-CNN for Joint Object
Detection and Tracking [53.64390261936975]
我々はオブジェクトの検出と追跡を共同で解決するスパース時間R-CNNであるMinkowski Trackerを提案する。
領域ベースCNN(R-CNN)に着想を得て,物体検出器R-CNNの第2段階として動きを追跡することを提案する。
大規模実験では,本手法の総合的な性能向上は4つの要因によることがわかった。
論文 参考訳(メタデータ) (2022-08-22T04:47:40Z) - Video Salient Object Detection via Contrastive Features and Attention
Modules [106.33219760012048]
本稿では,注目モジュールを持つネットワークを用いて,映像の有意な物体検出のためのコントラスト特徴を学習する。
コアテンションの定式化は、低レベル特徴と高レベル特徴を組み合わせるために用いられる。
提案手法は計算量が少なく,最先端の手法に対して良好に動作することを示す。
論文 参考訳(メタデータ) (2021-11-03T17:40:32Z) - Improved detection of small objects in road network sequences [0.0]
本稿では,畳み込みニューラルネットワークによる検出に基づく超解像プロセスを適用し,小型物体の検出手法を提案する。
本研究は, 異なるスケールの要素を含むトラヒック画像の集合に対して, モデルにより得られた検出値に従って効率を試験するために試験された。
論文 参考訳(メタデータ) (2021-05-18T10:13:23Z) - Few-Shot Learning for Video Object Detection in a Transfer-Learning
Scheme [70.45901040613015]
ビデオ物体検出のための数発学習の新たな課題について検討する。
我々は,多数のベースクラスオブジェクトに対して映像物体検出を効果的に訓練するトランスファー学習フレームワークと,ノベルクラスオブジェクトのいくつかのビデオクリップを用いる。
論文 参考訳(メタデータ) (2021-03-26T20:37:55Z) - Concurrent Segmentation and Object Detection CNNs for Aircraft Detection
and Identification in Satellite Images [0.0]
本稿では,2つの全く異なる畳み込みニューラルネットワーク(CNN)を組み合わせて航空機を検出・識別する専用手法を提案する。
その結果, この組み合わせは各ユニタリモデルよりも有意に優れ, 偽陰性率を大幅に低下させることがわかった。
論文 参考訳(メタデータ) (2020-05-27T07:35:55Z) - Joint Detection and Tracking in Videos with Identification Features [36.55599286568541]
本稿では,ビデオ検出,追跡,再識別機能の最初の共同最適化を提案する。
提案手法はMOTの最先端に到達し,オンライントラッカーにおけるUA-DETRAC'18追跡課題のうち,第1位,第3位にランクインした。
論文 参考訳(メタデータ) (2020-05-21T21:06:40Z) - Plug & Play Convolutional Regression Tracker for Video Object Detection [37.47222104272429]
ビデオオブジェクト検出ターゲットは、オブジェクトのバウンディングボックスを同時にローカライズし、所定のビデオ内のクラスを識別する。
ビデオオブジェクト検出の課題のひとつは、ビデオ全体にわたるすべてのオブジェクトを一貫して検出することだ。
ビデオオブジェクト検出タスクのためのPlug & Playスケール適応型畳み込みレグレッショントラッカーを提案する。
論文 参考訳(メタデータ) (2020-03-02T15:57:55Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。