論文の概要: Clique: Spatiotemporal Object Re-identification at the City Scale
- arxiv url: http://arxiv.org/abs/2012.09329v1
- Date: Thu, 17 Dec 2020 00:05:50 GMT
- ステータス: 処理完了
- システム内更新日: 2021-05-02 07:18:08.700076
- Title: Clique: Spatiotemporal Object Re-identification at the City Scale
- Title(参考訳): Clique: 都市規模における時空間物体の再同定
- Authors: Tiantu Xu, Kaiwen Shen, Yang Fu, Humphrey Shi, Felix Xiaozhu Lin
- Abstract要約: 2つの新しい技術に基づいた実用的なReIDエンジンであるCliqueを紹介します。
Cliqueは、ReIDアルゴリズムで抽出されたファジィオブジェクトの特徴をクラスタリングして、ターゲット発生を評価します。
Cliqueは70のクエリで0.87(リコール5)に達し、高い精度で830倍の動画をリアルタイムで実行した。
- 参考スコア(独自算出の注目度): 5.742537343413236
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Object re-identification (ReID) is a key application of city-scale cameras.
While classic ReID tasks are often considered as image retrieval, we treat them
as spatiotemporal queries for locations and times in which the target object
appeared. Spatiotemporal reID is challenged by the accuracy limitation in
computer vision algorithms and the colossal videos from city cameras. We
present Clique, a practical ReID engine that builds upon two new techniques:
(1) Clique assesses target occurrences by clustering fuzzy object features
extracted by ReID algorithms, with each cluster representing the general
impression of a distinct object to be matched against the input; (2) to search
in videos, Clique samples cameras to maximize the spatiotemporal coverage and
incrementally adds cameras for processing on demand. Through evaluation on 25
hours of videos from 25 cameras, Clique reached a high accuracy of 0.87 (recall
at 5) across 70 queries and runs at 830x of video realtime in achieving high
accuracy.
- Abstract(参考訳): オブジェクト再識別(ReID)は都市規模のカメラのキーとなる応用である。
古典的なreidタスクは画像検索と見なされることが多いが、対象オブジェクトが現れる場所と時間についての時空間クエリとして扱う。
時空間レイドは、コンピュータビジョンアルゴリズムと都市カメラからのコロッサルビデオの精度の限界に挑戦されている。
Clique は,(1) ReID アルゴリズムによって抽出されたファジィオブジェクトの特徴をクラスタリングすることで,ターゲット発生を判定する実用的 ReID エンジンであり,各クラスタは,入力にマッチする別物体の一般的な印象を表す。(2) ビデオで検索するために,Clique は時空間のカバレッジを最大化し,必要に応じてカメラを段階的に追加する。
25台のカメラから25時間のビデオを評価することで、Cliqueは70のクエリで0.87(リコールは5)に達し、高い精度で830倍の動画をリアルタイムに実行した。
関連論文リスト
- Introduction of a tree-based technique for efficient and real-time label
retrieval in the object tracking system [1.6099403809839035]
本稿では,大規模ビデオ監視システムにおける移動物体のリアルタイム追跡品質の問題に対処する。
本稿では,複数のオブジェクトを自動的にラベル付けして,インデックス化機構を用いた効率的なリアルタイムトラッキングを実現する手法を提案する。
論文 参考訳(メタデータ) (2022-05-31T00:13:53Z) - E^2TAD: An Energy-Efficient Tracking-based Action Detector [78.90585878925545]
本稿では,事前定義されたキーアクションを高精度かつ効率的にローカライズするためのトラッキングベースソリューションを提案する。
UAV-Video Track of 2021 Low-Power Computer Vision Challenge (LPCVC)で優勝した。
論文 参考訳(メタデータ) (2022-04-09T07:52:11Z) - Recent Trends in 2D Object Detection and Applications in Video Event
Recognition [0.76146285961466]
物体検出における先駆的な研究について論じるとともに,近年のディープラーニングを活用したブレークスルーも取り上げている。
本稿では、画像とビデオの両方で2次元物体検出のための最近のデータセットを強調し、様々な最先端物体検出技術の比較性能の概要を示す。
論文 参考訳(メタデータ) (2022-02-07T14:15:11Z) - VideoPose: Estimating 6D object pose from videos [14.210010379733017]
我々は、畳み込みニューラルネットワークを用いて、ビデオから直接オブジェクトのポーズを推定する、単純だが効果的なアルゴリズムを導入する。
提案するネットワークは、トレーニング済みの2Dオブジェクト検出器を入力として、リカレントニューラルネットワークを介して視覚的特徴を集約し、各フレームで予測を行う。
YCB-Videoデータセットの実験的評価から,本手法は最先端のアルゴリズムと同等であることがわかった。
論文 参考訳(メタデータ) (2021-11-20T20:57:45Z) - Video Salient Object Detection via Contrastive Features and Attention
Modules [106.33219760012048]
本稿では,注目モジュールを持つネットワークを用いて,映像の有意な物体検出のためのコントラスト特徴を学習する。
コアテンションの定式化は、低レベル特徴と高レベル特徴を組み合わせるために用いられる。
提案手法は計算量が少なく,最先端の手法に対して良好に動作することを示す。
論文 参考訳(メタデータ) (2021-11-03T17:40:32Z) - Where were my keys? -- Aggregating Spatial-Temporal Instances of Objects
for Efficient Retrieval over Long Periods of Time [15.583172926806151]
本稿では,検出に基づく3段階階層型アソシエーション手法D3Aを提案する。
D3Aは空間時空間情報を関連づけることなくデータベースに一致したオブジェクトを鼻で保存するシステムよりも47倍高速で33%精度が高いことを示す。
論文 参考訳(メタデータ) (2021-10-25T15:57:27Z) - A Fast Location Algorithm for Very Sparse Point Clouds Based on Object
Detection [0.0]
特徴点の少ない状況下で,画像オブジェクト検出によって対象物を素早く検出するアルゴリズムを提案する。
スマートフォンを持って手動で設計したシーンで実験を行い,提案手法の高精度な位置決め速度と精度を示す。
論文 参考訳(メタデータ) (2021-10-21T05:17:48Z) - ASOD60K: Audio-Induced Salient Object Detection in Panoramic Videos [79.05486554647918]
本研究では,パノラマビデオから有能な物体を分離する新しいタスクであるPV-SODを提案する。
既存の固定レベルやオブジェクトレベルの塩分濃度検出タスクとは対照的に,多モードの塩分濃度検出(SOD)に焦点を当てる。
AsOD60Kという,6レベル階層の4K解像度ビデオフレームを含む,最初の大規模データセットを収集する。
論文 参考訳(メタデータ) (2021-07-24T15:14:20Z) - Robust Object Detection via Instance-Level Temporal Cycle Confusion [89.1027433760578]
物体検出器の分布外一般化を改善するための補助的自己監視タスクの有効性を検討する。
最大エントロピーの原理に触発されて,新しい自己監督タスクであるインスタンスレベル時間サイクル混乱(cycconf)を導入する。
それぞれのオブジェクトに対して、タスクは、ビデオ内の隣接するフレームで最も異なるオブジェクトの提案を見つけ、自己スーパービジョンのために自分自身にサイクルバックすることです。
論文 参考訳(メタデータ) (2021-04-16T21:35:08Z) - A Simple and Effective Use of Object-Centric Images for Long-Tailed
Object Detection [56.82077636126353]
シーン中心画像における物体検出を改善するために,物体中心画像を活用する。
私たちは、シンプルで驚くほど効果的なフレームワークを提示します。
我々の手法は、レアオブジェクトのオブジェクト検出(およびインスタンスセグメンテーション)の精度を相対的に50%(および33%)向上させることができる。
論文 参考訳(メタデータ) (2021-02-17T17:27:21Z) - VideoClick: Video Object Segmentation with a Single Click [93.7733828038616]
ビデオ中の各オブジェクトに対して1クリックずつのボトムアップアプローチを提案し,全ビデオ中の各オブジェクトのセグメンテーションマスクを取得する。
特に、対象フレーム内の各ピクセルを基準フレーム内のオブジェクトまたは背景のいずれかに割り当てる相関ボリュームを構築します。
この新しいCityscapesVideoデータセットの結果から、この困難な環境では、私たちのアプローチがすべてのベースラインを上回ります。
論文 参考訳(メタデータ) (2021-01-16T23:07:48Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。