論文の概要: Detecting Invisible People
- arxiv url: http://arxiv.org/abs/2012.08419v1
- Date: Tue, 15 Dec 2020 16:54:45 GMT
- ステータス: 処理完了
- システム内更新日: 2021-05-07 05:20:11.962454
- Title: Detecting Invisible People
- Title(参考訳): 見えない人を検出する
- Authors: Tarasha Khurana, Achal Dave, Deva Ramanan
- Abstract要約: 我々は,追跡ベンチマークを再利用し,目立たない物体を検出するための新しい指標を提案する。
私たちは、現在の検出および追跡システムがこのタスクで劇的に悪化することを実証します。
第2に,最先端の単眼深度推定ネットワークによる観測結果を用いて,3次元で明示的に推論する動的モデルを構築した。
- 参考スコア(独自算出の注目度): 58.49425715635312
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Monocular object detection and tracking have improved drastically in recent
years, but rely on a key assumption: that objects are visible to the camera.
Many offline tracking approaches reason about occluded objects post-hoc, by
linking together tracklets after the object re-appears, making use of
reidentification (ReID). However, online tracking in embodied robotic agents
(such as a self-driving vehicle) fundamentally requires object permanence,
which is the ability to reason about occluded objects before they re-appear. In
this work, we re-purpose tracking benchmarks and propose new metrics for the
task of detecting invisible objects, focusing on the illustrative case of
people. We demonstrate that current detection and tracking systems perform
dramatically worse on this task. We introduce two key innovations to recover
much of this performance drop. We treat occluded object detection in temporal
sequences as a short-term forecasting challenge, bringing to bear tools from
dynamic sequence prediction. Second, we build dynamic models that explicitly
reason in 3D, making use of observations produced by state-of-the-art monocular
depth estimation networks. To our knowledge, ours is the first work to
demonstrate the effectiveness of monocular depth estimation for the task of
tracking and detecting occluded objects. Our approach strongly improves by
11.4% over the baseline in ablations and by 5.0% over the state-of-the-art in
F1 score.
- Abstract(参考訳): モノクロ物体の検出と追跡は近年大幅に改善されているが、重要な前提は、物体がカメラから見えるというものである。
多くのオフライントラッキングアプローチは、オブジェクトが再出現した後にトラックレットをリンクして再識別する(ReID)ことで、隠されたオブジェクトをポストホックで推論する。
しかし、身体化されたロボットエージェント(自動運転車など)のオンライントラッキングには、基本的にオブジェクトの永続性が必要である。
本研究は,被験者の視覚的ケースに焦点をあて,目に見える物体を検出するタスクのためのトラッキングベンチマークと,新しいメトリクスを提案する。
この課題に対して,現在の検出・追跡システムが劇的に悪化していることを示す。
このパフォーマンス低下を回復するために、2つの重要なイノベーションを紹介します。
我々は, 時間系列におけるオクルード物体検出を短期予測課題として扱い, 動的シーケンス予測から有意なツールをもたらす。
第2に,最先端の単眼深度推定ネットワークによる観測結果を用いて,3次元で明示的に推論する動的モデルを構築した。
私たちの知る限りでは,オクルード物体を追跡・検出するタスクにおいて,単眼深度推定の有効性を示す最初の研究である。
我々のアプローチは、基準値よりも11.4%、F1スコアより5.0%向上した。
関連論文リスト
- Uncertainty Estimation for 3D Object Detection via Evidential Learning [63.61283174146648]
本稿では,3次元検出器における鳥の視線表示における明らかな学習損失を利用して,3次元物体検出の不確かさを定量化するためのフレームワークを提案する。
本研究では,これらの不確実性評価の有効性と重要性を,分布外シーンの特定,局所化の不十分な物体の発見,および(偽陰性)検出の欠如について示す。
論文 参考訳(メタデータ) (2024-10-31T13:13:32Z) - Leveraging Object Priors for Point Tracking [25.030407197192]
ポイントトラッキングは、コンピュータビジョンにおける基本的な問題であり、多くのARやロボット工学への応用がある。
本稿では,対象の先行点に注意を向ける新たな対象性正規化手法を提案する。
提案手法は,3点追跡ベンチマークにおける最先端性能を実現する。
論文 参考訳(メタデータ) (2024-09-09T16:48:42Z) - Towards Unsupervised Object Detection From LiDAR Point Clouds [46.57452180314863]
OYSTER (Object Discovery via Spatio-Temporal Refinement) は、オブジェクトをゼロショットで検出できる。
距離対衝突に基づく新しい計画中心の知覚尺度を提案する。
論文 参考訳(メタデータ) (2023-11-03T16:12:01Z) - Once Detected, Never Lost: Surpassing Human Performance in Offline LiDAR
based 3D Object Detection [50.959453059206446]
本稿では,高性能なオフラインLiDARによる3Dオブジェクト検出を実現することを目的とする。
まず、経験豊富な人間のアノテータが、トラック中心の視点でオブジェクトに注釈を付けるのを観察する。
従来のオブジェクト中心の視点ではなく,トラック中心の視点で高性能なオフライン検出器を提案する。
論文 参考訳(メタデータ) (2023-04-24T17:59:05Z) - DORT: Modeling Dynamic Objects in Recurrent for Multi-Camera 3D Object
Detection and Tracking [67.34803048690428]
本稿では、この問題を解決するためにRecurrenT(DORT)の動的オブジェクトをモデル化することを提案する。
DORTは、重い計算負担を軽減する動き推定のために、オブジェクトワイズローカルボリュームを抽出する。
フレキシブルで実用的で、ほとんどのカメラベースの3Dオブジェクト検出器に差し込むことができる。
論文 参考訳(メタデータ) (2023-03-29T12:33:55Z) - Long Range Object-Level Monocular Depth Estimation for UAVs [0.0]
本稿では,画像からモノクロ物体を長距離検出するための最先端手法の新たな拡張法を提案する。
まず、回帰タスクとして深度推定をモデル化する際、SigmoidおよびReLUライクエンコーディングを提案する。
次に,深度推定を分類問題とし,訓練損失の計算にソフトアルグマックス関数を導入する。
論文 参考訳(メタデータ) (2023-02-17T15:26:04Z) - Learning to Track with Object Permanence [61.36492084090744]
共同物体の検出と追跡のためのエンドツーエンドのトレーニング可能なアプローチを紹介します。
私たちのモデルは、合成データと実データで共同トレーニングされ、KITTIおよびMOT17データセットの最先端を上回ります。
論文 参考訳(メタデータ) (2021-03-26T04:43:04Z) - ArTIST: Autoregressive Trajectory Inpainting and Scoring for Tracking [80.02322563402758]
オンラインマルチオブジェクトトラッキング(MOT)フレームワークの中核的なコンポーネントの1つは、既存のトラックレットと新しい検出を関連付けることである。
そこで我々は,トラックレットが自然運動を表す可能性を直接測定することにより,トラックレットの提案を評価する確率論的自己回帰生成モデルを提案する。
論文 参考訳(メタデータ) (2020-04-16T06:43:11Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。