論文の概要: Robust Real-Time Pedestrian Detection on Embedded Devices
- arxiv url: http://arxiv.org/abs/2012.07072v1
- Date: Sun, 13 Dec 2020 14:43:30 GMT
- ステータス: 処理完了
- システム内更新日: 2021-05-09 12:43:48.777556
- Title: Robust Real-Time Pedestrian Detection on Embedded Devices
- Title(参考訳): 組込みデバイスにおけるロバストリアルタイム歩行者検出
- Authors: Mohamed Afifi, Yara Ali, Karim Amer, Mahmoud Shaker, Mohamed Elhelw
- Abstract要約: 本稿では,多くの映像で歩行者検出のためのロバストな枠組みを提案する。
フレームワークは、異なる画像領域で細かく粗い検出を行います。
時間的・空間的特性を活かし、組み込み基板上での精度とリアルタイム性能の向上を図る。
- 参考スコア(独自算出の注目度): 4.514832807541817
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Detection of pedestrians on embedded devices, such as those on-board of
robots and drones, has many applications including road intersection
monitoring, security, crowd monitoring and surveillance, to name a few.
However, the problem can be challenging due to continuously-changing camera
viewpoint and varying object appearances as well as the need for lightweight
algorithms suitable for embedded systems. This paper proposes a robust
framework for pedestrian detection in many footages. The framework performs
fine and coarse detections on different image regions and exploits temporal and
spatial characteristics to attain enhanced accuracy and real time performance
on embedded boards. The framework uses the Yolo-v3 object detection [1] as its
backbone detector and runs on the Nvidia Jetson TX2 embedded board, however
other detectors and/or boards can be used as well. The performance of the
framework is demonstrated on two established datasets and its achievement of
the second place in CVPR 2019 Embedded Real-Time Inference (ERTI) Challenge.
- Abstract(参考訳): ロボットやドローンなどの組み込みデバイス上の歩行者の検出には、道路の交差点の監視、セキュリティ、群衆の監視、監視など、多くの応用がある。
しかし、カメラの視点が継続的に変化し、オブジェクトの外観が変化し、組込みシステムに適した軽量なアルゴリズムの必要性が問題となる。
本稿では,多くの映像における歩行者検出のためのロバストな枠組みを提案する。
このフレームワークは、異なる画像領域で微細かつ粗い検出を行い、時間的および空間的特性を利用して、埋め込み基板上での精度とリアルタイム性能の向上を実現する。
このフレームワークはYolo-v3オブジェクト検出[1]をバックボーン検出器として使用し、Nvidia Jetson TX2組み込みボード上で動作するが、他の検出器やボードも使用できる。
このフレームワークのパフォーマンスは、2つの確立したデータセットで実証され、CVPR 2019 Embedded Real-Time Inference (ERTI) Challengeで2位にランクインした。
関連論文リスト
- Lifting Multi-View Detection and Tracking to the Bird's Eye View [5.679775668038154]
マルチビュー検出と3Dオブジェクト認識の最近の進歩により、性能が大幅に向上した。
パラメータフリーとパラメータ化の両方の現代的なリフト法とマルチビューアグリゲーションを比較した。
堅牢な検出を学習するために,複数のステップの特徴を集約するアーキテクチャを提案する。
論文 参考訳(メタデータ) (2024-03-19T09:33:07Z) - ByteTrackV2: 2D and 3D Multi-Object Tracking by Associating Every
Detection Box [81.45219802386444]
マルチオブジェクトトラッキング(MOT)は、ビデオフレーム間のオブジェクトのバウンディングボックスとIDを推定することを目的としている。
低スコア検出ボックス内の真のオブジェクトをマイニングするための階層型データアソシエーション戦略を提案する。
3次元のシナリオでは、トラッカーが世界座標の物体速度を予測するのがずっと簡単である。
論文 参考訳(メタデータ) (2023-03-27T15:35:21Z) - DOTIE -- Detecting Objects through Temporal Isolation of Events using a
Spiking Architecture [5.340730281227837]
視覚に基づく自律ナビゲーションシステムは障害物を避けるために高速で正確な物体検出アルゴリズムに依存している。
本研究では,イベントに固有の時間的情報を用いて移動物体を効率的に検出する手法を提案する。
我々のアーキテクチャを利用することで、自律ナビゲーションシステムは、オブジェクト検出を行うための最小のレイテンシとエネルギーオーバーヘッドを持つことが示される。
論文 参考訳(メタデータ) (2022-10-03T14:43:11Z) - Drone Detection and Tracking in Real-Time by Fusion of Different Sensing
Modalities [66.4525391417921]
マルチセンサ・ドローン検知システムの設計と評価を行う。
われわれのソリューションは、魚眼カメラを統合し、空の広い部分を監視し、他のカメラを興味ある対象に向けて操縦する。
このサーマルカメラは、たとえこのカメラが解像度が低いとしても、ビデオカメラと同じくらい実現可能なソリューションであることが示されている。
論文 参考訳(メタデータ) (2022-07-05T10:00:58Z) - PiFeNet: Pillar-Feature Network for Real-Time 3D Pedestrian Detection
from Point Cloud [64.12626752721766]
点雲からの歩行者検出に有効なリアルタイム3D検出器であるPiFeNetを提案する。
歩行者を検知する際の3次元物体検出フレームワークが直面する課題として, 柱の特徴の少ない点と, 点群における歩行者の占有面積の小さい点があげられる。
提案手法は,26fps/秒(FPS)で走行しながら,KITTI歩行者BEVと3Dリーダーボードで第1位にランクされ,Nuscenes検出ベンチマークの最先端性能を実現している。
論文 参考訳(メタデータ) (2021-12-31T13:41:37Z) - CFTrack: Center-based Radar and Camera Fusion for 3D Multi-Object
Tracking [9.62721286522053]
本稿では,レーダとカメラセンサの融合に基づく共同物体検出と追跡のためのエンドツーエンドネットワークを提案する。
提案手法では,物体検出に中心型レーダカメラ融合アルゴリズムを用い,物体関連にグリーディアルゴリズムを用いる。
提案手法は,20.0AMOTAを達成し,ベンチマークにおける視覚ベースの3Dトラッキング手法よりも優れる,挑戦的なnuScenesデータセット上で評価する。
論文 参考訳(メタデータ) (2021-07-11T23:56:53Z) - 2nd Place Solution for Waymo Open Dataset Challenge - Real-time 2D
Object Detection [26.086623067939605]
本稿では,画像から2次元物体を検出するリアルタイム手法を提案する。
我々は、加速度RTを活用して、検出パイプラインの推論時間を最適化する。
我々のフレームワークはNvidia Tesla V100 GPU上で45.8ms/frameのレイテンシを実現する。
論文 参考訳(メタデータ) (2021-06-16T11:32:03Z) - Robust Object Detection via Instance-Level Temporal Cycle Confusion [89.1027433760578]
物体検出器の分布外一般化を改善するための補助的自己監視タスクの有効性を検討する。
最大エントロピーの原理に触発されて,新しい自己監督タスクであるインスタンスレベル時間サイクル混乱(cycconf)を導入する。
それぞれのオブジェクトに対して、タスクは、ビデオ内の隣接するフレームで最も異なるオブジェクトの提案を見つけ、自己スーパービジョンのために自分自身にサイクルバックすることです。
論文 参考訳(メタデータ) (2021-04-16T21:35:08Z) - Achieving Real-Time LiDAR 3D Object Detection on a Mobile Device [53.323878851563414]
本稿では,強化学習技術を用いたネットワーク拡張とpruning検索を組み込んだコンパイラ対応統一フレームワークを提案する。
具体的には,リカレントニューラルネットワーク(RNN)を用いて,ネットワークの強化とプルーニングの両面での統一的なスキームを自動で提供する。
提案手法は,モバイルデバイス上でのリアルタイム3次元物体検出を実現する。
論文 参考訳(メタデータ) (2020-12-26T19:41:15Z) - Self-Supervised Person Detection in 2D Range Data using a Calibrated
Camera [83.31666463259849]
2次元LiDARに基づく人検出器のトレーニングラベル(擬似ラベル)を自動生成する手法を提案する。
擬似ラベルで訓練または微調整された自己監視検出器が,手動アノテーションを用いて訓練された検出器を上回っていることを示した。
私達の方法は付加的な分類の努力なしで配置の間に人の探知器を改善する有効な方法です。
論文 参考訳(メタデータ) (2020-12-16T12:10:04Z) - Joint Detection and Tracking in Videos with Identification Features [36.55599286568541]
本稿では,ビデオ検出,追跡,再識別機能の最初の共同最適化を提案する。
提案手法はMOTの最先端に到達し,オンライントラッカーにおけるUA-DETRAC'18追跡課題のうち,第1位,第3位にランクインした。
論文 参考訳(メタデータ) (2020-05-21T21:06:40Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。