論文の概要: DPDnet: A Robust People Detector using Deep Learning with an Overhead
Depth Camera
- arxiv url: http://arxiv.org/abs/2006.01053v1
- Date: Mon, 1 Jun 2020 16:28:25 GMT
- ステータス: 処理完了
- システム内更新日: 2022-11-26 06:30:56.787906
- Title: DPDnet: A Robust People Detector using Deep Learning with an Overhead
Depth Camera
- Title(参考訳): DPDnet: 深層カメラを用いた深層学習によるロバストな人検知装置
- Authors: David Fuentes-Jimenez, Roberto Martin-Lopez, Cristina
Losada-Gutierrez, David Casillas-Perez, Javier Macias-Guarasa, Daniel
Pizarro, Carlos A.Luna
- Abstract要約: 本研究では,高信頼度で1つの頭上深度画像から複数の人物を検出する手法を提案する。
DPDnetと呼ばれるニューラルネットワークは、残層に基づく2つの完全畳み込みエンコーダデコーダニューラルブロックに基づいている。
実験の結果、PDNetは最先端の手法よりも優れており、3つの異なる公開データセットで99%以上のアキュラシーを達成している。
- 参考スコア(独自算出の注目度): 9.376814409561726
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: In this paper we propose a method based on deep learning that detects
multiple people from a single overhead depth image with high reliability. Our
neural network, called DPDnet, is based on two fully-convolutional
encoder-decoder neural blocks based on residual layers. The Main Block takes a
depth image as input and generates a pixel-wise confidence map, where each
detected person in the image is represented by a Gaussian-like distribution.
The refinement block combines the depth image and the output from the main
block, to refine the confidence map. Both blocks are simultaneously trained
end-to-end using depth images and head position labels. The experimental work
shows that DPDNet outperforms state-of-the-art methods, with accuracies greater
than 99% in three different publicly available datasets, without retraining not
fine-tuning. In addition, the computational complexity of our proposal is
independent of the number of people in the scene and runs in real time using
conventional GPUs.
- Abstract(参考訳): 本稿では,1つのオーバーヘッド深度画像から複数の人物を高い信頼性で検出する深層学習に基づく手法を提案する。
DPDnetと呼ばれるニューラルネットワークは、残層に基づく2つの完全畳み込みエンコーダデコーダニューラルブロックに基づいている。
メインブロックは、深度画像を入力として、画像中の検出された人物をガウス的分布で表現した画素毎の信頼度マップを生成する。
精細ブロックは、主ブロックからの深度画像と出力とを組み合わせて、信頼性マップを精細化する。
両方のブロックは、深度画像と頭部位置ラベルを使用してエンドツーエンドで同時に訓練される。
実験の結果、PDNetは最先端の手法よりも優れており、3つの公開データセットで99%以上のアキュラシーを達成している。
さらに,提案手法の計算複雑性は現場の人数とは独立であり,従来のGPUを用いてリアルタイムに実行可能である。
関連論文リスト
- Pixel-Aligned Multi-View Generation with Depth Guided Decoder [86.1813201212539]
画素レベルの画像・マルチビュー生成のための新しい手法を提案する。
従来の作業とは異なり、潜伏映像拡散モデルのVAEデコーダにマルチビュー画像にアテンション層を組み込む。
本モデルにより,マルチビュー画像間の画素アライメントが向上する。
論文 参考訳(メタデータ) (2024-08-26T04:56:41Z) - Depth Is All You Need for Monocular 3D Detection [29.403235118234747]
教師なしの方法で対象領域に深度表現を合わせることを提案する。
本手法では, トレーニング時間中に利用可能なLiDARやRGBビデオを利用して深度表現を微調整し, 改良された3D検出器を実現する。
論文 参考訳(メタデータ) (2022-10-05T18:12:30Z) - P3Depth: Monocular Depth Estimation with a Piecewise Planarity Prior [133.76192155312182]
本研究では,コプラナー画素からの情報を選択的に活用して予測深度を改善する手法を提案する。
本手法の広範な評価により, 教師付き単分子深度推定法において, 新たな手法の確立が期待できる。
論文 参考訳(メタデータ) (2022-04-05T10:03:52Z) - Least Square Estimation Network for Depth Completion [11.840223815711004]
本稿では,深度完了タスクのための効率的な画像表現法を提案する。
システムの入力は単眼カメラフレームと同期スパース深度マップである。
実験の結果は、NYU-Depth-V2データセットの精度と実行時間の両方で、最先端のデータセットを上回ったことを示している。
論文 参考訳(メタデータ) (2022-03-07T11:52:57Z) - IB-MVS: An Iterative Algorithm for Deep Multi-View Stereo based on
Binary Decisions [0.0]
本稿では,マルチビューステレオのための新しいディープラーニング手法を提案する。
提案手法は,各画素における実現可能な深度値の連続空間を2値決定方式でトラバースすることにより,高分解能かつ高精度な深度マップを反復的に推定する。
提案手法をDTU, タンク, テンプル上の最先端のマルチビューステレオ手法と, 挑戦的なETH3Dベンチマークと比較し, 競争力のある結果を示した。
論文 参考訳(メタデータ) (2021-11-29T10:04:24Z) - Learning Joint 2D-3D Representations for Depth Completion [90.62843376586216]
2Dおよび3Dの関節の特徴を抽出することを学ぶシンプルで効果的なニューラルネットワークブロックを設計します。
具体的には、画像画素に2D畳み込みと3D点に連続畳み込みを施した2つのドメイン固有のサブネットワークから構成される。
論文 参考訳(メタデータ) (2020-12-22T22:58:29Z) - Dual Pixel Exploration: Simultaneous Depth Estimation and Image
Restoration [77.1056200937214]
本研究では,ぼかしと深度情報をリンクするDPペアの形成について検討する。
本稿では,画像の深さを共同で推定し,復元するためのエンドツーエンドDDDNet(DPベースのDepth and De Network)を提案する。
論文 参考訳(メタデータ) (2020-12-01T06:53:57Z) - Defocus Blur Detection via Depth Distillation [64.78779830554731]
初めてDBDに深度情報を導入します。
より詳しくは, 地底の真理と, 十分に訓練された深度推定ネットワークから抽出した深度から, デフォーカスのぼかしを学習する。
我々の手法は、2つの一般的なデータセット上で11の最先端の手法より優れています。
論文 参考訳(メタデータ) (2020-07-16T04:58:09Z) - Towards Dense People Detection with Deep Learning and Depth images [9.376814409561726]
本稿では,1つの深度画像から複数の人物を検出するDNNシステムを提案する。
我々のニューラルネットワークは深度画像を処理し、画像座標の確率マップを出力する。
我々は、この戦略が効果的であることを示し、トレーニング中に使用するものと異なるシーンで動作するように一般化したネットワークを創出する。
論文 参考訳(メタデータ) (2020-07-14T16:43:02Z) - Single Image Depth Estimation Trained via Depth from Defocus Cues [105.67073923825842]
単一のRGB画像から深度を推定することはコンピュータビジョンの基本的な課題である。
この作業では、異なる視点ではなく、フォーカスキューからの奥行きに依存しています。
我々は,KITTIとMake3Dデータセットの教師あり手法と同等な結果を提示し,教師なし学習手法より優れていることを示す。
論文 参考訳(メタデータ) (2020-01-14T20:22:54Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。