論文の概要: End-to-End Trainable One-Stage Parking Slot Detection Integrating Global
and Local Information
- arxiv url: http://arxiv.org/abs/2003.02445v1
- Date: Thu, 5 Mar 2020 05:57:20 GMT
- ステータス: 処理完了
- システム内更新日: 2022-12-26 07:08:04.535327
- Title: End-to-End Trainable One-Stage Parking Slot Detection Integrating Global
and Local Information
- Title(参考訳): グローバル情報とローカル情報を統合した終端学習型ワンステージ駐車スロット検出
- Authors: Jae Kyu Suhr and Ho Gi Jung
- Abstract要約: 本稿では,周囲ビューモニタ(AVM)画像に対する終端から終端までトレーニング可能なワンステージ駐車スロット検出手法を提案する。
提案手法は、畳み込みニューラルネットワーク(CNN)を用いて、グローバル情報(駐車場の入場者、タイプ、占有者)と局所情報(ジャンクションの位置と方向)を同時に取得する。
実験では、この手法をデータセットを用いて定量的に評価し、99.77%のリコールと精度、100%の型分類精度、および99.31%の占有率を毎秒60フレームの処理で示すことにより、従来の手法よりも優れていた。
- 参考スコア(独自算出の注目度): 14.62008690460147
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: This paper proposes an end-to-end trainable one-stage parking slot detection
method for around view monitor (AVM) images. The proposed method simultaneously
acquires global information (entrance, type, and occupancy of parking slot) and
local information (location and orientation of junction) by using a
convolutional neural network (CNN), and integrates them to detect parking slots
with their properties. This method divides an AVM image into a grid and
performs a CNN-based feature extraction. For each cell of the grid, the global
and local information of the parking slot is obtained by applying convolution
filters to the extracted feature map. Final detection results are produced by
integrating the global and local information of the parking slot through
non-maximum suppression (NMS). Since the proposed method obtains most of the
information of the parking slot using a fully convolutional network without a
region proposal stage, it is an end-to-end trainable one-stage detector. In
experiments, this method was quantitatively evaluated using the public dataset
and outperforms previous methods by showing both recall and precision of
99.77%, type classification accuracy of 100%, and occupancy classification
accuracy of 99.31% while processing 60 frames per second.
- Abstract(参考訳): 本稿では,周囲ビューモニタ(AVM)画像に対する終端から終端までトレーニング可能なワンステージ駐車スロット検出手法を提案する。
提案手法は,畳み込みニューラルネットワーク(cnn)を用いてグローバル情報(パーキングスロットのエントランス,タイプ,占有)とローカル情報(ジャンクションの位置と向き)を同時に取得し,それらを統合してパーキングスロットとその特性を検出する。
この方法は、avm画像をグリッドに分割し、cnnベースの特徴抽出を行う。
グリッドの各セルについて、抽出した特徴マップに畳み込みフィルタを適用することにより、駐車スロットのグローバル及びローカル情報を得る。
非最大抑制(nms)により駐車スロットのグローバルおよびローカル情報を統合して最終検出結果を生成する。
提案手法は,地域提案段階のない完全畳み込みネットワークを用いて駐車場の情報の大部分を取得するため,エンドツーエンドのトレーニング可能なワンステージ検出器である。
実験では、公開データセットを用いて定量的に評価し、99.77%のリコールと精度、100%の型分類精度、毎秒60フレームの処理中に99.31%の占有分類精度を示した。
関連論文リスト
- Neural Semantic Map-Learning for Autonomous Vehicles [85.8425492858912]
本稿では,道路環境のコヒーレントな地図を作成するために,車両群から収集した局所部分写像を中心インスタンスに融合するマッピングシステムを提案する。
本手法は,シーン特異的なニューラルサイン距離場を用いて,雑音と不完全局所部分写像を併用する。
我々は,記憶効率の高いスパース機能グリッドを活用して大規模にスケールし,シーン再構築における不確実性をモデル化するための信頼スコアを導入する。
論文 参考訳(メタデータ) (2024-10-10T10:10:03Z) - Deep Homography Estimation for Visual Place Recognition [49.235432979736395]
本稿では,変換器を用いたディープホモグラフィー推定(DHE)ネットワークを提案する。
バックボーンネットワークによって抽出された濃密な特徴写像を入力とし、高速で学習可能な幾何的検証のためにホモグラフィーに適合する。
ベンチマークデータセットを用いた実験により,本手法はいくつかの最先端手法より優れていることが示された。
論文 参考訳(メタデータ) (2024-02-25T13:22:17Z) - Improving Online Lane Graph Extraction by Object-Lane Clustering [106.71926896061686]
本稿では,局所レーングラフの推定精度を向上させるために,アーキテクチャと損失の定式化を提案する。
提案手法は,中心線をクラスタ中心とすることで,対象を中心線に割り当てることを学ぶ。
提案手法は既存の3次元オブジェクト検出手法の出力を用いて,大幅な性能向上を実現することができることを示す。
論文 参考訳(メタデータ) (2023-07-20T15:21:28Z) - Spatial Likelihood Voting with Self-Knowledge Distillation for Weakly
Supervised Object Detection [54.24966006457756]
自己知識蒸留ネットワーク(SLV-SDネット)を用いたWSODフレームワークを提案する。
SLV-SD Netは、境界ボックスアノテーションなしで領域提案のローカライゼーションを収束させる。
PASCAL VOC 2007/2012およびMS-COCOデータセットの実験は、SLV-SD Netの優れた性能を示している。
論文 参考訳(メタデータ) (2022-04-14T11:56:19Z) - CNN-based Two-Stage Parking Slot Detection Using Region-Specific
Multi-Scale Feature Extraction [7.652701739127332]
パーキングスロット検出性能はディープラーニング技術により劇的に改善されている。
深層学習に基づく物体検出法は,一段階と二段階に分類できる。
本稿では,地域特化マルチスケール特徴抽出を用いた高度に特殊な2段駐車スロット検出器を提案する。
論文 参考訳(メタデータ) (2021-08-13T12:02:02Z) - Automated Parking Space Detection Using Convolutional Neural Networks [0.30458514384586394]
We have used computer vision technique to infer the state of the parking lot because the data collected from the University of The Witwatersrand。
本稿では,CaffeとNvidia DiGITSフレームワークを用いた畳み込みニューラルネットワーク(CNN)に基づくリアルタイム駐車空間分類手法を提案する。
論文 参考訳(メタデータ) (2021-06-14T08:30:38Z) - Attentional Graph Neural Network for Parking-slot Detection [10.095984750382478]
本論文では,周辺画像におけるマーキングポイントをグラフ構造データとして参照する注目グラフニューラルネットワークに基づくパーキングスロット検出手法を提案する。
手動で設計した後処理がなければ、提案手法はエンドツーエンドのトレーニングが可能である。
公開ベンチマークデータセットでは,提案手法が最先端精度を達成する実験が行われている。
論文 参考訳(メタデータ) (2021-04-06T15:14:39Z) - End-to-End Object Detection with Fully Convolutional Network [71.56728221604158]
エンドツーエンド検出を実現するために,分類のための予測対応ワン・ツー・ワン (POTO) ラベルの割り当てを導入する。
局所領域における畳み込みの判別性を向上させるために, 簡易な3次元maxフィルタ(3dmf)を提案する。
エンドツーエンドのフレームワークは,COCOおよびCrowdHumanデータセット上のNMSを用いて,最先端の多くの検出器と競合する性能を実現する。
論文 参考訳(メタデータ) (2020-12-07T09:14:55Z) - LABNet: Local Graph Aggregation Network with Class Balanced Loss for
Vehicle Re-Identification [0.0]
車両再識別は、特定の車両を特定することを目的としている重要なコンピュータビジョンタスクである。
深層学習に基づく最近の手法は,背骨特徴抽出器のグローバル平均プール層を利用する。
バックボーン特徴マップ上で局所グラフの集約を行い,局所情報の関連性を学習する。
論文 参考訳(メタデータ) (2020-11-29T18:43:30Z) - Auto-Classifier: A Robust Defect Detector Based on an AutoML Head [2.685668802278155]
畳み込みニューラルネットワークは従来の手法よりも優れた結果が得られることを示す。
また、Auto-Classifierは、全データセットの100%精度と100%AUC結果を達成することで、他のすべてのメソッドよりも優れた性能を示すことを示す。
論文 参考訳(メタデータ) (2020-09-03T10:39:02Z) - R-FCN: Object Detection via Region-based Fully Convolutional Networks [87.62557357527861]
我々は,高精度かつ効率的な物体検出のための領域ベースの完全畳み込みネットワークを提案する。
我々の結果は、Faster R-CNNよりも2.5-20倍高速で、1画像あたり170msのテストタイムで達成される。
論文 参考訳(メタデータ) (2016-05-20T15:50:11Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。