論文の概要: CNN-based Two-Stage Parking Slot Detection Using Region-Specific
Multi-Scale Feature Extraction
- arxiv url: http://arxiv.org/abs/2108.06185v1
- Date: Fri, 13 Aug 2021 12:02:02 GMT
- ステータス: 処理完了
- システム内更新日: 2021-08-16 13:06:55.392390
- Title: CNN-based Two-Stage Parking Slot Detection Using Region-Specific
Multi-Scale Feature Extraction
- Title(参考訳): 地域別マルチスケール特徴抽出を用いたcnnによる2段階駐車スロット検出
- Authors: Quang Huy Bui and Jae Kyu Suhr
- Abstract要約: パーキングスロット検出性能はディープラーニング技術により劇的に改善されている。
深層学習に基づく物体検出法は,一段階と二段階に分類できる。
本稿では,地域特化マルチスケール特徴抽出を用いた高度に特殊な2段駐車スロット検出器を提案する。
- 参考スコア(独自算出の注目度): 7.652701739127332
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Autonomous parking systems start with the detection of available parking
slots. Parking slot detection performance has been dramatically improved by
deep learning techniques. Deep learning-based object detection methods can be
categorized into one-stage and two-stage approaches. Although it is well-known
that the two-stage approach outperforms the one-stage approach in general
object detection, they have performed similarly in parking slot detection so
far. We consider this is because the two-stage approach has not yet been
adequately specialized for parking slot detection. Thus, this paper proposes a
highly specialized two-stage parking slot detector that uses region-specific
multi-scale feature extraction. In the first stage, the proposed method finds
the entrance of the parking slot as a region proposal by estimating its center,
length, and orientation. The second stage of this method designates specific
regions that most contain the desired information and extracts features from
them. That is, features for the location and orientation are separately
extracted from only the specific regions that most contain the locational and
orientational information. In addition, multi-resolution feature maps are
utilized to increase both positioning and classification accuracies. A
high-resolution feature map is used to extract detailed information (location
and orientation), while another low-resolution feature map is used to extract
semantic information (type and occupancy). In experiments, the proposed method
was quantitatively evaluated with two large-scale public parking slot detection
datasets and outperformed previous methods, including both one-stage and
two-stage approaches.
- Abstract(参考訳): 自動駐車システムは、利用可能な駐車スロットの検出から始める。
駐車スロット検出性能はディープラーニング技術によって劇的に向上した。
深層学習に基づく物体検出法は1段階と2段階に分類できる。
2段階のアプローチが一般の物体検出において1段階のアプローチを上回っていることはよく知られているが、駐車スロット検出においても同様に行われている。
これは2段方式が駐車スロット検出に十分特化していないためであると考えられる。
そこで本研究では,地域別マルチスケール特徴抽出を用いた2段駐車スロット検出器を提案する。
提案手法は,第1段階において,その中央,長さ,方向を推定し,駐車場の入口をエリア提案とする。
本手法の第2段階は、所望の情報を含む特定領域を指定し、特徴を抽出する。
すなわち、位置と方向の特徴は、位置情報と方向情報を含む特定の領域のみから分離して抽出される。
さらに、マルチレゾリューション特徴マップを利用して、位置付けと分類の両精度を高める。
高分解能特徴マップは詳細な情報(位置と方向)を抽出し、別の低解像度特徴マップは意味情報(タイプと占有)を抽出するために使われる。
実験では,提案手法を2つの大規模公共駐車場スロット検出データセットを用いて定量的に評価した。
関連論文リスト
- Transcending Forgery Specificity with Latent Space Augmentation for Generalizable Deepfake Detection [57.646582245834324]
LSDAと呼ばれる簡易で効果的なディープフェイク検出器を提案する。
より多様な偽の表現は、より一般化可能な決定境界を学べるべきである。
提案手法は驚くほど有効であり, 広く使用されている複数のベンチマークで最先端の検出器を超越することを示す。
論文 参考訳(メタデータ) (2023-11-19T09:41:10Z) - Towards Generalizable Deepfake Detection by Primary Region
Regularization [52.41801719896089]
本稿では,新しい正規化の観点から一般化能力を高める。
本手法は, 一次領域マップの静的な位置決めと, 一次領域マスクの動的利用の2段階からなる。
5つのバックボーンを持つDFDC,DF-1.0,Celeb-DFの3種類のディープフェイクデータセットについて広範な実験を行った。
論文 参考訳(メタデータ) (2023-07-24T05:43:34Z) - SFD2: Semantic-guided Feature Detection and Description [34.36397639248686]
本稿では,検出プロセスと記述プロセスの両方にハイレベルなセマンティクスを暗黙的に埋め込むことで,グローバルに信頼性の高い特徴を抽出することを提案する。
具体的には、セマンティック・アウェア・ディテクターは、信頼性のある領域からキーポイントを検出し、信頼できない領域を抑えることができる。
これにより、外観変化に敏感な特徴の数を減らすことにより、キーポイントマッチングの精度が向上する。
論文 参考訳(メタデータ) (2023-04-28T13:34:26Z) - Attention-based Domain Adaptation for Single Stage Detectors [75.88557558238841]
適応が焦点を置くべき重要な領域を特定するための注意機構を導入する。
我々のアプローチは汎用的で、任意の単段検出器に統合できる。
等価な単一ステージアーキテクチャでは、この手法は最先端のドメイン適応技術より優れている。
論文 参考訳(メタデータ) (2021-06-14T10:30:44Z) - Multi-attentional Deepfake Detection [79.80308897734491]
ディープフェイクによる顔の偽造はインターネットに広まり、深刻な社会的懸念を引き起こしている。
新たなマルチアテンテーショナルディープフェイク検出ネットワークを提案する。
具体的には,1)ネットワークを異なる局所的部分へ配置するための複数の空間的注意ヘッド,2)浅い特徴の微妙なアーティファクトをズームするテクスチャ的特徴拡張ブロック,3)低レベルなテクスチャ特徴と高レベルなセマンティクス特徴をアグリゲートする,の3つの構成要素からなる。
論文 参考訳(メタデータ) (2021-03-03T13:56:14Z) - Line-Circle-Square (LCS): A Multilayered Geometric Filter for Edge-Based
Detection [2.4054377316708964]
提案フィルタは,設定された各専門家に対して,過度に計算せずにシーンを判断するための高レベル情報を抽出するために,検出,追跡,学習を行う。
本実験は,実験と実世界の両方のシナリオにおいて,検出精度と資源使用量の観点から,提案フィルタの有効性を検証した。
論文 参考訳(メタデータ) (2020-08-21T05:28:12Z) - D2D: Keypoint Extraction with Describe to Detect Approach [48.0325745125635]
本稿では,ディスクリプタ空間内の情報を利用してキーポイント位置を提案する手法を提案する。
本稿では,まずキーポイント位置を記述し,次に検出することで,この過程を逆転する手法を提案する。
論文 参考訳(メタデータ) (2020-05-27T19:27:46Z) - PSDet: Efficient and Universal Parking Slot Detection [14.085693334348827]
リアルタイム駐車スロット検出は、バレット駐車システムにおいて重要な役割を担っている。
既存の手法は、現実世界のアプリケーションでしか成功しない。
不満足なパフォーマンスを考慮に入れている2つの理由を論じる。
romannumeral1: 利用可能なデータセットは多様性が限られており、一般化能力が低い。
論文 参考訳(メタデータ) (2020-05-12T03:06:25Z) - End-to-End Trainable One-Stage Parking Slot Detection Integrating Global
and Local Information [14.62008690460147]
本稿では,周囲ビューモニタ(AVM)画像に対する終端から終端までトレーニング可能なワンステージ駐車スロット検出手法を提案する。
提案手法は、畳み込みニューラルネットワーク(CNN)を用いて、グローバル情報(駐車場の入場者、タイプ、占有者)と局所情報(ジャンクションの位置と方向)を同時に取得する。
実験では、この手法をデータセットを用いて定量的に評価し、99.77%のリコールと精度、100%の型分類精度、および99.31%の占有率を毎秒60フレームの処理で示すことにより、従来の手法よりも優れていた。
論文 参考訳(メタデータ) (2020-03-05T05:57:20Z) - Road Curb Detection and Localization with Monocular Forward-view Vehicle
Camera [74.45649274085447]
魚眼レンズを装着した校正単眼カメラを用いて3Dパラメータを推定するロバストな手法を提案する。
我々のアプローチでは、車両が90%以上の精度で、リアルタイムで距離を抑えることができる。
論文 参考訳(メタデータ) (2020-02-28T00:24:18Z) - Deep Fusion of Local and Non-Local Features for Precision Landslide
Recognition [17.896249114628336]
本稿では,局所的特徴と非局所的特徴を融合して文脈問題を克服する効果的な手法を提案する。
リモートセンシングコミュニティで広く採用されているU-Netアーキテクチャを基盤として,さらに2つのモジュールを利用する。
実験により,提案手法は最先端の汎用的セマンティックセグメンテーション手法よりも優れた性能を示した。
論文 参考訳(メタデータ) (2020-02-20T03:18:59Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。