論文の概要: CrosswalkNet: An Optimized Deep Learning Framework for Pedestrian Crosswalk Detection in Aerial Images with High-Performance Computing
- arxiv url: http://arxiv.org/abs/2506.07885v1
- Date: Mon, 09 Jun 2025 15:56:24 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-06-10 16:33:11.033276
- Title: CrosswalkNet: An Optimized Deep Learning Framework for Pedestrian Crosswalk Detection in Aerial Images with High-Performance Computing
- Title(参考訳): CrosswalkNet: 高性能計算による航空画像の歩行者横断歩道検出のための最適化されたディープラーニングフレームワーク
- Authors: Zubin Bhuyan, Yuanchang Xie, AngkeaReach Rith, Xintong Yan, Nasko Apostolov, Jimi Oke, Chengbo Ai,
- Abstract要約: 本研究は,多様な歩行者横断歩道を検出するための,堅牢で効率的なディープラーニングフレームワークであるCrosswalkNetを紹介する。
23,000以上のアノテーション付き横断歩道インスタンスからなるデータセットを使用して、提案したフレームワークをトレーニングし、検証する。
最高の性能モデルは96.5%の精度で、マサチューセッツ州の航空画像では93.3%の精度でリコールされている。
- 参考スコア(独自算出の注目度): 1.0271350966202908
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: With the increasing availability of aerial and satellite imagery, deep learning presents significant potential for transportation asset management, safety analysis, and urban planning. This study introduces CrosswalkNet, a robust and efficient deep learning framework designed to detect various types of pedestrian crosswalks from 15-cm resolution aerial images. CrosswalkNet incorporates a novel detection approach that improves upon traditional object detection strategies by utilizing oriented bounding boxes (OBB), enhancing detection precision by accurately capturing crosswalks regardless of their orientation. Several optimization techniques, including Convolutional Block Attention, a dual-branch Spatial Pyramid Pooling-Fast module, and cosine annealing, are implemented to maximize performance and efficiency. A comprehensive dataset comprising over 23,000 annotated crosswalk instances is utilized to train and validate the proposed framework. The best-performing model achieves an impressive precision of 96.5% and a recall of 93.3% on aerial imagery from Massachusetts, demonstrating its accuracy and effectiveness. CrosswalkNet has also been successfully applied to datasets from New Hampshire, Virginia, and Maine without transfer learning or fine-tuning, showcasing its robustness and strong generalization capability. Additionally, the crosswalk detection results, processed using High-Performance Computing (HPC) platforms and provided in polygon shapefile format, have been shown to accelerate data processing and detection, supporting real-time analysis for safety and mobility applications. This integration offers policymakers, transportation engineers, and urban planners an effective instrument to enhance pedestrian safety and improve urban mobility.
- Abstract(参考訳): 航空画像や衛星画像の普及に伴い、深層学習は輸送資産管理、安全分析、都市計画において大きな可能性を秘めている。
本研究では、15cmの空中画像から様々な歩行者横断歩道を検出するために設計された,堅牢で効率的なディープラーニングフレームワークであるCrosswalkNetを紹介する。
CrosswalkNetは、オブジェクト指向境界ボックス(OBB)を利用することで、従来の物体検出戦略を改善する新しい検出手法を導入し、方向に関わらず、クロスウォークを正確にキャプチャすることで、検出精度を向上させる。
コンボリューショナル・ブロック・アテンション(Convolutional Block Attention)、デュアルブランチ空間ピラミッド・ポーリング・ファストモジュール(Spatial Pyramid Pooling-Fast Module)、コサインアニーリング(cosine annealing)など、いくつかの最適化手法が実装され、性能と効率を最大化する。
23,000以上のアノテーション付き横断歩道インスタンスからなる包括的なデータセットを使用して、提案したフレームワークをトレーニングし、検証する。
最高の性能モデルは96.5%の精度で、マサチューセッツ州の航空画像では93.3%の精度でリコールを行い、精度と有効性を示している。
CrosswalkNetは、転送学習や微調整なしでニューハンプシャー、バージニア、メインのデータセットにもうまく適用され、堅牢性と強力な一般化能力を示している。
さらに、ハイパフォーマンスコンピューティング(HPC)プラットフォームを用いて処理され、ポリゴン形状ファイルフォーマットで提供されるクロスウォーク検出結果により、データ処理と検出を高速化し、安全性および移動性アプリケーションのためのリアルタイム解析をサポートすることが示されている。
この統合により、政策立案者、輸送技術者、都市計画者が歩行者の安全性を高め、都市移動性を向上させる効果的な手段となる。
関連論文リスト
- Efficient Detection Framework Adaptation for Edge Computing: A Plug-and-play Neural Network Toolbox Enabling Edge Deployment [59.61554561979589]
エッジコンピューティングは、時間に敏感なシナリオでディープラーニングベースのオブジェクト検出をデプロイするための重要なパラダイムとして登場した。
既存のエッジ検出手法では、軽量モデルによる検出精度のバランスの難しさ、適応性の制限、現実の検証の不十分といった課題に直面している。
本稿では,汎用的なプラグイン・アンド・プレイコンポーネントを用いてエッジ環境にオブジェクト検出モデルを適用するエッジ検出ツールボックス(ED-TOOLBOX)を提案する。
論文 参考訳(メタデータ) (2024-12-24T07:28:10Z) - YOLO-TS: Real-Time Traffic Sign Detection with Enhanced Accuracy Using Optimized Receptive Fields and Anchor-Free Fusion [15.571409945909243]
本稿では,新しいリアルタイムかつ効率的な道路標識検出ネットワーク YOLO-TS を提案する。
このネットワークは,マルチスケール特徴写像の受容場を最適化することにより,性能を著しく向上させる。
我々の革新的な機能融合戦略は、アンカーフリー手法の柔軟性を活用し、精度と速度の両面で顕著な向上を実現している。
論文 参考訳(メタデータ) (2024-10-22T16:19:55Z) - CCSPNet-Joint: Efficient Joint Training Method for Traffic Sign
Detection Under Extreme Conditions [3.6190463374643795]
CCSPNetはContextual TransformerとCNNをベースにした効率的な特徴抽出モジュールである。
データ効率と一般化を改善するための共同トレーニングモデルCCSPNet-Jointを提案する。
実験により,CCSPNetは極端条件下での交通標識検出において最先端の性能を達成することが示された。
論文 参考訳(メタデータ) (2023-09-13T12:00:33Z) - Object-Size-Driven Design of Convolutional Neural Networks: Virtual Axle Detection based on Raw Data [0.0]
本研究では,橋梁上に任意に設置したセンサを用いた列車軸受のリアルタイム検出手法を提案する。
VADER(Virtual Axle Detector with Enhanced Receptive Field)の開発は、単線鉄道橋上で検証されている。
生データを入力として使用することで、最先端のスペクトログラムベースの手法をスピードとメモリ使用率の両方で99%向上させた。
論文 参考訳(メタデータ) (2023-09-04T12:53:54Z) - Correlating sparse sensing for large-scale traffic speed estimation: A
Laplacian-enhanced low-rank tensor kriging approach [76.45949280328838]
本稿では,Laplacian enhanced Low-rank tensor (LETC) フレームワークを提案する。
次に,提案したモデルをネットワークワイド・クリグにスケールアップするために,複数の有効な数値手法を用いて効率的な解アルゴリズムを設計する。
論文 参考訳(メタデータ) (2022-10-21T07:25:57Z) - Anchor-free Small-scale Multispectral Pedestrian Detection [88.7497134369344]
適応型単一段アンカーフリーベースアーキテクチャにおける2つのモードの効果的かつ効率的な多重スペクトル融合法を提案する。
我々は,直接的境界ボックス予測ではなく,対象の中心と規模に基づく歩行者表現の学習を目指す。
その結果,小型歩行者の検出における本手法の有効性が示唆された。
論文 参考訳(メタデータ) (2020-08-19T13:13:01Z) - SADet: Learning An Efficient and Accurate Pedestrian Detector [68.66857832440897]
本稿では,一段検出器の検出パイプラインに対する一連の最適化手法を提案する。
効率的な歩行者検出のための単発アンカーベース検出器(SADet)を形成する。
構造的には単純だが、VGA解像度の画像に対して最先端の結果と20ドルFPSのリアルタイム速度を示す。
論文 参考訳(メタデータ) (2020-07-26T12:32:38Z) - DFR-TSD: A Deep Learning Based Framework for Robust Traffic Sign
Detection Under Challenging Weather Conditions [4.0075294089613465]
本稿では,事前拡張によるCNNに基づく交通信号認識フレームワークを提案する。
提案手法は, 精度が 7.58%, 精度が 35.90% 向上した 91.1% と 70.71% の総合的精度とリコールが得られることを示した。
論文 参考訳(メタデータ) (2020-06-03T23:12:26Z) - Data Freshness and Energy-Efficient UAV Navigation Optimization: A Deep
Reinforcement Learning Approach [88.45509934702913]
我々は、移動基地局(BS)が配備される複数の無人航空機(UAV)のナビゲーションポリシーを設計する。
我々は、地上BSにおけるデータの鮮度を確保するために、エネルギーや情報年齢(AoI)の制約などの異なる文脈情報を組み込んだ。
提案したトレーニングモデルを適用することで、UAV-BSに対する効果的なリアルタイム軌道ポリシーは、時間とともに観測可能なネットワーク状態をキャプチャする。
論文 参考訳(メタデータ) (2020-02-21T07:29:15Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。