論文の概要: CNN-Based Framework for Pedestrian Age and Gender Classification Using Far-View Surveillance in Mixed-Traffic Intersections
- arxiv url: http://arxiv.org/abs/2511.22873v1
- Date: Fri, 28 Nov 2025 04:32:04 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-12-01 19:47:55.768527
- Title: CNN-Based Framework for Pedestrian Age and Gender Classification Using Far-View Surveillance in Mixed-Traffic Intersections
- Title(参考訳): CNNによる歩行者年齢とジェンダーの分類 : 混在交通区間における遠視野サーベイランスによる検討
- Authors: Shisir Shahriar Arif, Md. Muhtashim Shahrier, Nazmul Haque, Md Asif Raihan, Md. Hadiuzzaman,
- Abstract要約: 本研究では、畳み込みニューラルネットワーク(CNN)を用いた遠景交差点映像から歩行者年齢群と性別を分類する枠組みを提案する。
この分類は、フルボディの視覚的手がかりに基づいて、大人、ティーンエイジャー、子供の歩行者を男性と女性の両方で区別する、統合された6クラス問題として構成されている。
実践者にとってこのシステムは、既存のカメラインフラを使用して交差点の歩行者人口を監視する、スケーラブルで費用対効果の高いツールを提供する。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by-nc-nd/4.0/
- Abstract: Pedestrian safety remains a pressing concern in congested urban intersections, particularly in low- and middle-income countries where traffic is multimodal, and infrastructure often lacks formal control. Demographic factors like age and gender significantly influence pedestrian vulnerability, yet real-time monitoring systems rarely capture this information. To address this gap, this study proposes a deep learning framework that classifies pedestrian age group and gender from far-view intersection footage using convolutional neural networks (CNNs), without relying on facial recognition or high-resolution imagery. The classification is structured as a unified six-class problem, distinguishing adult, teenager, and child pedestrians for both males and females, based on full-body visual cues. Video data was collected from three high-risk intersections in Dhaka, Bangladesh. Two CNN architectures were implemented: ResNet50, a deep convolutional neural network pretrained on ImageNet, and a custom lightweight CNN optimized for computational efficiency. Eight model variants explored combinations of pooling strategies and optimizers. ResNet50 with Max Pooling and SGD achieved the highest accuracy (86.19%), while the custom CNN performed comparably (84.15%) with fewer parameters and faster training. The model's efficient design enables real-time inference on standard surveillance feeds. For practitioners, this system provides a scalable, cost-effective tool to monitor pedestrian demographics at intersections using existing camera infrastructure. Its outputs can shape intersection design, optimize signal timing, and enable targeted safety interventions for vulnerable groups such as children or the elderly. By offering demographic insights often missing in conventional traffic data, the framework supports more inclusive, data-driven planning in mixed-traffic environments.
- Abstract(参考訳): 歩行者の安全は、渋滞した都市交差点、特に交通がマルチモーダルであり、インフラが正式な制御を欠いている低所得国において、引き続き懸念されている。
年齢や性別などのデモグラフィック的要因は歩行者の脆弱性に大きく影響するが、リアルタイム監視システムでは、この情報を捉えることはめったにない。
このギャップに対処するために、顔認識や高解像度画像に頼ることなく、畳み込みニューラルネットワーク(CNN)を用いて、歩行者年齢群と性別を遠景の交差点映像から分類するディープラーニングフレームワークを提案する。
この分類は、フルボディの視覚的手がかりに基づいて、大人、ティーンエイジャー、子供の歩行者を男性と女性の両方で区別する、統合された6クラス問題として構成されている。
ビデオデータはバングラデシュのダッカにある3つのハイリスク交差点から収集された。
2つのCNNアーキテクチャが実装された: ResNet50、ImageNetで事前訓練された深層畳み込みニューラルネットワーク、計算効率に最適化されたカスタム軽量CNN。
8種類のモデルがプール戦略とオプティマイザの組み合わせを調査した。
ResNet50とMax PoolingとSGDは最高精度(86.19%)を達成し、カスタムCNNはより少ないパラメータとより高速なトレーニングで84.15%を達成した。
モデルの効率的な設計は、標準的な監視フィードのリアルタイム推論を可能にする。
実践者にとってこのシステムは、既存のカメラインフラを使用して交差点の歩行者人口を監視する、スケーラブルで費用対効果の高いツールを提供する。
その出力は交差点の設計を形作ることができ、信号タイミングを最適化し、子供や高齢者のような脆弱なグループに対する標的となる安全介入を可能にする。
従来のトラフィックデータに欠落する人口統計情報を提供することで、このフレームワークは混合交通環境における包括的でデータ駆動型プランニングをサポートする。
関連論文リスト
- TrafficLoc: Localizing Traffic Surveillance Cameras in 3D Scenes [49.43995864524434]
本稿では,画像間クラウド登録(I2P)手法であるTrafficLocを提案する。
大規模な現実世界の交差点データセットの欠如を克服するため、カルラの75の都市と農村の交差点を持つ新しいシミュレーションデータセットであるCarla Intersectionを紹介した。
我々のTrafficLocは、Carla Intersection上でSOTA I2P法(最大86%)よりも大幅に性能を向上し、実世界のデータに対してよく一般化する。
論文 参考訳(メタデータ) (2024-12-13T17:42:53Z) - Diffusion-based Data Augmentation for Object Counting Problems [62.63346162144445]
拡散モデルを用いて広範なトレーニングデータを生成するパイプラインを開発する。
拡散モデルを用いて位置ドットマップ上に条件付き画像を生成するのはこれが初めてである。
提案した拡散モデルにおけるカウント損失は,位置ドットマップと生成した群集画像との差を効果的に最小化する。
論文 参考訳(メタデータ) (2024-01-25T07:28:22Z) - Elastic Interaction Energy-Informed Real-Time Traffic Scene Perception [8.429178814528617]
EIEGSegという名前のトポロジ対応エネルギー損失関数に基づくネットワークトレーニング戦略を提案する。
EIEGSegは、リアルタイムの交通シーン認識におけるマルチクラスセグメンテーションのために設計されている。
以上の結果から,EIEGSegは,特にリアルタイム軽量ネットワークにおいて,性能を継続的に向上することを示す。
論文 参考訳(メタデータ) (2023-10-02T01:30:42Z) - Unfolding Local Growth Rate Estimates for (Almost) Perfect Adversarial
Detection [22.99930028876662]
畳み込みニューラルネットワーク(CNN)は、多くの知覚的タスクにおける最先端のソリューションを定義する。
現在のCNNアプローチは、システムを騙すために特別に作られた入力の敵の摂動に対して脆弱なままである。
本稿では,ネットワークの局所固有次元(LID)と敵攻撃の関係について,最近の知見を生かした,シンプルで軽量な検出器を提案する。
論文 参考訳(メタデータ) (2022-12-13T17:51:32Z) - Correlating sparse sensing for large-scale traffic speed estimation: A
Laplacian-enhanced low-rank tensor kriging approach [76.45949280328838]
本稿では,Laplacian enhanced Low-rank tensor (LETC) フレームワークを提案する。
次に,提案したモデルをネットワークワイド・クリグにスケールアップするために,複数の有効な数値手法を用いて効率的な解アルゴリズムを設計する。
論文 参考訳(メタデータ) (2022-10-21T07:25:57Z) - Federated Deep Learning Meets Autonomous Vehicle Perception: Design and
Verification [168.67190934250868]
フェデレーテッド・ラーニング・パワード・コネクテッド・オートモービル(FLCAV)が提案されている。
FLCAVは通信とアノテーションのコストを削減しながらプライバシを保存する。
マルチステージトレーニングのためのネットワークリソースと道路センサのポーズを決定することは困難である。
論文 参考訳(メタデータ) (2022-06-03T23:55:45Z) - Learning from Images: Proactive Caching with Parallel Convolutional
Neural Networks [94.85780721466816]
本稿では,プロアクティブキャッシングのための新しいフレームワークを提案する。
モデルベースの最適化とデータ駆動技術を組み合わせて、最適化問題をグレースケールのイメージに変換する。
数値計算の結果,提案手法は71.6%の計算時間を0.8%のコストで削減できることがわかった。
論文 参考訳(メタデータ) (2021-08-15T21:32:47Z) - Anchor-free Small-scale Multispectral Pedestrian Detection [88.7497134369344]
適応型単一段アンカーフリーベースアーキテクチャにおける2つのモードの効果的かつ効率的な多重スペクトル融合法を提案する。
我々は,直接的境界ボックス予測ではなく,対象の中心と規模に基づく歩行者表現の学習を目指す。
その結果,小型歩行者の検出における本手法の有効性が示唆された。
論文 参考訳(メタデータ) (2020-08-19T13:13:01Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。