論文の概要: Adaptive Vehicle Speed Classification via BMCNN with Reinforcement Learning-Enhanced Acoustic Processing
- arxiv url: http://arxiv.org/abs/2509.00839v1
- Date: Sun, 31 Aug 2025 13:23:04 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-09-04 15:17:03.422198
- Title: Adaptive Vehicle Speed Classification via BMCNN with Reinforcement Learning-Enhanced Acoustic Processing
- Title(参考訳): 強化学習強化音響処理を用いたBMCNNによる適応車速分類
- Authors: Yuli Zhang, Pengfei Fan, Ruiyuan Jiang, Hankang Gu, Dongyao Jia, Xinheng Wang,
- Abstract要約: 本稿では,音速分類のためのディープラーニングと強化学習を組み合わせたハイブリッドフレームワークを提案する。
IDMT-TrafficとSZUR-Acousticデータセットの評価は95.99%と92.3%の精度を示し、早期終了による平均処理は1.63倍高速である。
- 参考スコア(独自算出の注目度): 5.180264808659531
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Traffic congestion remains a pressing urban challenge, requiring intelligent transportation systems for real-time management. We present a hybrid framework that combines deep learning and reinforcement learning for acoustic vehicle speed classification. A dual-branch BMCNN processes MFCC and wavelet features to capture complementary frequency patterns. An attention-enhanced DQN adaptively selects the minimal number of audio frames and triggers early decisions once confidence thresholds are reached. Evaluations on IDMT-Traffic and our SZUR-Acoustic (Suzhou) datasets show 95.99% and 92.3% accuracy, with up to 1.63x faster average processing via early termination. Compared with A3C, DDDQN, SA2C, PPO, and TD3, the method provides a superior accuracy-efficiency trade-off and is suitable for real-time ITS deployment in heterogeneous urban environments.
- Abstract(参考訳): 交通渋滞は依然として都市部の課題であり、リアルタイム管理にはインテリジェントな交通システムが必要である。
本稿では,音速分類のためのディープラーニングと強化学習を組み合わせたハイブリッドフレームワークを提案する。
二分岐BMCNNはMFCCとウェーブレットを処理し、相補的な周波数パターンをキャプチャする。
注意力強化DQNは、最小数のオーディオフレームを適応的に選択し、信頼しきい値に達すると早期決定をトリガーする。
IDMT-TrafficとSZUR-Acoustic (Suzhou)データセットの評価は95.99%と92.3%の精度を示し、早期終了による平均処理は1.63倍高速である。
A3C, DDDQN, SA2C, PPO, TD3と比較すると, 精度・効率のトレードオフが良好であり, 異種都市環境におけるITSのリアルタイム展開に適している。
関連論文リスト
- TOAST: Task-Oriented Adaptive Semantic Transmission over Dynamic Wireless Environments [3.3107717550009865]
TOAST(Task-Oriented Adaptive Semantic Transmission)は、無線環境におけるマルチタスク最適化の課題を解決するために設計された統合フレームワークである。
我々はマルコフ決定過程として適応的タスクバランスを定式化し、画像再構成の忠実度と意味分類の精度のトレードオフを動的に調整するために深層強化学習を用いる。
モジュール固有のLow-Rank Adaptation(LoRA)機構を,Swin Transformerベースのジョイントソースチャネル符号化アーキテクチャ全体に統合する。
論文 参考訳(メタデータ) (2025-06-27T04:36:30Z) - Integrating Vehicle Acoustic Data for Enhanced Urban Traffic Management: A Study on Speed Classification in Suzhou [6.224884420568902]
車両騒音と駆動速度の結合をモデル化するディープ畳み込みニューラルネットワーク(BMCNN)を提案する。
BMCNNは、SZUR-Acousticデータセットで87.56%、パブリックIDMT-Trafficデータセットで96.28%の分類精度を達成した。
提案手法は,実時間騒音モニタリングと速度推定のためのスマートシティ交通管理システムに組み込むことができる。
論文 参考訳(メタデータ) (2025-06-26T13:53:22Z) - A Stable Whitening Optimizer for Efficient Neural Network Training [101.89246340672246]
アルゴリズムのシャンプー系をベースとして,3つの重要な問題を同定・緩和し,SPlus法を提案する。
まず,行列逆が長期にわたってキャッシュされる場合,素早いシャンプーは分岐しがちであることがわかった。
第二に、ネットワーク幅をまたいで学習率の伝達を可能にするために、形状認識スケーリングを適用する。
第3に,高い学習率によってパラメータノイズが大きくなり,より高速な学習をブロックする簡単な反復学習方式を提案する。
論文 参考訳(メタデータ) (2025-06-08T18:43:31Z) - QDCNN: Quantum Deep Learning for Enhancing Safety and Reliability in Autonomous Transportation Systems [5.062798070922488]
本稿では,輸送におけるCPSの安全性と信頼性を高めるために,QDCNN(Quantum Deep Convolutional Neural Network)を提案する。
提案したQDCNNは,正常な条件下での3つのデータセットと,雨による1つの道路を用いて,その頑健性を評価する。
これは計算効率の点で既存の手法よりも優れており、わずか0.0049352秒のシャドウ検出時間を達成する。
論文 参考訳(メタデータ) (2025-03-01T19:04:44Z) - Road Traffic Sign Recognition method using Siamese network Combining Efficient-CNN based Encoder [5.597437966490453]
交通標識認識(TSR)は、補助運転とインテリジェント交通システムにおいて重要な役割を担っている。
本稿では,改良されたエンコーダとSiameseネットを備えたIECES-networkを提案する。
提案手法は,2.9Mの軽量スケールで88.1%,86.43%,86.1%の競合性能を再現する。
論文 参考訳(メタデータ) (2025-02-21T09:03:05Z) - Contextual Bandits with Non-Stationary Correlated Rewards for User Association in MmWave Vehicular Networks [2.5206846348004506]
チャネル状態情報(CSI)を明示的に測定することなく、最新のユーザアソシエーションを確立するための半分散文脈相関上信頼境界(SD-CC-UCB)アルゴリズムを提案する。
SD-CC-UCBは、コンテキスト的マルチアーム・バンディット・フレームワークの下で、車両の位置と速度から送信率を学習し、予測し、ユーザ・アソシエーションの迅速な決定のために複雑なチャネル条件を適切にキャプチャする。
提案アルゴリズムは,完全瞬時CSIを必要とするベンチマークアルゴリズムの100%から103%以内のネットワークスループットを実現する。
論文 参考訳(メタデータ) (2024-10-08T08:10:03Z) - Audio-Visual Efficient Conformer for Robust Speech Recognition [91.3755431537592]
本稿では,近年提案されている高能率コンバータ接続性時間分類アーキテクチャの雑音を,音声と視覚の両方を処理して改善することを提案する。
実験の結果,音声と視覚のモダリティを用いることで,環境騒音の存在下での音声の認識が向上し,トレーニングが大幅に加速し,WERが4倍のトレーニングステップで低下することが確認された。
論文 参考訳(メタデータ) (2023-01-04T05:36:56Z) - Correlating sparse sensing for large-scale traffic speed estimation: A
Laplacian-enhanced low-rank tensor kriging approach [76.45949280328838]
本稿では,Laplacian enhanced Low-rank tensor (LETC) フレームワークを提案する。
次に,提案したモデルをネットワークワイド・クリグにスケールアップするために,複数の有効な数値手法を用いて効率的な解アルゴリズムを設計する。
論文 参考訳(メタデータ) (2022-10-21T07:25:57Z) - Transferable Deep Reinforcement Learning Framework for Autonomous
Vehicles with Joint Radar-Data Communications [69.24726496448713]
本稿では,AVの最適決定を支援するために,マルコフ決定プロセス(MDP)に基づくインテリジェントな最適化フレームワークを提案する。
そこで我々は,近年の深層強化学習技術を活用した効果的な学習アルゴリズムを開発し,AVの最適方針を見出す。
提案手法は,従来の深部強化学習手法と比較して,AVによる障害物ミス検出確率を最大67%削減することを示す。
論文 参考訳(メタデータ) (2021-05-28T08:45:37Z) - Towards a Competitive End-to-End Speech Recognition for CHiME-6 Dinner
Party Transcription [73.66530509749305]
本稿では,難しい場合であっても,ハイブリッドベースラインに近い性能を示すエンドツーエンドアプローチについて論じる。
CTC-Attention と RNN-Transducer のアプローチと RNN と Transformer のアーキテクチャを比較し,解析する。
RNN-Transducerをベースとしたベストエンド・ツー・エンドモデルでは、ビームサーチの改善とともに、LF-MMI TDNN-F CHiME-6 Challengeのベースラインよりも品質が3.8%向上した。
論文 参考訳(メタデータ) (2020-04-22T19:08:33Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。