論文の概要: Neural Network-based Acoustic Vehicle Counting
- arxiv url: http://arxiv.org/abs/2010.11659v2
- Date: Sat, 27 Mar 2021 08:53:19 GMT
- ステータス: 処理完了
- システム内更新日: 2022-10-04 08:38:14.231770
- Title: Neural Network-based Acoustic Vehicle Counting
- Title(参考訳): ニューラルネットワークによる音響車両の計数
- Authors: Slobodan Djukanovi\'c, Yash Patel, Ji\v{r}i Matas, Tuomas Virtanen
- Abstract要約: 我々は、切断した車間距離の局所最小値から車両のパスバイ瞬間を予測する。
実験により、NNに基づく距離回帰は、これまで提案された支持ベクトル回帰よりもはるかに優れていた。
最小値に基づくカウントに加えて,局所最小値を検出することなく予測距離で動作するディープラーニングカウントを提案する。
- 参考スコア(独自算出の注目度): 14.433172583879072
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: This paper addresses acoustic vehicle counting using one-channel audio. We
predict the pass-by instants of vehicles from local minima of clipped
vehicle-to-microphone distance. This distance is predicted from audio using a
two-stage (coarse-fine) regression, with both stages realised via neural
networks (NNs). Experiments show that the NN-based distance regression
outperforms by far the previously proposed support vector regression. The $
95\% $ confidence interval for the mean of vehicle counting error is within
$[0.28\%, -0.55\%]$. Besides the minima-based counting, we propose a deep
learning counting that operates on the predicted distance without detecting
local minima. Although outperformed in accuracy by the former approach, deep
counting has a significant advantage in that it does not depend on minima
detection parameters. Results also show that removing low frequencies in
features improves the counting performance.
- Abstract(参考訳): 本稿では1チャンネル音声を用いた音響車両の計数について述べる。
マイクロホン間距離の局所的ミニマから車両の通行状況を予測する。
この距離は、ニューラルネットワーク(NN)を介して実現された2段階(粗い)回帰を用いてオーディオから予測される。
実験により、NNに基づく距離回帰は、これまで提案された支持ベクトル回帰よりもはるかに優れていた。
車両カウント誤差の平均に対する95\%の信頼区間は、[0.28\%, -0.55\%]$以内である。
最小値に基づくカウントに加えて,局所最小値を検出することなく予測距離で動作するディープラーニングカウントを提案する。
前者のアプローチでは精度が優れているが、深部カウントは最小検出パラメータに依存しないという点で大きな利点がある。
また,特徴の低周波除去により,計数性能が向上することを示した。
関連論文リスト
- SpirDet: Towards Efficient, Accurate and Lightweight Infrared Small
Target Detector [60.42293239557962]
我々は、赤外線小ターゲットの効率的な検出のための新しいアプローチであるSpirDetを提案する。
新しいデュアルブランチスパースデコーダを用いて特徴写像を復元する。
大規模な実験により、提案されたSpirDetは最先端モデルよりも大幅に優れていることが示された。
論文 参考訳(メタデータ) (2024-02-08T05:06:14Z) - Instant Complexity Reduction in CNNs using Locality-Sensitive Hashing [50.79602839359522]
本稿では,パラメータフリーでデータフリーなモジュールであるHASTE(Hashing for Tractable Efficiency)を提案する。
局所性感応ハッシュ (LSH) を用いることで, 精度を犠牲にすることなく, 遅延特徴写像を劇的に圧縮することができる。
特に、HASTEモジュール用のCIFAR-10上のResNet34で畳み込みモジュールを切り替えるだけで、FLOPの46.72%を即座に落とすことができる。
論文 参考訳(メタデータ) (2023-09-29T13:09:40Z) - Simple Pooling Front-ends For Efficient Audio Classification [56.59107110017436]
入力音声特徴量における時間的冗長性を排除することは,効率的な音声分類に有効な方法である可能性が示唆された。
本稿では、単純な非パラメトリックプーリング操作を用いて冗長な情報を削減する単純なプールフロントエンド(SimPFs)のファミリーを提案する。
SimPFは、市販オーディオニューラルネットワークの浮動小数点演算数の半数以上を削減できる。
論文 参考訳(メタデータ) (2022-10-03T14:00:41Z) - Data-Driven Target Localization Using Adaptive Radar Processing and Convolutional Neural Networks [18.50309014013637]
本稿では,アダプティブレーダ検出後のレーダターゲット位置推定を改善するためのデータ駆動方式を提案する。
我々は、正規化適応整合フィルタ(NAMF)のレーダリターン、範囲、方位(およびドップラー)から熱マップテンソルを生成する。
次に、これらの熱マップテンソルからターゲット位置を推定するために回帰畳み込みニューラルネットワーク(CNN)を訓練する。
論文 参考訳(メタデータ) (2022-09-07T02:23:40Z) - iSDF: Real-Time Neural Signed Distance Fields for Robot Perception [64.80458128766254]
iSDFは実時間符号付き距離場再構成のための連続学習システムである。
より正確な再構築と、衝突コストと勾配のより良い近似を生成する。
論文 参考訳(メタデータ) (2022-04-05T15:48:39Z) - Broadcasted Residual Learning for Efficient Keyword Spotting [7.335747584353902]
モデルサイズと計算負荷を小さくして高精度な放送残差学習手法を提案する。
また,放送残差学習に基づく新しいネットワークアーキテクチャ,BC-Residual Network(BC-ResNet)を提案する。
BC-ResNetsは、Googleの音声コマンドデータセット v1 と v2 で、最先端の98.0% と98.7% のトップ-1 の精度をそれぞれ達成している。
論文 参考訳(メタデータ) (2021-06-08T06:55:39Z) - DEEPF0: End-To-End Fundamental Frequency Estimation for Music and Speech
Signals [11.939409227407769]
DeepF0と呼ばれる新しいピッチ推定手法を提案する。
利用可能な注釈付きデータを活用して、データ駆動方式で生のオーディオから直接学習する。
論文 参考訳(メタデータ) (2021-02-11T23:11:22Z) - Robust Audio-Based Vehicle Counting in Low-to-Moderate Traffic Flow [14.244787327283339]
本稿では,1チャンネル音声を用いた低モジュレートトラフィックにおけるVC(Audio-based Vehicle counting)手法を提案する。
回帰問題としてVCを定式化し、車とマイクの距離を予測する。
本稿では,偽陽性と偽陰性の確率が一致した時点で,最小値検出閾値を設定することを提案する。
論文 参考訳(メタデータ) (2020-10-22T13:42:26Z) - Fast accuracy estimation of deep learning based multi-class musical
source separation [79.10962538141445]
本稿では,ニューラルネットワークのトレーニングやチューニングを行うことなく,任意のデータセットにおける楽器の分離性を評価する手法を提案する。
理想的な比マスクを持つオラクルの原理に基づいて、我々の手法は最先端のディープラーニング手法の分離性能を推定するための優れたプロキシである。
論文 参考訳(メタデータ) (2020-10-19T13:05:08Z) - Deep learning for gravitational-wave data analysis: A resampling
white-box approach [62.997667081978825]
我々は、LIGO検出器からの単一干渉計データを用いて、畳み込みニューラルネットワーク(CNN)を用いて、コンパクトなバイナリコレッセンスにおける重力波(GW)信号を検出する。
CNNはノイズを検出するのに非常に正確だが、GW信号のリコールに十分な感度がないため、CNNはGWトリガの生成よりもノイズ低減に適している。
論文 参考訳(メタデータ) (2020-09-09T03:28:57Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。