論文の概要: Audio-Based Pedestrian Detection in the Presence of Vehicular Noise
- arxiv url: http://arxiv.org/abs/2509.19295v1
- Date: Tue, 23 Sep 2025 17:57:44 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-09-24 20:41:27.987984
- Title: Audio-Based Pedestrian Detection in the Presence of Vehicular Noise
- Title(参考訳): 音声に基づく歩行者による車体騒音検出
- Authors: Yonghyun Kim, Chaeyeon Han, Akash Sarode, Noah Posner, Subhrajit Guhathakurta, Alexander Lerch,
- Abstract要約: 本稿では,車体騒音の存在下でのオーディオに基づく歩行者検出における,新しいデータセット,結果,および最先端技術に関する詳細な分析について述べる。
本研究では, (i) 雑音と雑音に制限された環境間のクロスデータセット評価, (ii) ノイズがモデル性能に与える影響の評価, (iii) ドメイン外の音に対するモデルの予測ロバスト性の評価の3つの分析を行った。
- 参考スコア(独自算出の注目度): 39.631104350049945
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Audio-based pedestrian detection is a challenging task and has, thus far, only been explored in noise-limited environments. We present a new dataset, results, and a detailed analysis of the state-of-the-art in audio-based pedestrian detection in the presence of vehicular noise. In our study, we conduct three analyses: (i) cross-dataset evaluation between noisy and noise-limited environments, (ii) an assessment of the impact of noisy data on model performance, highlighting the influence of acoustic context, and (iii) an evaluation of the model's predictive robustness on out-of-domain sounds. The new dataset is a comprehensive 1321-hour roadside dataset. It incorporates traffic-rich soundscapes. Each recording includes 16kHz audio synchronized with frame-level pedestrian annotations and 1fps video thumbnails.
- Abstract(参考訳): 音声による歩行者検出は難しい課題であり、これまでは騒音に制限のある環境でのみ研究されてきた。
本稿では,車体騒音の存在下でのオーディオに基づく歩行者検出における,新しいデータセット,結果,および最先端技術に関する詳細な分析について述べる。
本研究では,3つの分析を行った。
(i)雑音環境と雑音環境のクロスデータセット評価
二 騒音がモデル性能に与える影響の評価、音環境の影響の強調、及び
(3)ドメイン外の音に対するモデルの予測ロバスト性の評価。
新しいデータセットは、包括的な1321時間のロードサイドデータセットである。
交通量の多いサウンドスケープを取り入れている。
それぞれの録音には、16kHzのオーディオがフレームレベルの歩行者アノテーションと1fpsのビデオサムネイルと同期されている。
関連論文リスト
- Towards Robust Transcription: Exploring Noise Injection Strategies for Training Data Augmentation [55.752737615873464]
本研究では,SNR(Signal-to-Noise Ratio)レベルにおける白色雑音の影響について検討した。
この研究は、様々な音環境における一貫した性能を維持する転写モデルの開発に向けた予備的な研究として、貴重な洞察を与えてくれることを願っている。
論文 参考訳(メタデータ) (2024-10-18T02:31:36Z) - NoisyAG-News: A Benchmark for Addressing Instance-Dependent Noise in Text Classification [7.464154519547575]
ノイズラベルを用いた学習に関する既存の研究は、主に合成ノイズパターンに焦点を当てている。
実世界のテキスト分類設定においてラベルノイズをよりよく理解するためのベンチマークデータセットを構築した。
以上の結果から,事前学習モデルでは合成ノイズに耐性があるものの,インスタンス依存ノイズには耐え難いことが判明した。
論文 参考訳(メタデータ) (2024-07-09T06:18:40Z) - Real Acoustic Fields: An Audio-Visual Room Acoustics Dataset and Benchmark [65.79402756995084]
Real Acoustic Fields (RAF)は、複数のモードから実際の音響室データをキャプチャする新しいデータセットである。
RAFは密集した室内音響データを提供する最初のデータセットである。
論文 参考訳(メタデータ) (2024-03-27T17:59:56Z) - Impact of Noisy Supervision in Foundation Model Learning [91.56591923244943]
本論文は、事前学習データセットにおけるノイズの性質を包括的に理解し分析する最初の研究である。
雑音の悪影響を緩和し、一般化を改善するため、特徴空間に適応するチューニング法(NMTune)を提案する。
論文 参考訳(メタデータ) (2024-03-11T16:22:41Z) - Enhancement of 3D Camera Synthetic Training Data with Noise Models [1.6385815610837167]
本研究の目的は,3次元撮影データにおけるノイズの影響を,撮像プロセスのノイズをモデル化して評価することである。
我々は、ノイズモデルを得るために、特別に構築されたシーンのデータセットをコンパイルした。
具体的には、画像面における捕獲点の位置と軸方向の雑音に影響を及ぼす横方向雑音をモデル化し、画像面に対する軸方向の位置に影響を及ぼす。
論文 参考訳(メタデータ) (2024-02-26T11:50:42Z) - Sample selection with noise rate estimation in noise learning of medical image analysis [3.9934250802854376]
本稿では,ノイズの多いデータセットでトレーニングされた場合のニューラルネットワークの性能を向上させる新しいサンプル選択手法を提案する。
本手法では,線形回帰を用いて損失値の分布を解析することにより,データセットの雑音率を推定する。
モデルのノイズ堅牢性をさらに高めるために,スパース正規化を採用している。
論文 参考訳(メタデータ) (2023-12-23T11:57:21Z) - Self-Supervised Visual Acoustic Matching [63.492168778869726]
音響マッチングは、ターゲットの音響環境に録音されたかのように、音声クリップを再合成することを目的としている。
そこで本研究では,対象のシーン画像と音声のみを含む,視覚的音響マッチングのための自己教師型アプローチを提案する。
提案手法は,条件付きGANフレームワークと新しいメトリクスを用いて,室内音響をアンタングル化し,音をターゲット環境に再合成する方法を共同で学習する。
論文 参考訳(メタデータ) (2023-07-27T17:59:59Z) - A Study on Robustness to Perturbations for Representations of
Environmental Sound [16.361059909912758]
モノフォニック(UrbanSound8K)およびポリフォニック(SONYC UST)データセット上で,YAMNetとOpenL$3$の2つの埋め込みを評価した。
本研究では,音波信号に摂動を注入することによりチャネル効果を模倣し,新しい埋め込みのシフトを3つの距離で測定する。
論文 参考訳(メタデータ) (2022-03-20T01:04:38Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。