論文の概要: The AeroSonicDB (YPAD-0523) Dataset for Acoustic Detection and
Classification of Aircraft
- arxiv url: http://arxiv.org/abs/2311.06368v1
- Date: Fri, 10 Nov 2023 19:41:10 GMT
- ステータス: 処理完了
- システム内更新日: 2023-11-14 19:14:57.254773
- Title: The AeroSonicDB (YPAD-0523) Dataset for Acoustic Detection and
Classification of Aircraft
- Title(参考訳): 航空機の音響検出・分類のためのエアロソニックDB(YPAD-0523)データセット
- Authors: Blake Downward, Jon Nordby
- Abstract要約: 本稿では,音響検出・分類システムの訓練を目的とした低空飛行航空機音のデータセットであるAeroSonicDB(YPAD-0523)を紹介する。
本稿では,ADS-Bラジオ伝送を利用して音声サンプルを受動的に収集・ラベルする手法について述べる。
データセットには18秒から60秒間の625の航空機記録が含まれており、合計8.87時間の航空機音声が記録されている。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: The time and expense required to collect and label audio data has been a
prohibitive factor in the availability of domain specific audio datasets. As
the predictive specificity of a classifier depends on the specificity of the
labels it is trained on, it follows that finely-labelled datasets are crucial
for advances in machine learning. Aiming to stimulate progress in the field of
machine listening, this paper introduces AeroSonicDB (YPAD-0523), a dataset of
low-flying aircraft sounds for training acoustic detection and classification
systems. This paper describes the method of exploiting ADS-B radio
transmissions to passively collect and label audio samples. Provides a summary
of the collated dataset. Presents baseline results from three binary
classification models, then discusses the limitations of the current dataset
and its future potential. The dataset contains 625 aircraft recordings ranging
in event duration from 18 to 60 seconds, for a total of 8.87 hours of aircraft
audio. These 625 samples feature 301 unique aircraft, each of which are
supplied with 14 supplementary (non-acoustic) labels to describe the aircraft.
The dataset also contains 3.52 hours of ambient background audio ("silence"),
as a means to distinguish aircraft noise from other local environmental noises.
Additionally, 6 hours of urban soundscape recordings (with aircraft
annotations) are included as an ancillary method for evaluating model
performance, and to provide a testing ground for real-time applications.
- Abstract(参考訳): オーディオデータの収集とラベル付けに必要な時間と費用は、ドメイン固有のオーディオデータセットの入手が禁じられている要因である。
分類器の予測的特異性は、訓練されたラベルの特異性に依存するため、きめ細かいラベル付きデータセットは機械学習の進歩に不可欠である。
本稿では,機械聴取分野の進歩を促進すべく,低空飛行航空機音のデータセットであるAeroSonicDB (YPAD-0523)を導入し,音響検出・分類システムの訓練を行う。
本稿では,ADS-Bラジオ伝送を利用して音声サンプルを受動的に収集・ラベルする手法について述べる。
Collatedデータセットの要約を提供する。
3つのバイナリ分類モデルからベースライン結果を提示し、現在のデータセットの制限とその将来可能性について論じる。
データセットには18秒から60秒間の625の航空機記録が含まれており、合計8.87時間の航空機音声が記録されている。
これらの625のサンプルは301機のユニークな航空機を特徴とし、それぞれに14の補足(音響以外の)ラベルが供給されている。
データセットには3.52時間の環境背景オーディオ(サイレンス)が含まれており、航空機の騒音と他の環境騒音を区別する手段となっている。
さらに、モデル性能評価のための補助的方法として6時間の都市サウンドスケープ記録(航空機アノテーション付き)が含まれ、リアルタイムアプリケーションのための試験場を提供する。
関連論文リスト
- Towards Open-Vocabulary Audio-Visual Event Localization [59.23161248808759]
本稿では,オープン語彙音声・視覚イベントのローカライズ問題を紹介する。
この問題は、音声・視覚イベントのローカライズと、推測時に見つからないデータの両方の明確なカテゴリの予測を必要とする。
OV-AVEBenchデータセットを提案する。
論文 参考訳(メタデータ) (2024-11-18T04:35:20Z) - TartanAviation: Image, Speech, and ADS-B Trajectory Datasets for
Terminal Airspace Operations [2.738514570149472]
TartanAviationは、画像、音声、およびADS-B軌道データを同時に収集することで、空港環境の全体像を提供する。
タルタンアビエーションは合計で3.1M画像、3374時間の航空交通管制音声データ、661日のADS-B軌道データを提供している。
論文 参考訳(メタデータ) (2024-03-05T23:37:43Z) - Oceanship: A Large-Scale Dataset for Underwater Audio Target Recognition [22.890584326036976]
大規模かつ多様な水中オーディオデータセットであるOceanshipを提案する。
このデータセットは15のカテゴリで構成され、総期間は121時間であり、座標、速度、船舶タイプ、タイムスタンプといった包括的なアノテーション情報を含んでいる。
水中オーディオ検索のためのベースラインモデルであるOceannetを導入する。このモデルでは、67.11%の精度で1(R@1)、Deepshipデータセットで5(R@5)の精度で99.13%のリコールを実現している。
論文 参考訳(メタデータ) (2024-01-04T07:11:16Z) - Exploring Meta Information for Audio-based Zero-shot Bird Classification [113.17261694996051]
本研究では,メタ情報を用いてゼロショット音声分類を改善する方法について検討する。
我々は,多種多様なメタデータが利用可能であることから,鳥種を例として用いている。
論文 参考訳(メタデータ) (2023-09-15T13:50:16Z) - ARCA23K: An audio dataset for investigating open-set label noise [48.683197172795865]
本稿では、23,000以上のラベル付きFreesoundクリップからなる自動検索およびキュレートされたオーディオデータセットであるARCA23Kを紹介する。
本稿では,ARCA23Kのラベリング誤りの大部分は語彙外音声クリップによるものであり,このタイプのラベリングノイズをオープンセットラベルノイズと呼ぶ。
論文 参考訳(メタデータ) (2021-09-19T21:10:25Z) - GPLA-12: An Acoustic Signal Dataset of Gas Pipeline Leakage [9.280474191494363]
本稿では, ガスパイプラインの音響漏れデータセットAsA-12について紹介する。
外部の人工的な漏れを伴う無傷ガスパイプシステムに基づいて音響漏れ信号を収集し, 得られたデータを構造化された調整で前処理する。
データセットをさらに理解するために、影と深層学習の両方のアルゴリズムを訓練して、パフォーマンスを観察する。
論文 参考訳(メタデータ) (2021-06-19T04:37:39Z) - Discriminative Singular Spectrum Classifier with Applications on
Bioacoustic Signal Recognition [67.4171845020675]
分析や分類に有用な特徴を効率的に抽出する識別機構を備えた生体音響信号分類器を提案する。
タスク指向の現在のバイオ音響認識法とは異なり、提案モデルは入力信号をベクトル部分空間に変換することに依存する。
提案法の有効性は,アヌラン,ミツバチ,蚊の3種の生物音響データを用いて検証した。
論文 参考訳(メタデータ) (2021-03-18T11:01:21Z) - Unsupervised Domain Adaptation for Acoustic Scene Classification Using
Band-Wise Statistics Matching [69.24460241328521]
機械学習アルゴリズムは、トレーニング(ソース)とテスト(ターゲット)データの分散のミスマッチの影響を受けやすい。
本研究では,ターゲット領域音響シーンの各周波数帯域の1次及び2次サンプル統計値と,ソース領域学習データセットの1次と2次サンプル統計値との整合性を有する教師なし領域適応手法を提案する。
提案手法は,文献にみられる最先端の教師なし手法よりも,ソース・ドメインの分類精度とターゲット・ドメインの分類精度の両面で優れていることを示す。
論文 参考訳(メタデータ) (2020-04-30T23:56:05Z) - Speak2Label: Using Domain Knowledge for Creating a Large Scale Driver
Gaze Zone Estimation Dataset [55.391532084304494]
ワイルド・データセットのドライバ・ゲイズには、夕方を含む1日の異なる時間に撮影された586の録音が含まれている。
ワイルド・データセットのドライバ・ゲイズには338人の被験者がおり、年齢は18-63歳である。
論文 参考訳(メタデータ) (2020-04-13T14:47:34Z) - Machine Learning Techniques to Detect and Characterise Whistler Radio
Waves [0.0]
VLFアンテナ受信機は、稲妻ストロークによって発生するウィスラー波を検出するために使用できる。
ホイッスルの識別と特徴化は、プラズマ圏をリアルタイムで監視する上で重要なタスクである。
本研究の目的は、VLF受信機が提供するデータ中のwhirsを自動的に検出できる機械学習ベースのモデルを開発することである。
論文 参考訳(メタデータ) (2020-02-04T12:05:44Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。