論文の概要: Oceanship: A Large-Scale Dataset for Underwater Audio Target Recognition
- arxiv url: http://arxiv.org/abs/2401.02099v3
- Date: Tue, 11 Jun 2024 02:33:56 GMT
- ステータス: 処理完了
- システム内更新日: 2024-06-13 00:39:03.541724
- Title: Oceanship: A Large-Scale Dataset for Underwater Audio Target Recognition
- Title(参考訳): Oceanship: 水中オーディオターゲット認識のための大規模データセット
- Authors: Zeyu Li, Suncheng Xiang, Tong Yu, Jingsheng Gao, Jiacheng Ruan, Yanping Hu, Ting Liu, Yuzhuo Fu,
- Abstract要約: 大規模かつ多様な水中オーディオデータセットであるOceanshipを提案する。
このデータセットは15のカテゴリで構成され、総期間は121時間であり、座標、速度、船舶タイプ、タイムスタンプといった包括的なアノテーション情報を含んでいる。
水中オーディオ検索のためのベースラインモデルであるOceannetを導入する。このモデルでは、67.11%の精度で1(R@1)、Deepshipデータセットで5(R@5)の精度で99.13%のリコールを実現している。
- 参考スコア(独自算出の注目度): 22.890584326036976
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: The recognition of underwater audio plays a significant role in identifying a vessel while it is in motion. Underwater target recognition tasks have a wide range of applications in areas such as marine environmental protection, detection of ship radiated noise, underwater noise control, and coastal vessel dispatch. The traditional UATR task involves training a network to extract features from audio data and predict the vessel type. The current UATR dataset exhibits shortcomings in both duration and sample quantity. In this paper, we propose Oceanship, a large-scale and diverse underwater audio dataset. This dataset comprises 15 categories, spans a total duration of 121 hours, and includes comprehensive annotation information such as coordinates, velocity, vessel types, and timestamps. We compiled the dataset by crawling and organizing original communication data from the Ocean Communication Network (ONC) database between 2021 and 2022. While audio retrieval tasks are well-established in general audio classification, they have not been explored in the context of underwater audio recognition. Leveraging the Oceanship dataset, we introduce a baseline model named Oceannet for underwater audio retrieval. This model achieves a recall at 1 (R@1) accuracy of 67.11% and a recall at 5 (R@5) accuracy of 99.13% on the Deepship dataset.
- Abstract(参考訳): 水中オーディオの認識は、船が動いている間を識別する上で重要な役割を担っている。
水中目標認識タスクは、海洋環境保護、船舶放射音の検出、水中騒音の制御、沿岸船舶の派遣など、幅広い用途に応用されている。
従来のUATRタスクでは、オーディオデータから特徴を抽出し、船舶のタイプを予測するためにネットワークをトレーニングする。
現在のUATRデータセットは、持続時間とサンプル量の両方の欠点を示す。
本論文では,大規模かつ多様な水中オーディオデータセットであるOceanshipを提案する。
このデータセットは15のカテゴリで構成され、総期間は121時間であり、座標、速度、船舶タイプ、タイムスタンプといった包括的なアノテーション情報を含んでいる。
我々は2021年から2022年にかけて,Ocean Communication Network(ONC)データベースからオリジナルの通信データをクロールして整理してデータセットをコンパイルした。
音声検索タスクは一般的な音声分類では確立されているが,水中音声認識の文脈では検討されていない。
Oceanshipデータセットを活用することで、水中オーディオ検索のためのOceannetというベースラインモデルを導入する。
このモデルは1(R@1)の精度67.11%、リコール精度5(R@5)の精度99.13%をDeepshipデータセットで達成している。
関連論文リスト
- Real Acoustic Fields: An Audio-Visual Room Acoustics Dataset and Benchmark [65.79402756995084]
Real Acoustic Fields (RAF)は、複数のモードから実際の音響室データをキャプチャする新しいデータセットである。
RAFは密集した室内音響データを提供する最初のデータセットである。
論文 参考訳(メタデータ) (2024-03-27T17:59:56Z) - WhaleNet: a Novel Deep Learning Architecture for Marine Mammals Vocalizations on Watkins Marine Mammal Sound Database [49.1574468325115]
textbfWhaleNet (Wavelet Highly Adaptive Learning Ensemble Network) は海洋哺乳動物の発声を分類するための高度な深層アンサンブルアーキテクチャである。
既存のアーキテクチャよりも8-10%の精度で分類精度を向上し、分類精度は9,7.61%である。
論文 参考訳(メタデータ) (2024-02-20T11:36:23Z) - Leveraging Citizen Science for Flood Extent Detection using Machine
Learning Benchmark Dataset [0.9029386959445269]
我々は、アメリカ本土とバングラデシュ内の約36,000平方キロメートルの地域をカバーする、既知の洪水イベントの間に、ラベル付きの水域範囲と浸水地域の範囲を作成します。
また、データセットをオープンソース化し、データセットに基づいたオープンコンペティションを開催して、コミュニティ生成モデルを使用した洪水範囲検出を迅速にプロトタイプ化しました。
データセットはSentinel-1C SARデータに基づく既存のデータセットに追加され、より堅牢な洪水範囲のモデリングにつながります。
論文 参考訳(メタデータ) (2023-11-15T18:49:29Z) - The AeroSonicDB (YPAD-0523) Dataset for Acoustic Detection and
Classification of Aircraft [0.0]
本稿では,音響検出・分類システムの訓練を目的とした低空飛行航空機音のデータセットであるAeroSonicDB(YPAD-0523)を紹介する。
本稿では,ADS-Bラジオ伝送を利用して音声サンプルを受動的に収集・ラベルする手法について述べる。
データセットには18秒から60秒間の625の航空機記録が含まれており、合計8.87時間の航空機音声が記録されている。
論文 参考訳(メタデータ) (2023-11-10T19:41:10Z) - Histogram Layer Time Delay Neural Networks for Passive Sonar
Classification [58.720142291102135]
時間遅延ニューラルネットワークとヒストグラム層を組み合わせた新しい手法により,特徴学習の改善と水中音響目標分類を実現する。
提案手法はベースラインモデルより優れており,受動的ソナー目標認識のための統計的文脈を取り入れた有効性を示す。
論文 参考訳(メタデータ) (2023-07-25T19:47:26Z) - Navya3DSeg -- Navya 3D Semantic Segmentation Dataset & split generation
for autonomous vehicles [63.20765930558542]
3Dセマンティックデータは、障害物検出やエゴ-車両の局所化といった中核的な認識タスクに有用である。
そこで我々は,大規模生産段階の運用領域に対応する多様なラベル空間を持つ新しいデータセットであるNavala 3D(Navya3DSeg)を提案する。
ラベルのない23のラベル付きシーケンスと25の補足シーケンスが含まれており、ポイントクラウド上の自己教師付きおよび半教師付きセマンティックセマンティックセグメンテーションベンチマークを探索するために設計された。
論文 参考訳(メタデータ) (2023-02-16T13:41:19Z) - A Dataset with Multibeam Forward-Looking Sonar for Underwater Object
Detection [0.0]
マルチビーム前方ソナー (MFLS) は水中検出において重要な役割を担っている。
MFLSを用いた水中物体検出の研究にはいくつかの課題がある。
本稿では,Tritech Gemini 1200ikソナーを用いて,9000枚以上のMFLS画像からなる新しいデータセットを提案する。
論文 参考訳(メタデータ) (2022-12-01T08:26:03Z) - Learning-based estimation of in-situ wind speed from underwater
acoustics [58.293528982012255]
水中音響から風速時系列を検索するための深層学習手法を提案する。
我々のアプローチは、事前の物理知識と計算効率の両面から恩恵を受けるために、データ同化と学習ベースのフレームワークをブリッジする。
論文 参考訳(メタデータ) (2022-08-18T15:27:40Z) - Deep Learning for Surface Wave Identification in Distributed Acoustic
Sensing Data [1.7237878022600697]
実データ,複雑なDASデータを処理するための,高度にスケーラブルで効率的なアプローチを提案する。
深い教師付き学習は、人類活動によって生じる「有用な」コヒーレントな表面波を特定するために用いられる。
本手法は,地中活動と埋設センサとの相互作用を記述した解釈パターンを提供する。
論文 参考訳(メタデータ) (2020-10-15T15:53:03Z) - Real-Time target detection in maritime scenarios based on YOLOv3 model [65.35132992156942]
ウェブスクレイピングによって収集された56k以上の海洋船舶の画像からなる、新しい船舶データセットが提案されている。
Keras APIをベースとしたYOLOv3シングルステージ検出器がこのデータセット上に構築されている。
論文 参考訳(メタデータ) (2020-02-10T15:25:19Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。