論文の概要: Cross-domain Sound Recognition for Efficient Underwater Data Analysis
- arxiv url: http://arxiv.org/abs/2309.03451v1
- Date: Thu, 7 Sep 2023 02:26:32 GMT
- ステータス: 処理完了
- システム内更新日: 2023-09-08 14:29:31.184230
- Title: Cross-domain Sound Recognition for Efficient Underwater Data Analysis
- Title(参考訳): 効率的な水中データ解析のためのクロスドメイン音声認識
- Authors: Jeongsoo Park, Dong-Gyun Han, Hyoung Sul La, Sangmin Lee, Yoonchang
Han, and Eun-Jin Yang
- Abstract要約: 本研究では, 水中音の広帯域学習モデルを用いて, 水中音響データを解析するための新しい深層学習手法を提案する。
我々は,PCA と UMAP の可視化を用いて2次元空間にデータをクラスタ化し,これらのクラスタ内の点を聴き,それらの定義特性を理解する。
第2部では、選択した水中データと非水中データセットの両方を用いてニューラルネットワークモデルを訓練する。
- 参考スコア(独自算出の注目度): 4.373836150479923
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: This paper presents a novel deep learning approach for analyzing massive
underwater acoustic data by leveraging a model trained on a broad spectrum of
non-underwater (aerial) sounds. Recognizing the challenge in labeling vast
amounts of underwater data, we propose a two-fold methodology to accelerate
this labor-intensive procedure.
The first part of our approach involves PCA and UMAP visualization of the
underwater data using the feature vectors of an aerial sound recognition model.
This enables us to cluster the data in a two dimensional space and listen to
points within these clusters to understand their defining characteristics. This
innovative method simplifies the process of selecting candidate labels for
further training.
In the second part, we train a neural network model using both the selected
underwater data and the non-underwater dataset. We conducted a quantitative
analysis to measure the precision, recall, and F1 score of our model for
recognizing airgun sounds, a common type of underwater sound. The F1 score
achieved by our model exceeded 84.3%, demonstrating the effectiveness of our
approach in analyzing underwater acoustic data.
The methodology presented in this paper holds significant potential to reduce
the amount of labor required in underwater data analysis and opens up new
possibilities for further research in the field of cross-domain data analysis.
- Abstract(参考訳): 本稿では,広範囲の非水中音(aerial)を訓練したモデルを用いて,大規模水中音響データの解析を行うための新しい深層学習手法を提案する。
大量の水中データをラベル付けすることの課題を認識し、この労働集約的な手順を加速するための2つの方法論を提案する。
我々のアプローチの第一部は、空中音響認識モデルの特徴ベクトルを用いた水中データのpcaおよびumap可視化である。
これにより、データを2次元空間にクラスタリングし、これらのクラスタ内のポイントを聴き、その特徴を理解することができます。
この革新的な方法は、さらなるトレーニングのために候補ラベルを選択するプロセスを単純化する。
第2部では,選択した水中データと非水中データセットの両方を用いてニューラルネットワークモデルをトレーニングする。
一般的な水中音であるエアガン音の認識のためのモデルの精度, リコール, F1 スコアを測定するために, 定量的解析を行った。
モデルによるF1スコアは84.3%を超え, 水中音響データ解析におけるアプローチの有効性を示した。
本稿では,水中データ解析に要する作業量を削減するための重要な可能性を示し,クロスドメインデータ解析の分野における新たな可能性を開く。
関連論文リスト
- Underwater Object Detection in the Era of Artificial Intelligence: Current, Challenge, and Future [119.88454942558485]
水中物体検出(UOD)は、水中の画像やビデオ中の物体を識別し、ローカライズすることを目的としている。
近年、人工知能(AI)に基づく手法、特に深層学習法は、UODにおいて有望な性能を示している。
論文 参考訳(メタデータ) (2024-10-08T00:25:33Z) - Learning from the Giants: A Practical Approach to Underwater Depth and Surface Normals Estimation [3.0516727053033392]
本稿では,単眼深度と表面正規化推定(MDSNE)のための新しいディープラーニングモデルを提案する。
これは特に、CNNとTransformerを統合するハイブリッドアーキテクチャを使用して、水中環境向けに調整されている。
我々のモデルはパラメータを90%削減し、トレーニングコストを80%削減し、リソース制約されたデバイス上でリアルタイムな3D認識を可能にする。
論文 参考訳(メタデータ) (2024-10-02T22:41:12Z) - Learning with Noisy Foundation Models [95.50968225050012]
本論文は、事前学習データセットにおけるノイズの性質を包括的に理解し分析する最初の研究である。
雑音の悪影響を緩和し、一般化を改善するため、特徴空間に適応するチューニング法(NMTune)を提案する。
論文 参考訳(メタデータ) (2024-03-11T16:22:41Z) - Histogram Layer Time Delay Neural Networks for Passive Sonar
Classification [58.720142291102135]
時間遅延ニューラルネットワークとヒストグラム層を組み合わせた新しい手法により,特徴学習の改善と水中音響目標分類を実現する。
提案手法はベースラインモデルより優れており,受動的ソナー目標認識のための統計的文脈を取り入れた有効性を示す。
論文 参考訳(メタデータ) (2023-07-25T19:47:26Z) - Learning Visual Representation of Underwater Acoustic Imagery Using
Transformer-Based Style Transfer Method [4.885034271315195]
本論文は水中音響画像の視覚的表現を学習するための枠組みを提案する。
これは、光学画像の低レベルのテクスチャ特徴を水中音響画像の視覚的特徴に置き換える可能性がある。
提案するフレームワークは、擬似音響画像データセットを生成するために、リッチな光学画像データセットを完全に利用できる。
論文 参考訳(メタデータ) (2022-11-10T07:54:46Z) - Learning-based estimation of in-situ wind speed from underwater
acoustics [58.293528982012255]
水中音響から風速時系列を検索するための深層学習手法を提案する。
我々のアプローチは、事前の物理知識と計算効率の両面から恩恵を受けるために、データ同化と学習ベースのフレームワークをブリッジする。
論文 参考訳(メタデータ) (2022-08-18T15:27:40Z) - Fast accuracy estimation of deep learning based multi-class musical
source separation [79.10962538141445]
本稿では,ニューラルネットワークのトレーニングやチューニングを行うことなく,任意のデータセットにおける楽器の分離性を評価する手法を提案する。
理想的な比マスクを持つオラクルの原理に基づいて、我々の手法は最先端のディープラーニング手法の分離性能を推定するための優れたプロキシである。
論文 参考訳(メタデータ) (2020-10-19T13:05:08Z) - Deep Learning based Segmentation of Fish in Noisy Forward Looking MBES
Images [1.5469452301122177]
セマンティックセグメンテーションのためのディープラーニング(DL)と畳み込みニューラルネットワーク(CNN)の最近の進歩に基づいて構築する。
画像ソナーによって投影される全ての射程方位位置に対する魚・魚・魚の確率予測のためのエンドツーエンドのアプローチを実証する。
我々は,本モデルが所望のパフォーマンスを証明し,意味的文脈の重要性を活用することを学習したことを示す。
論文 参考訳(メタデータ) (2020-06-16T09:57:38Z) - Attention-based Neural Bag-of-Features Learning for Sequence Data [143.62294358378128]
2D-Attention (2DA) は、シーケンスデータの一般的なアテンション定式化である。
提案したアテンションモジュールは、最近提案されたNeural Bag of Feature(NBoF)モデルに組み込まれ、学習能力を高める。
実験により,提案手法はNBoFモデルの性能を向上させるだけでなく,ノイズに耐性を持つことを示す。
論文 参考訳(メタデータ) (2020-05-25T17:51:54Z) - Utilizing Mask R-CNN for Waterline Detection in Canoe Sprint Video
Analysis [5.735035463793008]
本稿では,自動水線検出手法を提案する。
セグメントの輪郭から水線を推定する多段階的手法を開発した。
我々は,いくつかの専門家を対象に,地下水の真理を推定する調査を行った。
論文 参考訳(メタデータ) (2020-04-20T19:00:45Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。