論文の概要: Underwater Acoustic Target Recognition based on Smoothness-inducing
Regularization and Spectrogram-based Data Augmentation
- arxiv url: http://arxiv.org/abs/2306.06945v2
- Date: Tue, 20 Feb 2024 02:00:05 GMT
- ステータス: 処理完了
- システム内更新日: 2024-02-21 21:16:54.787483
- Title: Underwater Acoustic Target Recognition based on Smoothness-inducing
Regularization and Spectrogram-based Data Augmentation
- Title(参考訳): 滑らかさ誘導正規化とスペクトログラムデータ拡張に基づく水中音響目標認識
- Authors: Ji Xu, Yuan Xie, Wenchao Wang
- Abstract要約: 不十分なデータは、複雑なモデリングをサポートする認識システムの能力を阻害する可能性がある。
限られたデータの場合,モデルの一般化能力を高めるための2つの戦略を提案する。
- 参考スコア(独自算出の注目度): 23.970145485610043
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Underwater acoustic target recognition is a challenging task owing to the
intricate underwater environments and limited data availability. Insufficient
data can hinder the ability of recognition systems to support complex modeling,
thus impeding their advancement. To improve the generalization capacity of
recognition models, techniques such as data augmentation have been employed to
simulate underwater signals and diversify data distribution. However, the
complexity of underwater environments can cause the simulated signals to
deviate from real scenarios, resulting in biased models that are misguided by
non-true data. In this study, we propose two strategies to enhance the
generalization ability of models in the case of limited data while avoiding the
risk of performance degradation. First, as an alternative to traditional data
augmentation, we utilize smoothness-inducing regularization, which only
incorporates simulated signals in the regularization term. Additionally, we
propose a specialized spectrogram-based data augmentation strategy, namely
local masking and replicating (LMR), to capture inter-class relationships. Our
experiments and visualization analysis demonstrate the superiority of our
proposed strategies.
- Abstract(参考訳): 水中音響目標認識は、複雑な水中環境と限られたデータ可用性のために難しい課題である。
データの不足は、複雑なモデリングをサポートする認識システムの能力を妨げる可能性があるため、その進歩を妨げる。
認識モデルの一般化能力を向上させるため,水中信号のシミュレーションやデータ分散の多様化にデータ拡張などの手法が用いられている。
しかし、水中環境の複雑さは、シミュレーションされた信号が実際のシナリオから逸脱し、非真のデータによって誤認されるバイアスのあるモデルをもたらす可能性がある。
本研究では,性能低下のリスクを回避しつつ,限定データの場合のモデルの一般化能力を高めるための2つの戦略を提案する。
まず、従来のデータ拡張の代替として、正規化項にシミュレートされた信号のみを組み込むスムーズネス誘導正規化を利用する。
さらに,クラス間関係を捉えるために,spectrogramベースのデータ拡張戦略であるlocal masking and replicating (lmr)を提案する。
提案手法の優位性を示す実験と可視化分析を行った。
関連論文リスト
- DEMONet: Underwater Acoustic Target Recognition based on Multi-Expert Network and Cross-Temporal Variational Autoencoder [22.271499386492533]
複雑な水中環境のため、実世界のシナリオで堅牢な水中音響認識システムを構築することは困難である。
ノイズの封筒変調(DEMON)を検出することで,ターゲットのシャフト周波数やブレード数に対するロバストな洞察を提供するDEMONetを提案する。
DEMON特徴量におけるノイズとスプリアス変調スペクトルを緩和するために、時間的アライメント戦略を導入し、ノイズ耐性のDEMONスペクトルを再構成して生のDEMON特徴量を置き換えるために可変オートエンコーダ(VAE)を用いる。
論文 参考訳(メタデータ) (2024-11-05T03:04:51Z) - NUMOSIM: A Synthetic Mobility Dataset with Anomaly Detection Benchmarks [5.852777557137612]
本稿では,自動ベンチマーク手法の制御,倫理的,多様な環境を提供する合成モビリティデータセットNUMOSIMを紹介する。
NUMOSIMは様々な現実的なモビリティシナリオをシミュレートし、典型的な動作と異常な動作の両方を包含する。
NUMOSIMデータセットへのオープンアクセスと、包括的なドキュメント、評価指標、ベンチマーク結果を提供する。
論文 参考訳(メタデータ) (2024-09-04T18:31:24Z) - Enabling Smart Retrofitting and Performance Anomaly Detection for a
Sensorized Vessel: A Maritime Industry Experience [0.21485350418225244]
本研究では,解釈可能な機械学習モデルを用いたディープラーニング駆動型異常検出システムを提案する。
我々は,LSTM(Long Short-Term Memory)オートエンコーダを用いた,ループ内非教師なしのプロセスを活用する。
TUCANAから取得した実データを用いて実験によりシステム評価を行い,その過程で得られたLSTMモデルを用いて80%以上の精度と90%のリコールを達成した。
論文 参考訳(メタデータ) (2023-12-30T01:31:54Z) - Advancing underwater acoustic target recognition via adaptive data
pruning and smoothness-inducing regularization [27.039672355700198]
本稿では,クロスエントロピーに基づくトレーニングデータにおいて,過度に類似したセグメントを創り出す戦略を提案する。
我々はノイズの多いサンプルを生成し、KLの発散に基づくスムーズネス誘導正則化を適用し、オーバーフィッティングを緩和する。
論文 参考訳(メタデータ) (2023-04-24T08:30:41Z) - On-the-fly Denoising for Data Augmentation in Natural Language
Understanding [101.46848743193358]
よりクリーンなオリジナルデータに基づいて訓練された有機教師モデルによって提供されるソフトな拡張ラベルから学習する,データ拡張のためのオンザフライデノケーション手法を提案する。
本手法は,一般的な拡張手法に適用でき,テキスト分類と質問応答の両タスクの性能を一貫して向上させることができる。
論文 参考訳(メタデータ) (2022-12-20T18:58:33Z) - One-Shot Domain Adaptive and Generalizable Semantic Segmentation with
Class-Aware Cross-Domain Transformers [96.51828911883456]
セマンティックセグメンテーションのための教師なしのsim-to-realドメイン適応(UDA)は、シミュレーションデータに基づいて訓練されたモデルの実世界のテスト性能を改善することを目的としている。
従来のUDAは、適応のためのトレーニング中に利用可能なラベルのない実世界のサンプルが豊富にあると仮定することが多い。
実世界のデータサンプルが1つしか利用できない,一発の教師なしシム・トゥ・リアル・ドメイン適応(OSUDA)と一般化問題について検討する。
論文 参考訳(メタデータ) (2022-12-14T15:54:15Z) - CAFE: Learning to Condense Dataset by Aligning Features [72.99394941348757]
本稿ではCAFE(Aligning features)によるCondenseデータセットの新しいスキームを提案する。
このアプローチの核心は、さまざまなスケールにわたる実データと合成データから機能を整合させる効果的な戦略です。
提案したCAFEを様々なデータセットで検証し,概ね最先端技術であることを示す。
論文 参考訳(メタデータ) (2022-03-03T05:58:49Z) - Deceive D: Adaptive Pseudo Augmentation for GAN Training with Limited
Data [125.7135706352493]
GAN(Generative Adversarial Network)は、高忠実度画像を合成するために、訓練に十分なデータを必要とする。
近年の研究では、差別者の過度な適合により、限られたデータでGANを訓練することは困難であることが示されている。
本稿では,APA (Adaptive Pseudo Augmentation) と呼ばれる新しい手法を提案する。
論文 参考訳(メタデータ) (2021-11-12T18:13:45Z) - Improved Speech Emotion Recognition using Transfer Learning and
Spectrogram Augmentation [56.264157127549446]
音声感情認識(SER)は、人間とコンピュータの相互作用において重要な役割を果たす課題である。
SERの主な課題の1つは、データの不足である。
本稿では,スペクトログラム拡張と併用した移動学習戦略を提案する。
論文 参考訳(メタデータ) (2021-08-05T10:39:39Z) - The Imaginative Generative Adversarial Network: Automatic Data
Augmentation for Dynamic Skeleton-Based Hand Gesture and Human Action
Recognition [27.795763107984286]
本稿では、入力データの分布を近似し、この分布から新しいデータをサンプリングする新しい自動データ拡張モデルを提案する。
以上の結果から,拡張戦略は訓練が高速であり,ニューラルネットワークと最先端手法の両方の分類精度を向上させることが可能であることが示唆された。
論文 参考訳(メタデータ) (2021-05-27T11:07:09Z) - Negative Data Augmentation [127.28042046152954]
負のデータ拡張サンプルは、データ分散のサポートに関する情報を提供することを示す。
我々は、NDAを識別器の合成データの追加源として利用する新しいGAN訓練目標を提案する。
実験により,本手法で訓練したモデルでは,異常検出能力の向上とともに条件付き・条件付き画像生成の改善を実現している。
論文 参考訳(メタデータ) (2021-02-09T20:28:35Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。