論文の概要: Improving Underwater Acoustic Classification Through Learnable Gabor Filter Convolution and Attention Mechanisms
- arxiv url: http://arxiv.org/abs/2512.14714v1
- Date: Tue, 09 Dec 2025 02:39:47 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-12-18 17:06:26.682313
- Title: Improving Underwater Acoustic Classification Through Learnable Gabor Filter Convolution and Attention Mechanisms
- Title(参考訳): 学習可能なガボールフィルタの畳み込みと注意機構による水中音響分類の改善
- Authors: Lucas Cesar Ferreira Domingos, Russell Brinkworth, Paulo Eduardo Santos, Karl Sammut,
- Abstract要約: 本稿では,学習可能なGabor畳み込み層とResNeXtのバックボーンを統合したディープラーニングアーキテクチャであるGSE ResNeXtを紹介する。
モデルは複雑さを増大させる3つの分類課題に基づいて評価される。
その結果、GSE ResNeXtはXception、ResNet、MobileNetV2といったベースラインモデルより一貫して優れています。
- 参考スコア(独自算出の注目度): 1.1024591739346294
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Remotely detecting and classifying underwater acoustic targets is critical for environmental monitoring and defence. However, the complex nature of ship-radiated and environmental underwater noise poses significant challenges to accurate signal processing. While recent advancements in machine learning have improved classification accuracy, issues such as limited dataset availability and a lack of standardised experimentation hinder generalisation and robustness. This paper introduces GSE ResNeXt, a deep learning architecture integrating learnable Gabor convolutional layers with a ResNeXt backbone enhanced by squeeze-and-excitation attention mechanisms. The Gabor filters serve as two-dimensional adaptive band-pass filters, extending the feature channel representation. Its combination with channel attention improves training stability and convergence while enhancing the model's ability to extract discriminative features. The model is evaluated on three classification tasks of increasing complexity. In particular, the impact of temporal differences between the training and testing data is explored, revealing that the distance between the vessel and sensor significantly affects performance. Results show that, GSE ResNeXt consistently outperforms baseline models like Xception, ResNet, and MobileNetV2, in terms of classification performance. Regarding stability and convergence, the addition of Gabor convolutions in the initial layers of the model represents a 28% reduction in training time. These results emphasise the importance of signal processing strategies in improving the reliability and generalisation of models under different environmental conditions, especially in data-limited underwater acoustic classification scenarios. Future developments should focus on mitigating the impact of environmental factors on input signals.
- Abstract(参考訳): 水中音響目標のリモート検出と分類は、環境モニタリングと防衛にとって重要である。
しかし、船舶に照射された環境水中ノイズの複雑な性質は、正確な信号処理に重大な課題をもたらす。
機械学習の最近の進歩は、分類精度を改善したが、データセットの可用性の制限や標準化された実験の欠如といった問題は、一般化と堅牢性を妨げている。
本稿では,学習可能なGabor畳み込み層とResNeXtのバックボーンを統合した深層学習アーキテクチャであるGSE ResNeXtを紹介する。
Gaborフィルタは2次元適応帯域通過フィルタとして機能し、特徴チャネル表現を拡張する。
チャネルアテンションと組み合わせることで、モデルの識別的特徴を抽出する能力を高めながら、トレーニングの安定性と収束を改善します。
モデルは複雑さを増大させる3つの分類課題に基づいて評価される。
特に, 訓練データと試験データとの時間差の影響を調べた結果, 容器とセンサ間の距離が性能に大きく影響していることが判明した。
その結果、GSE ResNeXtは、Xception、ResNet、MobileNetV2といったベースラインモデルよりも、分類性能において一貫して優れています。
安定性と収束性については,モデルの初期層におけるGabor畳み込みの追加は,トレーニング時間の28%削減を意味する。
これらの結果は、特にデータ限定水中音響分類シナリオにおいて、異なる環境条件下でのモデルの信頼性と一般化を改善するための信号処理戦略の重要性を強調した。
今後の発展は、入力信号に対する環境要因の影響を緩和することに集中すべきである。
関連論文リスト
- Continual Action Quality Assessment via Adaptive Manifold-Aligned Graph Regularization [53.82400605816587]
アクション品質アセスメント(AQA)は、ビデオにおける人間の行動を定量化し、スポーツスコアリング、リハビリテーション、スキル評価の応用を支援する。
大きな課題は、現実世界のシナリオにおける品質分布の非定常的な性質にある。
本稿では,進化する分布を扱うための連続学習機能を備えた連続AQA(Continuous AQA)を紹介する。
論文 参考訳(メタデータ) (2025-10-08T10:09:47Z) - Ecologically Valid Benchmarking and Adaptive Attention: Scalable Marine Bioacoustic Monitoring [2.558238597112103]
GetNetUPAMは、現実的な可変性の下で安定性をモデル化するためのネストされたクロスバリデーションフレームワークである。
データは異なるサイト年区分に分割され、記録を保存し、各バリデーションフォールドがユニークな環境サブセットを反映することを保証する。
ARPA-Nは、DenseNetベースラインに対する平均精度が14.4%向上し、すべてのメトリクスで対数2スケールのオーダー・オブ・マグニチュードが減少する。
論文 参考訳(メタデータ) (2025-09-04T22:03:05Z) - AquaSignal: An Integrated Framework for Robust Underwater Acoustic Analysis [0.0]
AquaSignalは、水中音響信号の事前処理、復調、分類、新規検出のためのモジュール式でスケーラブルなパイプラインである。
システムは、DeepshipとOcean Networks Canada (ONC)ベンチマークの合計データセットで評価される。
論文 参考訳(メタデータ) (2025-05-20T12:35:43Z) - Identifying Trustworthiness Challenges in Deep Learning Models for Continental-Scale Water Quality Prediction [69.38041171537573]
水質は環境の持続可能性、生態系の回復力、公衆衛生に基礎を置いている。
ディープラーニングは、大規模な水質予測と科学的洞察生成のための変革的なポテンシャルを提供する。
汚染緩和や資源配分等、高額な運用上の意思決定に広く採用されていることは、未解決の信頼性の課題によって防止されている。
論文 参考訳(メタデータ) (2025-03-13T01:50:50Z) - A Hybrid Framework for Statistical Feature Selection and Image-Based Noise-Defect Detection [55.2480439325792]
本稿では,統計的特徴選択と分類技術を統合し,欠陥検出精度を向上させるハイブリッドフレームワークを提案する。
工業画像から抽出した55個の特徴を統計的手法を用いて解析した。
これらの手法をフレキシブルな機械学習アプリケーションに統合することにより、検出精度を改善し、偽陽性や誤分類を減らす。
論文 参考訳(メタデータ) (2024-12-11T22:12:21Z) - Evaluating ML Robustness in GNSS Interference Classification, Characterization & Localization [42.14439854721613]
ジャミング装置はグローバルナビゲーション衛星システム(GNSS)からの信号を妨害する
本稿では、低周波アンテナから得られたスナップショットからなる広範囲なデータセットを提案する。
本研究の目的は,機械学習モデル(ML)の環境変化に対するレジリエンスを評価することである。
論文 参考訳(メタデータ) (2024-09-23T15:20:33Z) - Unleashing the Power of Graph Data Augmentation on Covariate
Distribution Shift [50.98086766507025]
本稿では,AIA(Adversarial Invariant Augmentation)という,シンプルで効率の良いデータ拡張戦略を提案する。
AIAは、拡張プロセス中に元の安定した特徴を同時に保存しながら、新しい環境をエクスポーレーションし、生成することを目的としている。
論文 参考訳(メタデータ) (2022-11-05T07:55:55Z) - DeepAdversaries: Examining the Robustness of Deep Learning Models for
Galaxy Morphology Classification [47.38422424155742]
銀河の形態分類では、画像データにおける摂動の影響について検討する。
ドメイン適応によるトレーニングはモデルロバスト性を向上し、これらの摂動の影響を緩和することを示す。
論文 参考訳(メタデータ) (2021-12-28T21:29:02Z) - Learnable Multi-level Frequency Decomposition and Hierarchical Attention
Mechanism for Generalized Face Presentation Attack Detection [7.324459578044212]
顔提示攻撃検知(PAD)は多くの注目を集めており、顔認識システムを保護する上で重要な役割を果たしている。
両ストリーム畳み込みニューラルネットワーク(CNN)フレームワークを提案する。
ステップワイドアブレーション研究において提案したPAD法の設計を実証した。
論文 参考訳(メタデータ) (2021-09-16T13:06:43Z) - Bridging the Gap Between Clean Data Training and Real-World Inference
for Spoken Language Understanding [76.89426311082927]
既存のモデルはクリーンデータに基づいてトレーニングされ、クリーンデータトレーニングと現実世界の推論の間にtextitgapが発生する。
本稿では,良質なサンプルと低品質のサンプルの両方が類似ベクトル空間に埋め込まれた領域適応法を提案する。
広く使用されているデータセット、スニップス、および大規模な社内データセット(1000万のトレーニング例)に関する実験では、この方法は実世界の(騒々しい)コーパスのベースラインモデルを上回るだけでなく、堅牢性、すなわち、騒々しい環境下で高品質の結果を生み出すことを実証しています。
論文 参考訳(メタデータ) (2021-04-13T17:54:33Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。