論文の概要: Investigation of Time-Frequency Feature Combinations with Histogram Layer Time Delay Neural Networks
- arxiv url: http://arxiv.org/abs/2409.13881v1
- Date: Fri, 20 Sep 2024 20:22:24 GMT
- ステータス: 処理完了
- システム内更新日: 2024-11-07 04:50:50.817325
- Title: Investigation of Time-Frequency Feature Combinations with Histogram Layer Time Delay Neural Networks
- Title(参考訳): ヒストグラム層時間遅延ニューラルネットワークを用いた時間周波数特性の検討
- Authors: Amirmohammad Mohammadi, Iren'e Masabarakiza, Ethan Barnes, Davelle Carreiro, Alexandra Van Dine, Joshua Peeples,
- Abstract要約: 音声信号を時間周波数表現に変換する手法は、性能に大きな影響を及ぼす。
この研究は、ヒストグラム層時間遅延ニューラルネットワークにおいて、異なる時間周波数特徴の組み合わせを使用することによる性能への影響を示す。
- 参考スコア(独自算出の注目度): 37.95478822883338
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: While deep learning has reduced the prevalence of manual feature extraction, transformation of data via feature engineering remains essential for improving model performance, particularly for underwater acoustic signals. The methods by which audio signals are converted into time-frequency representations and the subsequent handling of these spectrograms can significantly impact performance. This work demonstrates the performance impact of using different combinations of time-frequency features in a histogram layer time delay neural network. An optimal set of features is identified with results indicating that specific feature combinations outperform single data features.
- Abstract(参考訳): 深層学習は手動による特徴抽出の頻度を減少させているが、特に水中音響信号のモデル性能向上には、特徴工学によるデータの変換が不可欠である。
音声信号が時間周波数表現に変換され、これらのスペクトルのその後の処理が性能に大きな影響を及ぼす。
この研究は、ヒストグラム層時間遅延ニューラルネットワークにおいて、異なる時間周波数特徴の組み合わせを使用することによる性能への影響を示す。
最適な特徴セットは、特定の特徴の組み合わせが単一データ特徴より優れていることを示す結果と同一視される。
関連論文リスト
- Frequency-Aware Deepfake Detection: Improving Generalizability through
Frequency Space Learning [81.98675881423131]
この研究は、目に見えないディープフェイク画像を効果的に識別できるユニバーサルディープフェイク検出器を開発するという課題に対処する。
既存の周波数ベースのパラダイムは、偽造検出のためにGANパイプラインのアップサンプリング中に導入された周波数レベルのアーティファクトに依存している。
本稿では、周波数領域学習を中心にしたFreqNetと呼ばれる新しい周波数認識手法を導入し、ディープフェイク検出器の一般化性を高めることを目的とする。
論文 参考訳(メタデータ) (2024-03-12T01:28:00Z) - Time Scale Network: A Shallow Neural Network For Time Series Data [18.46091267922322]
時系列データは、しばしば複数の時間スケールで情報で構成されている。
この情報を捉えるためのディープラーニング戦略は存在するが、ネットワークを大きくし、より多くのデータを必要とし、計算を要求されやすく、解釈が難しいものが多い。
本稿では,離散ウェーブレット変換における翻訳と拡張シーケンスと,従来の畳み込みニューラルネットワークとバックプロパゲーションを組み合わせた,最小かつ計算効率のタイムスケールネットワークを提案する。
論文 参考訳(メタデータ) (2023-11-10T16:39:55Z) - A Distance Correlation-Based Approach to Characterize the Effectiveness of Recurrent Neural Networks for Time Series Forecasting [1.9950682531209158]
距離相関の多元的指標を用いて,RNN成分と時系列特性をリンクする手法を提案する。
RNN活性化層が時系列のラグ構造をよく学習していることを実証的に示す。
また,アクティベーション層は移動平均およびヘテロスケダティック時系列過程を適切にモデル化できないことを示す。
論文 参考訳(メタデータ) (2023-07-28T22:32:08Z) - Histogram Layer Time Delay Neural Networks for Passive Sonar
Classification [58.720142291102135]
時間遅延ニューラルネットワークとヒストグラム層を組み合わせた新しい手法により,特徴学習の改善と水中音響目標分類を実現する。
提案手法はベースラインモデルより優れており,受動的ソナー目標認識のための統計的文脈を取り入れた有効性を示す。
論文 参考訳(メタデータ) (2023-07-25T19:47:26Z) - Time-space-frequency feature Fusion for 3-channel motor imagery
classification [0.0]
本研究では,時間空間の周波数を考慮した新しいネットワークアーキテクチャであるTSFF-Netを紹介する。
TSFF-Netは、時間周波数表現、時間周波数特徴抽出、時間空間特徴抽出、特徴融合と分類の4つの主要コンポーネントから構成される。
実験により、TSFF-Netは、脳波復号法における単一モード特徴抽出ネットワークの欠点を補うだけでなく、他の最先端手法よりも優れていることが示された。
論文 参考訳(メタデータ) (2023-04-04T02:01:48Z) - Learnable Wavelet Packet Transform for Data-Adapted Spectrograms [0.0]
学習可能なウェーブレットパケット変換のためのフレームワークを提案し,データから自動的に特徴を学習する。
学習した機能はスペクトログラムとして表現することができ、データセットの重要な時間周波数情報を含んでいる。
提案手法の特性と性能を,改良されたスペクトルリークを評価し,音響モニタリングのための異常検出タスクに適用することにより評価した。
論文 参考訳(メタデータ) (2022-01-26T17:28:17Z) - Improved Speech Emotion Recognition using Transfer Learning and
Spectrogram Augmentation [56.264157127549446]
音声感情認識(SER)は、人間とコンピュータの相互作用において重要な役割を果たす課題である。
SERの主な課題の1つは、データの不足である。
本稿では,スペクトログラム拡張と併用した移動学習戦略を提案する。
論文 参考訳(メタデータ) (2021-08-05T10:39:39Z) - Deep Cellular Recurrent Network for Efficient Analysis of Time-Series
Data with Spatial Information [52.635997570873194]
本研究では,空間情報を用いた複雑な多次元時系列データを処理するための新しいディープセルリカレントニューラルネットワーク(DCRNN)アーキテクチャを提案する。
提案するアーキテクチャは,文献に比較して,学習可能なパラメータをかなり少なくしつつ,最先端の性能を実現している。
論文 参考訳(メタデータ) (2021-01-12T20:08:18Z) - Benchmarking Deep Learning Interpretability in Time Series Predictions [41.13847656750174]
モデル予測における入力特徴の重要性を強調するために、サリエンシ法が広く用いられている。
そこで我々は,多様なニューラルアーキテクチャにまたがって,サリエンシに基づく様々な解釈可能性手法の性能を広範囲に比較した。
論文 参考訳(メタデータ) (2020-10-26T22:07:53Z) - Multi-Tones' Phase Coding (MTPC) of Interaural Time Difference by
Spiking Neural Network [68.43026108936029]
雑音の多い実環境下での正確な音像定位のための純粋スパイクニューラルネットワーク(SNN)に基づく計算モデルを提案する。
このアルゴリズムを,マイクロホンアレイを用いたリアルタイムロボットシステムに実装する。
実験の結果, 平均誤差方位は13度であり, 音源定位に対する他の生物学的に妥当なニューロモルフィックアプローチの精度を上回っていることがわかった。
論文 参考訳(メタデータ) (2020-07-07T08:22:56Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。