論文の概要: InterGridNet: An Electric Network Frequency Approach for Audio Source Location Classification Using Convolutional Neural Networks
- arxiv url: http://arxiv.org/abs/2502.10011v1
- Date: Fri, 14 Feb 2025 08:45:35 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-02-17 18:06:20.440493
- Title: InterGridNet: An Electric Network Frequency Approach for Audio Source Location Classification Using Convolutional Neural Networks
- Title(参考訳): InterGridNet:畳み込みニューラルネットワークを用いた音源位置分類のための電気的ネットワーク周波数アプローチ
- Authors: Christos Korgialas, Ioannis Tsingalis, Georgios Tzolopoulos, Constantine Kotropoulos,
- Abstract要約: InterGridNetと呼ばれる新しいフレームワークが導入され、SP Cup 2016データセットのElectric Network Frequency(ENF)シグネチャの位置分類に浅いRawNetモデルを利用している。
テスト記録におけるInterGridNetの全体的な精度は92%であり、SPカップ2016でテストされた最先端の手法に対する効果を示している。
- 参考スコア(独自算出の注目度): 2.0749231618270803
- License:
- Abstract: A novel framework, called InterGridNet, is introduced, leveraging a shallow RawNet model for geolocation classification of Electric Network Frequency (ENF) signatures in the SP Cup 2016 dataset. During data preparation, recordings are sorted into audio and power groups based on inherent characteristics, further divided into 50 Hz and 60 Hz groups via spectrogram analysis. Residual blocks within the classification model extract frame-level embeddings, aiding decision-making through softmax activation. The topology and the hyperparameters of the shallow RawNet are optimized using a Neural Architecture Search. The overall accuracy of InterGridNet in the test recordings is 92%, indicating its effectiveness against the state-of-the-art methods tested in the SP Cup 2016. These findings underscore InterGridNet's effectiveness in accurately classifying audio recordings from diverse power grids, advancing state-of-the-art geolocation estimation methods.
- Abstract(参考訳): InterGridNetと呼ばれる新しいフレームワークが導入され、SP Cup 2016データセットのElectric Network Frequency(ENF)シグネチャの位置分類に浅いRawNetモデルを利用している。
データ準備中、録音は固有の特性に基づいてオーディオとパワーグループに分類され、さらにスペクトル解析により50Hzと60Hzのグループに分割される。
分類モデル内の残留ブロックはフレームレベルの埋め込みを抽出し、ソフトマックスアクティベーションによる意思決定を支援する。
浅いRawNetのトポロジとハイパーパラメータはニューラルアーキテクチャサーチを用いて最適化される。
テスト記録におけるInterGridNetの全体的な精度は92%であり、SPカップ2016でテストされた最先端の手法に対する効果を示している。
これらの知見は、様々な電力グリッドから音声録音を正確に分類し、最先端の位置情報推定手法を進歩させるInterGridNetの有効性を裏付けるものである。
関連論文リスト
- On Spectrogram Analysis in a Multiple Classifier Fusion Framework for Power Grid Classification Using Electric Network Frequency [1.6385815610837167]
ENF(Electric Network Frequency)は、電力流通システム固有の信号である。
ここでは、ENFを利用した電力グリッド分類の新しい手法を開発した。
スペクトログラムは異なるグリッドにまたがるオーディオと電力の記録から生成され、固有のENFパターンが明らかになる。
論文 参考訳(メタデータ) (2024-03-27T09:44:50Z) - GNN-LoFI: a Novel Graph Neural Network through Localized Feature-based
Histogram Intersection [51.608147732998994]
グラフニューラルネットワークは、グラフベースの機械学習の選択フレームワークになりつつある。
本稿では,古典的メッセージパッシングに代えて,ノード特徴の局所分布を解析するグラフニューラルネットワークアーキテクチャを提案する。
論文 参考訳(メタデータ) (2024-01-17T13:04:23Z) - Frequency and Scale Perspectives of Feature Extraction [5.081561820537235]
ニューラルネットワークの周波数とスケールに対する感度を分析する。
ニューラルネットワークは低周波と中周波のバイアスを持つが、異なるクラスに対して異なる周波数帯域を好む。
これらの観察により、ニューラルネットワークは様々なスケールと周波数で特徴を抽出する能力を学ぶ必要があるという仮説が導かれる。
論文 参考訳(メタデータ) (2023-02-24T06:37:36Z) - Graph Neural Networks on SPD Manifolds for Motor Imagery Classification:
A Perspective from the Time-Frequency Analysis [11.285449381629107]
運動画像(MI)分類は脳脳波(EEG)に基づく脳-コンピュータインタフェースにおける顕著な研究課題である。
本研究では,時間周波数解析の観点から,深層学習に基づく幾何学的MI-EEG分類器を増幅する。
Graph-CSPNetは、時間周波数領域における脳波の特徴を捉えるために、新しい多様体評価技術を利用している。
論文 参考訳(メタデータ) (2022-10-25T04:48:11Z) - Deep Learning-Based Synchronization for Uplink NB-IoT [72.86843435313048]
狭帯域モノのインターネット(NB-IoT)における狭帯域物理ランダムアクセスチャネル(NPRACH)のデバイス検出と到着時刻推定のためのニューラルネットワーク(NN)に基づくアルゴリズムを提案する。
導入されたNNアーキテクチャは、残余の畳み込みネットワークと、5Gニューラジオ(5G NR)仕様のプリアンブル構造に関する知識を利用する。
論文 参考訳(メタデータ) (2022-05-22T12:16:43Z) - Three-Way Deep Neural Network for Radio Frequency Map Generation and
Source Localization [67.93423427193055]
空間、時間、周波数領域にわたる無線スペクトルのモニタリングは、5Gと6G以上の通信技術において重要な特徴となる。
本稿では,空間領域全体にわたる不規則分散計測を補間するGAN(Generative Adversarial Network)機械学習モデルを提案する。
論文 参考訳(メタデータ) (2021-11-23T22:25:10Z) - Time-domain Speech Enhancement with Generative Adversarial Learning [53.74228907273269]
本稿では,TSEGAN(Time-domain Speech Enhancement Generative Adversarial Network)という新しいフレームワークを提案する。
TSEGANは、スケーリング問題を軽減するためのメトリクス評価を備えた時間領域におけるジェネレーション・アドバーサリ・ネットワーク(GAN)の拡張である。
さらに,計量ganの性能を理論的に解析するために,客観的関数マッピングに基づく新しい手法を提案する。
論文 参考訳(メタデータ) (2021-03-30T08:09:49Z) - Conditioning Trick for Training Stable GANs [70.15099665710336]
本稿では,GANトレーニング中の不安定性問題に対応するため,ジェネレータネットワークに正規性から逸脱する条件付け手法を提案する。
我々は、生成元をシュア分解のスペクトル領域で計算された実サンプルの正規化関数から逸脱するように強制する。
論文 参考訳(メタデータ) (2020-10-12T16:50:22Z) - Network Adjustment: Channel Search Guided by FLOPs Utilization Ratio [101.84651388520584]
本稿では,ネットワークの精度をFLOPの関数として考慮した,ネットワーク調整という新しいフレームワークを提案する。
標準画像分類データセットと幅広いベースネットワークの実験は、我々のアプローチの有効性を実証している。
論文 参考訳(メタデータ) (2020-04-06T15:51:00Z) - Acoustic Scene Classification Using Bilinear Pooling on Time-liked and
Frequency-liked Convolution Neural Network [4.131608702779222]
本稿では、高調波とパーカッシブ音源分離(HPSS)を用いて、音声を高調波とパーカッシブ音源に分割する方法について検討する。
これら2つのCNNから抽出された深い特徴は、双線形プールによって結合される。
このモデルはDCASE 2019サブタスク1aデータセットで評価されており、開発データセットで平均65%のスコアを得ている。
論文 参考訳(メタデータ) (2020-02-14T04:06:32Z) - Neural Architecture Search on Acoustic Scene Classification [13.529070650030313]
我々はMobileNetV2にインスパイアされた軽量で高性能なベースラインネットワークを提案する。
提案するベースラインに基づいて構築された動的アーキテクチャ空間を探索する。
実験の結果,検索されたネットワークはASCタスクに適していることがわかった。
論文 参考訳(メタデータ) (2019-12-30T06:35:12Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。