論文の概要: PeakNetFP: Peak-based Neural Audio Fingerprinting Robust to Extreme Time Stretching
- arxiv url: http://arxiv.org/abs/2506.21086v1
- Date: Thu, 26 Jun 2025 08:29:48 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-06-27 19:53:10.021735
- Title: PeakNetFP: Peak-based Neural Audio Fingerprinting Robust to Extreme Time Stretching
- Title(参考訳): PeakNetFP: 極時間ストレッチのためのピークベースニューラルオーディオフィンガープリントロバスト
- Authors: Guillem Cortès-Sebastià, Benjamin Martin, Emilio Molina, Xavier Serra, Romain Hennequin,
- Abstract要約: この研究は、スペクトルピークに特化して設計された最初のニューラルオーディオフィンガープリント(AFP)システムであるPeakNetFPを紹介した。
PeakNetFPは、最先端のディープラーニングAFPであるNeuralFPのように、コントラスト学習を使用してトレーニングされている。
広範囲な評価において、PeakNetFPは50%から200%までのストレッチ要因に対して、トップ1ヒット率90%以上を維持している。
- 参考スコア(独自算出の注目度): 11.691282010058508
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: This work introduces PeakNetFP, the first neural audio fingerprinting (AFP) system designed specifically around spectral peaks. This novel system is designed to leverage the sparse spectral coordinates typically computed by traditional peak-based AFP methods. PeakNetFP performs hierarchical point feature extraction techniques similar to the computer vision model PointNet++, and is trained using contrastive learning like in the state-of-the-art deep learning AFP, NeuralFP. This combination allows PeakNetFP to outperform conventional AFP systems and achieves comparable performance to NeuralFP when handling challenging time-stretched audio data. In extensive evaluation, PeakNetFP maintains a Top-1 hit rate of over 90% for stretching factors ranging from 50% to 200%. Moreover, PeakNetFP offers significant efficiency advantages: compared to NeuralFP, it has 100 times fewer parameters and uses 11 times smaller input data. These features make PeakNetFP a lightweight and efficient solution for AFP tasks where time stretching is involved. Overall, this system represents a promising direction for future AFP technologies, as it successfully merges the lightweight nature of peak-based AFP with the adaptability and pattern recognition capabilities of neural network-based approaches, paving the way for more scalable and efficient solutions in the field.
- Abstract(参考訳): この研究は、スペクトルピークに特化して設計された最初のニューラルオーディオフィンガープリント(AFP)システムであるPeakNetFPを紹介した。
この新システムは、伝統的なピークベースAFP法で計算されるスパーススペクトル座標を利用するように設計されている。
PeakNetFPは、コンピュータビジョンモデルPointNet++と同様の階層的特徴抽出技術を実行し、最先端のディープラーニングAFPであるNeuralFPのようなコントラスト学習を用いて訓練される。
この組み合わせにより、PeakNetFPは従来のAFPシステムより優れ、タイムストレッチなオーディオデータを扱う際にNeuralFPと同等のパフォーマンスを達成することができる。
広範囲な評価において、PeakNetFPは50%から200%までのストレッチ要因に対して、トップ1ヒット率90%以上を維持している。
さらにPeakNetFPは、NeuralFPと比較して100倍のパラメータを持ち、11倍の入力データを使用する。
これらの機能により、PeakNetFPは時間ストレッチに関わるAFPタスクの軽量で効率的なソリューションになる。
全体として、このシステムは、ピークベースのAFPの軽量な性質とニューラルネットワークベースのアプローチの適応性とパターン認識能力の融合に成功し、この分野におけるよりスケーラブルで効率的なソリューションへの道を開くことによって、将来のAFP技術にとって有望な方向を示す。
関連論文リスト
- LUTMUL: Exceed Conventional FPGA Roofline Limit by LUT-based Efficient Multiplication for Neural Network Inference [25.342107763021147]
本稿では、LUTMULを導入し、LUT(ルックアップテーブル)のポテンシャルを利用して乗算を行う。
LUTのこの利点を生かして,FPGAベースのニューラルネットワークアクセラレータの性能向上の可能性を実証する。
論文 参考訳(メタデータ) (2024-11-01T02:54:11Z) - Learning Optimal Linear Precoding for Cell-Free Massive MIMO with GNN [15.271970287767164]
実用的なシステムで要求される1~2ミリ秒の時間予算で計算できるグラフニューラルネットワーク(GNN)を開発した。
本稿では,AP と UE の数が異なる様々なシナリオにおいて,ほぼ最適なスペクトル効率を実現することを示す。
論文 参考訳(メタデータ) (2024-06-06T19:29:33Z) - Exploiting FPGA Capabilities for Accelerated Biomedical Computing [0.0]
本研究では、フィールドプログラマブルゲートアレイ(FPGA)を用いたECG信号解析のための高度なニューラルネットワークアーキテクチャを提案する。
我々は、トレーニングと検証にMIT-BIH Arrhythmia Databaseを使用し、堅牢性を改善するためにガウスノイズを導入した。
この研究は最終的に、様々なアプリケーションのためのFPGA上でのニューラルネットワーク性能を最適化するためのガイドを提供する。
論文 参考訳(メタデータ) (2023-07-16T01:20:17Z) - Receptive Field-based Segmentation for Distributed CNN Inference
Acceleration in Collaborative Edge Computing [93.67044879636093]
協調エッジコンピューティングネットワークにおける分散畳み込みニューラルネットワーク(CNN)を用いた推論高速化について検討する。
我々は,CNNモデルを複数の畳み込み層に分割するために,融合層並列化を用いた新しい協調エッジコンピューティングを提案する。
論文 参考訳(メタデータ) (2022-07-22T18:38:11Z) - Network Calculus with Flow Prolongation -- A Feedforward FIFO Analysis
enabled by ML [73.11023209243326]
Flow Prolongation (FP) は遅延境界精度を大幅に改善することが示されている。
本稿では,機械学習を用いて拡張を予測することによって,FPをスケールするアプローチであるDeepFPを紹介する。
DeepFPは計算コストを無視して平均12.1%削減する。
論文 参考訳(メタデータ) (2022-02-07T08:46:47Z) - An Adaptive Device-Edge Co-Inference Framework Based on Soft
Actor-Critic [72.35307086274912]
高次元パラメータモデルと大規模数学的計算は、特にIoT(Internet of Things)デバイスにおける実行効率を制限する。
本稿では,ソフトポリシーの繰り返しによるエフェキシット点,エフェキシット点,エンフェキシット点を生成する離散的(SAC-d)のための新しい深層強化学習(DRL)-ソフトアクタ批判法を提案する。
レイテンシと精度を意識した報酬設計に基づいて、そのような計算は動的無線チャンネルや任意の処理のような複雑な環境によく適応でき、5G URLをサポートすることができる。
論文 参考訳(メタデータ) (2022-01-09T09:31:50Z) - Parallel frequency function-deep neural network for efficient complex
broadband signal approximation [1.536989504296526]
ニューラルネットワークは本質的に、特徴フィッティングのためのネットワーク重みを調整することで、高次元の複雑なマッピングモデルである。
ネットワークトレーニングにおけるスペクトルバイアスは、ブロードバンド信号に高周波成分を適合させるには耐え難い訓練エポックをもたらす。
並列周波数関数ディープニューラルネットワーク(PFF-DNN)を提案する。
論文 参考訳(メタデータ) (2021-06-19T01:39:13Z) - Dynamic Feature Pyramid Networks for Object Detection [40.24111664691307]
本稿では,各層に異なるカーネルサイズを持つ畳み込みフィルタを組み込んで,受容場を拡大するFPNを提案する。
計算コストの異なる複数の分岐からなる新しい動的FPN(DyFPN)を提案する。
ベンチマーク実験により,提案したDyFPNは計算資源の最適割り当てにより性能を著しく向上することが示された。
論文 参考訳(メタデータ) (2020-12-01T19:03:55Z) - Fast accuracy estimation of deep learning based multi-class musical
source separation [79.10962538141445]
本稿では,ニューラルネットワークのトレーニングやチューニングを行うことなく,任意のデータセットにおける楽器の分離性を評価する手法を提案する。
理想的な比マスクを持つオラクルの原理に基づいて、我々の手法は最先端のディープラーニング手法の分離性能を推定するための優れたプロキシである。
論文 参考訳(メタデータ) (2020-10-19T13:05:08Z) - A Deep-Unfolded Reference-Based RPCA Network For Video
Foreground-Background Separation [86.35434065681925]
本稿では,ロバスト主成分分析(RPCA)問題に対するディープアンフォールディングに基づくネットワーク設計を提案する。
既存の設計とは異なり,本手法は連続するビデオフレームのスパース表現間の時間的相関をモデル化することに焦点を当てている。
移動MNISTデータセットを用いた実験により、提案したネットワークは、ビデオフォアグラウンドとバックグラウンドの分離作業において、最近提案された最先端のRPCAネットワークより優れていることが示された。
論文 参考訳(メタデータ) (2020-10-02T11:40:09Z) - HiPPO: Recurrent Memory with Optimal Polynomial Projections [93.3537706398653]
本稿では,連続信号と離散時系列をベースに投影してオンライン圧縮するための一般フレームワーク(HiPPO)を提案する。
過去の各時間ステップの重要性を示す尺度が与えられた場合、HiPPOは自然なオンライン関数近似問題に対する最適解を生成する。
このフォーマルなフレームワークは、すべての履歴を記憶するために時間をかけてスケールする新しいメモリ更新メカニズム(HiPPO-LegS)を提供する。
論文 参考訳(メタデータ) (2020-08-17T23:39:33Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。