論文の概要: Scalable Evaluation for Audio Identification via Synthetic Latent Fingerprint Generation
- arxiv url: http://arxiv.org/abs/2509.18620v1
- Date: Tue, 23 Sep 2025 04:11:15 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-09-24 20:41:27.696206
- Title: Scalable Evaluation for Audio Identification via Synthetic Latent Fingerprint Generation
- Title(参考訳): 合成潜在指紋生成による音声識別のためのスケーラブルな評価
- Authors: Aditya Bhattacharjee, Marco Pasini, Emmanouil Benetos,
- Abstract要約: 大規模なパブリック・ミュージック・データベースの欠如により,現実的な規模でのオーディオ・フィンガープリントの評価が制限される。
実際の指紋の分布を近似した潜伏指紋を合成するオーディオフリーな手法を提案する。
本研究では,本システムを用いて生成した合成指紋をリアルな気晴らし器として機能し,音声の追加を必要とせずに大規模検索性能のシミュレーションを可能にする。
- 参考スコア(独自算出の注目度): 17.07118976088468
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: The evaluation of audio fingerprinting at a realistic scale is limited by the scarcity of large public music databases. We present an audio-free approach that synthesises latent fingerprints which approximate the distribution of real fingerprints. Our method trains a Rectified Flow model on embeddings extracted by pre-trained neural audio fingerprinting systems. The synthetic fingerprints generated using our system act as realistic distractors and enable the simulation of retrieval performance at a large scale without requiring additional audio. We assess the fidelity of synthetic fingerprints by comparing the distributions to real data. We further benchmark the retrieval performances across multiple state-of-the-art audio fingerprinting frameworks by augmenting real reference databases with synthetic distractors, and show that the scaling trends obtained with synthetic distractors closely track those obtained with real distractors. Finally, we scale the synthetic distractor database to model retrieval performance for very large databases, providing a practical metric of system scalability that does not depend on access to audio corpora.
- Abstract(参考訳): 大規模なパブリック・ミュージック・データベースの欠如により,現実的な規模でのオーディオ・フィンガープリントの評価が制限される。
実際の指紋の分布を近似した潜伏指紋を合成するオーディオフリーな手法を提案する。
本手法は,事前学習したニューラルオーディオフィンガープリントシステムから抽出した埋め込みに関するRectified Flowモデルを訓練する。
本研究では,本システムを用いて生成した合成指紋をリアルな気晴らし器として機能し,音声の追加を必要とせずに大規模検索性能のシミュレーションを可能にする。
合成指紋の忠実度を実データと比較することにより評価する。
さらに,複数の最先端オーディオフィンガープリントフレームワークの検索性能を,合成イントラクタを用いた実参照データベースの強化によりベンチマークし,合成イントラクタによるスケーリング傾向が,実イントラクタを用いて得られたものを密に追跡していることを示す。
最後に,合成イントラクタデータベースを拡張して,大規模データベースの検索性能をモデル化し,オーディオコーパスへのアクセスに依存しないシステムスケーラビリティの実用的な指標を提供する。
関連論文リスト
- Where are we in audio deepfake detection? A systematic analysis over generative and detection models [59.09338266364506]
SONARはAI-Audio Detection FrameworkとBenchmarkの合成である。
最先端のAI合成聴覚コンテンツを識別するための総合的な評価を提供する。
従来のモデルベース検出システムと基礎モデルベース検出システムの両方で、AIオーディオ検出を均一にベンチマークする最初のフレームワークである。
論文 参考訳(メタデータ) (2024-10-06T01:03:42Z) - Real Acoustic Fields: An Audio-Visual Room Acoustics Dataset and Benchmark [65.79402756995084]
Real Acoustic Fields (RAF)は、複数のモードから実際の音響室データをキャプチャする新しいデータセットである。
RAFは密集した室内音響データを提供する最初のデータセットである。
論文 参考訳(メタデータ) (2024-03-27T17:59:56Z) - Advancing Audio Fingerprinting Accuracy Addressing Background Noise and Distortion Challenges [0.0]
本研究では,AIとMLを統合した音声フィンガープリントアルゴリズムを提案する。
性能評価は、5秒の音声入力で100%精度が保証される。
本研究は音声フィンガープリントの適応性を向上し,様々な環境や応用における課題に対処する。
論文 参考訳(メタデータ) (2024-02-21T17:37:30Z) - An investigation of the reconstruction capacity of stacked convolutional
autoencoders for log-mel-spectrograms [2.3204178451683264]
音声処理アプリケーションでは、ハイレベルな表現に基づく表現力のある音声の生成は、高い需要を示す。
ニューラルネットワークのような現代のアルゴリズムは、楽器の圧縮に基づく表現型シンセサイザーの開発にインスピレーションを与えている。
本研究では,多種多様な楽器に対する時間周波数音声表現の圧縮のための畳み込み畳み込みオートエンコーダについて検討した。
論文 参考訳(メタデータ) (2023-01-18T17:19:04Z) - Audio Deepfake Attribution: An Initial Dataset and Investigation [41.62487394875349]
我々は、Audio Deepfake Attribution (ADA)と呼ばれるオーディオ生成ツールの属性に対する最初のディープフェイクオーディオデータセットを設計する。
オープンセットオーディオディープフェイク属性(OSADA)のためのクラス・マルチセンター学習(CRML)手法を提案する。
実験の結果,CRML法は実世界のシナリオにおけるオープンセットリスクに効果的に対処できることが示された。
論文 参考訳(メタデータ) (2022-08-21T05:15:40Z) - SpoofGAN: Synthetic Fingerprint Spoof Images [47.87570819350573]
指紋スプーフ検出の進歩に対する大きな制限は、公開可能な大規模な指紋スプーフデータセットの欠如である。
この研究は、これらのアルゴリズムに十分なデータを供給する際に、合成指紋(ライブ指紋とスプーフ指紋の両方)の有用性を実証することを目的としている。
論文 参考訳(メタデータ) (2022-04-13T16:27:27Z) - Synthesis and Reconstruction of Fingerprints using Generative
Adversarial Networks [6.700873164609009]
本稿では,StyleGan2アーキテクチャに基づく新しい指紋合成・再構成フレームワークを提案する。
また,生成した指紋の属性を同一性を保ちながら修正する計算手法も提案する。
提案手法は, 指紋合成と復元の両面において, 現代的手法よりも優れていることを示した。
論文 参考訳(メタデータ) (2022-01-17T00:18:00Z) - SynFi: Automatic Synthetic Fingerprint Generation [23.334625222079634]
我々は,高忠実度合成指紋を大規模に自動生成する新しい手法を提案する。
本手法は,実際の指紋と計算的に区別できない指紋を生成する最初の方法であることを示す。
論文 参考訳(メタデータ) (2020-02-16T07:45:29Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。