論文の概要: Representation-Based Data Quality Audits for Audio
- arxiv url: http://arxiv.org/abs/2509.26291v1
- Date: Tue, 30 Sep 2025 14:08:03 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-10-01 17:09:04.566549
- Title: Representation-Based Data Quality Audits for Audio
- Title(参考訳): 表現に基づく音声データ品質監査
- Authors: Alvaro Gonzalez-Jimenez, Fabian Gröger, Linda Wermelinger, Andrin Bürli, Iason Kastanis, Simone Lionetti, Marc Pouly,
- Abstract要約: 本稿では,表現からランクへのデータ監査フレームワークであるSelfCleanを画像からオーディオ領域に適応させる。
単一の統一プロセス内で異なる問題に直面するランク付けされたレビューリストを作成する。
その結果、このフレームワークは最先端のランク付け性能を達成し、しばしば問題固有のベースラインを上回ります。
- 参考スコア(独自算出の注目度): 4.795158501811661
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Data quality issues such as off-topic samples, near duplicates, and label errors often limit the performance of audio-based systems. This paper addresses these issues by adapting SelfClean, a representation-to-rank data auditing framework, from the image to the audio domain. This approach leverages self-supervised audio representations to identify common data quality issues, creating ranked review lists that surface distinct issues within a single, unified process. The method is benchmarked on the ESC-50, GTZAN, and a proprietary industrial dataset, using both synthetic and naturally occurring corruptions. The results demonstrate that this framework achieves state-of-the-art ranking performance, often outperforming issue-specific baselines and enabling significant annotation savings by efficiently guiding human review.
- Abstract(参考訳): オフトピックサンプル、ほぼ重複、ラベルエラーなどのデータ品質問題は、しばしばオーディオベースのシステムの性能を制限している。
本稿では、画像からオーディオ領域への表現からランクへのデータ監査フレームワークであるSelfCleanを適用することで、これらの問題に対処する。
このアプローチでは、教師付きオーディオ表現を活用して、共通のデータ品質の問題を特定し、単一の統一プロセス内で異なる問題に直面するランク付けされたレビューリストを作成する。
この手法はESC-50、GTZAN、および合成と自然発生の腐敗の両方を用いて、独自の産業データセットでベンチマークされる。
その結果、このフレームワークは最先端のランク付け性能を達成し、しばしば課題固有のベースラインを上回り、人間のレビューを効率的に導くことで、重要なアノテーションの節約を可能にした。
関連論文リスト
- High-Quality Sound Separation Across Diverse Categories via Visually-Guided Generative Modeling [65.02357548201188]
DAVIS(Diffusion-based Audio-VIsual separation framework)を提案する。
本フレームワークは、混合音声入力と関連する視覚情報に基づいて、ノイズ分布から直接、所望の分離音スペクトルを合成することによって機能する。
論文 参考訳(メタデータ) (2025-09-26T08:46:00Z) - Automatically Identify and Rectify: Robust Deep Contrastive Multi-view Clustering in Noisy Scenarios [76.02688769599686]
本稿では,AIRMVCと呼ばれるノイズデータの自動識別と修正のための新しいマルチビュークラスタリングフレームワークを提案する。
具体的には,GMMを用いて雑音識別を異常識別問題として再構成する。
次に,同定結果に基づいて,ノイズデータの悪影響を軽減するためのハイブリッド補正戦略を設計する。
論文 参考訳(メタデータ) (2025-05-27T16:16:54Z) - FNBench: Benchmarking Robust Federated Learning against Noisy Labels [23.660857480962104]
本稿では,フェデレートラーニング(FL)における雑音ラベルに関する最初のベンチマーク研究について述べる。
本稿では, 合成ラベルノイズ, 不完全な人間のアノテーション誤り, 系統的誤りを含む3種類のラベルノイズパターンについて考察する。
評価には、5つの画像認識データセットと1つのテキスト分類データセットに18の最先端手法が組み込まれている。
論文 参考訳(メタデータ) (2025-05-10T16:14:52Z) - Improving a Named Entity Recognizer Trained on Noisy Data with a Few
Clean Instances [55.37242480995541]
クリーンなインスタンスの小さなセットから,ノイズの多いNERデータを誘導することで,ノイズを発生させる手法を提案する。
メインのNERモデルとともに、判別器モデルをトレーニングし、その出力を使用してサンプルの重み付けを校正します。
クラウドソーシングと遠隔監視データセットの結果から,提案手法は少ないガイダンスセットで継続的に性能を向上させることができることが示された。
論文 参考訳(メタデータ) (2023-10-25T17:23:37Z) - Inconsistency Ranking-based Noisy Label Detection for High-quality Data [11.844624139434867]
本稿では,高品質データに対する非整合性ランキング付き自動ノイズラベル検出(NLD)手法を提案する。
クラス間の不整合度ランキングとクラス内不整合度ランキングを比較し,異なる雑音条件下でのメトリクス学習損失関数を比較した。
実験結果から,提案手法は大規模話者認識データセットの効率的なクリーニングと効率的なクリーニングを両立させる可能性が示唆された。
論文 参考訳(メタデータ) (2022-12-01T03:09:33Z) - Learning from Noisy Labels with Coarse-to-Fine Sample Credibility
Modeling [22.62790706276081]
ノイズの多いラベルでディープニューラルネットワーク(DNN)を訓練することは事実上難しい。
従来の取り組みでは、統合されたデノナイジングフローで部分データや完全なデータを扱う傾向があります。
本研究では,ノイズの多いデータを分割・分散的に処理するために,CREMAと呼ばれる粗大な頑健な学習手法を提案する。
論文 参考訳(メタデータ) (2022-08-23T02:06:38Z) - Bridging the Gap Between Clean Data Training and Real-World Inference
for Spoken Language Understanding [76.89426311082927]
既存のモデルはクリーンデータに基づいてトレーニングされ、クリーンデータトレーニングと現実世界の推論の間にtextitgapが発生する。
本稿では,良質なサンプルと低品質のサンプルの両方が類似ベクトル空間に埋め込まれた領域適応法を提案する。
広く使用されているデータセット、スニップス、および大規模な社内データセット(1000万のトレーニング例)に関する実験では、この方法は実世界の(騒々しい)コーパスのベースラインモデルを上回るだけでなく、堅牢性、すなわち、騒々しい環境下で高品質の結果を生み出すことを実証しています。
論文 参考訳(メタデータ) (2021-04-13T17:54:33Z) - A Self-Refinement Strategy for Noise Reduction in Grammatical Error
Correction [54.569707226277735]
既存の文法的誤り訂正(GEC)のアプローチは、手動で作成したGECデータセットによる教師あり学習に依存している。
誤りが不適切に編集されたり、修正されなかったりする「ノイズ」は無視できないほどある。
本稿では,既存のモデルの予測整合性を利用して,これらのデータセットをデノマイズする自己補充手法を提案する。
論文 参考訳(メタデータ) (2020-10-07T04:45:09Z) - Audio Tagging by Cross Filtering Noisy Labels [26.14064793686316]
そこで我々はCrossFilterという新しいフレームワークを提案し,音声タグ付けにおけるノイズラベル問題に対処する。
提案手法は最先端の性能を達成し,アンサンブルモデルを超えている。
論文 参考訳(メタデータ) (2020-07-16T07:55:04Z) - Unsupervised Domain Adaptation for Acoustic Scene Classification Using
Band-Wise Statistics Matching [69.24460241328521]
機械学習アルゴリズムは、トレーニング(ソース)とテスト(ターゲット)データの分散のミスマッチの影響を受けやすい。
本研究では,ターゲット領域音響シーンの各周波数帯域の1次及び2次サンプル統計値と,ソース領域学習データセットの1次と2次サンプル統計値との整合性を有する教師なし領域適応手法を提案する。
提案手法は,文献にみられる最先端の教師なし手法よりも,ソース・ドメインの分類精度とターゲット・ドメインの分類精度の両面で優れていることを示す。
論文 参考訳(メタデータ) (2020-04-30T23:56:05Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。