論文の概要: IndieFake Dataset: A Benchmark Dataset for Audio Deepfake Detection
- arxiv url: http://arxiv.org/abs/2506.19014v1
- Date: Mon, 23 Jun 2025 18:10:06 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-06-25 19:48:23.33499
- Title: IndieFake Dataset: A Benchmark Dataset for Audio Deepfake Detection
- Title(参考訳): IndieFake Dataset: オーディオディープフェイク検出のためのベンチマークデータセット
- Authors: Abhay Kumar, Kunal Verma, Omkar More,
- Abstract要約: Deepfake技術は、AIアシスタント、音声障害のアクセシビリティ向上、エンターテイメントの向上などのメリットを提供する。
また、セキュリティ、プライバシー、およびデジタルコミュニケーションに対する信頼に重大なリスクをもたらす。
既存のデータセットには多様な民族的アクセントがなく、現実世界のシナリオでは不十分である。
この研究はインディーフェイクデータセット(IFD)を導入し、インド語を話す50人の英語話者から27.17時間のボナフィドとディープフェイクのオーディオを収録した。
- 参考スコア(独自算出の注目度): 0.4451479907610763
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Advancements in audio deepfake technology offers benefits like AI assistants, better accessibility for speech impairments, and enhanced entertainment. However, it also poses significant risks to security, privacy, and trust in digital communications. Detecting and mitigating these threats requires comprehensive datasets. Existing datasets lack diverse ethnic accents, making them inadequate for many real-world scenarios. Consequently, models trained on these datasets struggle to detect audio deepfakes in diverse linguistic and cultural contexts such as in South-Asian countries. Ironically, there is a stark lack of South-Asian speaker samples in the existing datasets despite constituting a quarter of the worlds population. This work introduces the IndieFake Dataset (IFD), featuring 27.17 hours of bonafide and deepfake audio from 50 English speaking Indian speakers. IFD offers balanced data distribution and includes speaker-level characterization, absent in datasets like ASVspoof21 (DF). We evaluated various baselines on IFD against existing ASVspoof21 (DF) and In-The-Wild (ITW) datasets. IFD outperforms ASVspoof21 (DF) and proves to be more challenging compared to benchmark ITW dataset. The dataset will be publicly available upon acceptance.
- Abstract(参考訳): オーディオディープフェイク技術の進歩は、AIアシスタント、音声障害に対するアクセシビリティの向上、エンターテイメントの向上などのメリットを提供する。
しかし、セキュリティ、プライバシー、そしてデジタルコミュニケーションに対する信頼にも重大なリスクが伴う。
これらの脅威の検出と緩和には、包括的なデータセットが必要である。
既存のデータセットには多様な民族的アクセントがなく、現実世界のシナリオでは不十分である。
その結果、これらのデータセットで訓練されたモデルは、南アジア諸国のような多様な言語的・文化的文脈におけるオーディオディープフェイクを検出するのに苦労している。
皮肉なことに、世界の人口の4分の1を構成しているにもかかわらず、既存のデータセットには南アジア話者のサンプルが不足している。
この研究はインディフェイク・データセット(IFD)を導入し、インド語を話す50人の英語話者から27.17時間のボナフィドとディープフェイクのオーディオを収録した。
IFDはバランスの取れたデータ配信を提供し、ASVspoof21(DF)のようなデータセットにはない話者レベルの特徴を含む。
ASVspoof21(DF)およびIn-The-Wild(ITW)データセットに対してIFDの様々なベースラインを評価した。
IFD は ASVspoof21 (DF) より優れており、ITW のベンチマークデータセットよりも難しいことが証明されている。
データセットは受理時に公開される。
関連論文リスト
- Hindi audio-video-Deepfake (HAV-DF): A Hindi language-based Audio-video Deepfake Dataset [11.164272928464879]
ヒンディー語でのフェイクビデオやスピーチは、農村部や半都市部に多大な影響を及ぼす可能性がある。
本論文は,Hindi Audio-video-Deepfake'(HAV-DF)という,ヒンディー語による新しいディープフェイクデータセットを作成することを目的とする。
論文 参考訳(メタデータ) (2024-11-23T05:18:43Z) - SpoofCeleb: Speech Deepfake Detection and SASV In The Wild [76.71096751337888]
SpoofCelebは、音声ディープフェイク検出(SDD)とスポフィングロバスト自動話者検証(SASV)のために設計されたデータセットである。
SpoofCelebは、1,251人のユニークな話者による250万以上の発話で構成され、自然界の状況下で収集されている。
論文 参考訳(メタデータ) (2024-09-18T23:17:02Z) - Deepfake audio as a data augmentation technique for training automatic
speech to text transcription models [55.2480439325792]
本稿では,ディープフェイク音声に基づくデータ拡張手法を提案する。
インド人(英語)が生成したデータセットが選択され、単一のアクセントの存在が保証された。
論文 参考訳(メタデータ) (2023-09-22T11:33:03Z) - SceneFake: An Initial Dataset and Benchmarks for Scene Fake Audio Detection [54.74467470358476]
本稿では,シーンフェイク音声検出のためのデータセットSceneFakeを提案する。
操作されたオーディオは、オリジナルオーディオの音響シーンを改ざんするだけで生成される。
本論文では,SceneFakeデータセット上での擬似音声検出ベンチマーク結果について報告する。
論文 参考訳(メタデータ) (2022-11-11T09:05:50Z) - Half-Truth: A Partially Fake Audio Detection Dataset [60.08010668752466]
本稿では半真性音声検出(HAD)のためのデータセットを開発する。
HADデータセットの部分的に偽の音声は、発話中の数単語だけを変更する。
我々は、偽のユトランを検知するだけでなく、このデータセットを用いて音声中の操作された領域をローカライズする。
論文 参考訳(メタデータ) (2021-04-08T08:57:13Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。