論文の概要: DeepSpeak Dataset v1.0
- arxiv url: http://arxiv.org/abs/2408.05366v1
- Date: Fri, 9 Aug 2024 22:29:43 GMT
- ステータス: 処理完了
- システム内更新日: 2024-08-13 19:21:55.228733
- Title: DeepSpeak Dataset v1.0
- Title(参考訳): DeepSpeak Dataset v1.0
- Authors: Sarah Barrington, Matyas Bohacek, Hany Farid,
- Abstract要約: ウェブカメラの前で話し、身振りで示す人々の、リアルタイムおよびディープフェイク映像の大規模なデータセットについて述べる。
このデータセットの最初のバージョンにおける実際のビデオは、20ドル(約2万2000円)の個人による9ドル(約9400円)の映像で構成されている。
25時間以上の映像で構成されたフェイクビデオは、さまざまな最先端のフェイススワップと、自然とAIが生成する音声によるリップシンクのディープフェイクで構成されている。
- 参考スコア(独自算出の注目度): 11.661238776379115
- License: http://creativecommons.org/licenses/by-nc-nd/4.0/
- Abstract: We describe a large-scale dataset--{\em DeepSpeak}--of real and deepfake footage of people talking and gesturing in front of their webcams. The real videos in this first version of the dataset consist of $9$ hours of footage from $220$ diverse individuals. Constituting more than 25 hours of footage, the fake videos consist of a range of different state-of-the-art face-swap and lip-sync deepfakes with natural and AI-generated voices. We expect to release future versions of this dataset with different and updated deepfake technologies. This dataset is made freely available for research and non-commercial uses; requests for commercial use will be considered.
- Abstract(参考訳): ウェブカメラの前で話し、身振りで示す人々の実像とディープフェイク映像の大規模なデータセット、-{\em DeepSpeak}について説明する。
このデータセットの最初のバージョンにおける実際のビデオは、20ドル(約2万2000円)の個人による9ドル(約9400円)の映像で構成されている。
25時間以上の映像で構成されたフェイクビデオは、さまざまな最先端のフェイススワップと、自然とAIが生成する音声によるリップシンクのディープフェイクで構成されている。
私たちは、このデータセットの将来バージョンを、異なる、そして更新されたディープフェイク技術でリリースする予定です。
このデータセットは、研究および非商用用途で自由に利用でき、商用利用の要求も考慮される。
関連論文リスト
- Unmasking Illusions: Understanding Human Perception of Audiovisual Deepfakes [49.81915942821647]
本研究は,ディープフェイク映像を主観的研究により識別する人間の能力を評価することを目的とする。
人間の観察者を5つの最先端オーディオ視覚深度検出モデルと比較することにより,その知見を提示する。
同じ40の動画で評価すると、すべてのAIモデルは人間より優れていることが分かりました。
論文 参考訳(メタデータ) (2024-05-07T07:57:15Z) - Vulnerability of Automatic Identity Recognition to Audio-Visual
Deepfakes [13.042731289687918]
本稿では, ディープフェイクSWAN-DFの音声・映像データベースとして初めて, 唇と音声をよく同期させる手法を提案する。
我々は,SpeechBrainのECAPA-TDNNモデルなど,アート話者認識システムの脆弱性を実証する。
論文 参考訳(メタデータ) (2023-11-29T14:18:04Z) - SceneFake: An Initial Dataset and Benchmarks for Scene Fake Audio Detection [54.74467470358476]
本稿では,シーンフェイク音声検出のためのデータセットSceneFakeを提案する。
操作されたオーディオは、オリジナルオーディオの音響シーンを改ざんするだけで生成される。
本論文では,SceneFakeデータセット上での擬似音声検出ベンチマーク結果について報告する。
論文 参考訳(メタデータ) (2022-11-11T09:05:50Z) - DeePhy: On Deepfake Phylogeny [58.01631614114075]
DeePhyは、新しいDeepfake Phylogenyデータセットである。
6つのディープフェイク検出アルゴリズムを用いて,DeePhyデータセットのベンチマークを示す。
論文 参考訳(メタデータ) (2022-09-19T15:30:33Z) - Video Manipulations Beyond Faces: A Dataset with Human-Machine Analysis [60.13902294276283]
我々は826の動画(413のリアルと413の操作)からなるデータセットであるVideoShamを提示する。
既存のディープフェイクデータセットの多くは、2種類の顔操作にのみ焦点をあてている。
我々の分析によると、最先端の操作検出アルゴリズムはいくつかの特定の攻撃に対してのみ有効であり、VideoShamではうまくスケールしない。
論文 参考訳(メタデータ) (2022-07-26T17:39:04Z) - MAD: A Scalable Dataset for Language Grounding in Videos from Movie
Audio Descriptions [109.84031235538002]
我々は、既存のビデオデータセットをテキストアノテーションで拡張するパラダイムから外れた、新しいベンチマークであるMAD(Movie Audio Descriptions)を提示する。
MADには1200時間以上のビデオに接地された384,000以上の自然言語文が含まれており、現在診断されているビデオ言語接地データセットのバイアスが大幅に減少している。
論文 参考訳(メタデータ) (2021-12-01T11:47:09Z) - Challenges and Solutions in DeepFakes [8.401473551081747]
ディープラーニングを利用したアプリケーションが最近登場したのがDeep Fakeだ。
これは、人間が本物と区別できない偽のイメージやビデオを作成するのに役立つ。
Nvidiaが収集したFlickrのデータセットから70万の顔と、スタイルのGANによって生成された100万の偽の顔からサンプリングされた70万の偽の顔を含む、140万の顔と偽の顔のデータセットを紹介した。
モデルが実際の顔や偽の顔を識別できるように、データセットでモデルをトレーニングします。
論文 参考訳(メタデータ) (2021-09-12T01:22:12Z) - FakeAVCeleb: A Novel Audio-Video Multimodal Deepfake Dataset [21.199288324085444]
近年,人間の声のクローン化や合成という新たな課題が表面化しつつある。
ディープフェイクビデオとオーディオを使った偽造攻撃の脅威が高まっているため、ビデオとオーディオの両方に焦点を当てた新しいディープフェイク検知器が求められている。
本稿では, ディープフェイク映像だけでなく, 合成音声も含む新しいオーディオ・ビデオ・ディープフェイク・データセット(FakeAVCeleb)を提案する。
論文 参考訳(メタデータ) (2021-08-11T07:49:36Z) - Detecting Deepfake Videos Using Euler Video Magnification [1.8506048493564673]
Deepfakeのビデオは、高度な機械学習技術を使ってビデオを操作している。
本稿では,ディープフェイク映像の識別技術について検討する。
提案手法では,Euler手法から抽出した特徴を用いて,偽造映像と未修正映像を分類する3つのモデルを訓練する。
論文 参考訳(メタデータ) (2021-01-27T17:37:23Z) - WildDeepfake: A Challenging Real-World Dataset for Deepfake Detection [82.42495493102805]
我々は,インターネットから完全に収集された707のディープフェイクビデオから抽出された7,314の顔シーケンスからなる新しいデータセットWildDeepfakeを紹介した。
既存のWildDeepfakeデータセットと我々のWildDeepfakeデータセットのベースライン検出ネットワークを体系的に評価し、WildDeepfakeが実際により困難なデータセットであることを示す。
論文 参考訳(メタデータ) (2021-01-05T11:10:32Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。