論文の概要: Face Forensics in the Wild
- arxiv url: http://arxiv.org/abs/2103.16076v1
- Date: Tue, 30 Mar 2021 05:06:19 GMT
- ステータス: 処理完了
- システム内更新日: 2021-04-01 02:51:05.592381
- Title: Face Forensics in the Wild
- Title(参考訳): 野生の鑑識と対面する
- Authors: Tianfei Zhou, Wenguan Wang, Zhiyuan Liang, Jianbing Shen
- Abstract要約: 我々は、ffiw-10kと呼ばれる新しい大規模データセットを構築し、高品質の偽造ビデオ1万本を含む。
操作手順は完全自動で、ドメイン対逆品質評価ネットワークによって制御されます。
さらに,多人数顔偽造検出の課題に取り組むための新しいアルゴリズムを提案する。
- 参考スコア(独自算出の注目度): 121.23154918448618
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: On existing public benchmarks, face forgery detection techniques have
achieved great success. However, when used in multi-person videos, which often
contain many people active in the scene with only a small subset having been
manipulated, their performance remains far from being satisfactory. To take
face forgery detection to a new level, we construct a novel large-scale
dataset, called FFIW-10K, which comprises 10,000 high-quality forgery videos,
with an average of three human faces in each frame. The manipulation procedure
is fully automatic, controlled by a domain-adversarial quality assessment
network, making our dataset highly scalable with low human cost. In addition,
we propose a novel algorithm to tackle the task of multi-person face forgery
detection. Supervised by only video-level label, the algorithm explores
multiple instance learning and learns to automatically attend to tampered
faces. Our algorithm outperforms representative approaches for both forgery
classification and localization on FFIW-10K, and also shows high generalization
ability on existing benchmarks. We hope that our dataset and study will help
the community to explore this new field in more depth.
- Abstract(参考訳): 既存の公開ベンチマークでは、顔偽造検出技術は大きな成功を収めている。
しかし、少数のサブセットしか操作されていないシーンで多くの人が活躍するマルチパーソンビデオで使用される場合、そのパフォーマンスは満足できないままである。
ffiw-10kという,1万の高品質の偽造ビデオからなり,各フレームに平均3人の顔を持つ,新しい大規模データセットを構築した。
操作手順は完全に自動化され、ドメイン敵の品質評価ネットワークによって制御されます。
さらに,多人数顔偽造検出の課題に取り組むための新しいアルゴリズムを提案する。
ビデオレベルのラベルのみによって監督され、アルゴリズムは複数のインスタンス学習を探索し、改ざんされた顔に自動的に出席するように学習する。
提案アルゴリズムは,FFIW-10K上での偽分類とローカライゼーションの両方の代表的な手法よりも優れ,既存のベンチマークで高い一般化能力を示す。
私たちのデータセットと研究が、コミュニティがこの新しい分野をより深く探求するのに役立つことを願っています。
関連論文リスト
- Semantics-Oriented Multitask Learning for DeepFake Detection: A Joint Embedding Approach [77.65459419417533]
本稿ではセマンティクス指向のDeepFake検出タスクをサポートするための自動データセット拡張手法を提案する。
また,顔画像とそれに対応するラベルを併用して予測を行う。
提案手法は,DeepFake検出の一般化性を向上し,人間の理解可能な説明を提供することで,ある程度のモデル解釈を行う。
論文 参考訳(メタデータ) (2024-08-29T07:11:50Z) - UniForensics: Face Forgery Detection via General Facial Representation [60.5421627990707]
高レベルの意味的特徴は摂動の影響を受けにくく、フォージェリー固有の人工物に限らないため、より強い一般化がある。
我々は、トランスフォーマーベースのビデオネットワークを活用する新しいディープフェイク検出フレームワークUniForensicsを導入し、顔の豊かな表現のためのメタファンクショナルな顔分類を行う。
論文 参考訳(メタデータ) (2024-07-26T20:51:54Z) - Unmasking Deepfakes: Masked Autoencoding Spatiotemporal Transformers for
Enhanced Video Forgery Detection [19.432851794777754]
本稿では,自己教師型マスク自動符号化装置によって事前訓練された視覚変換器を用いたディープフェイク映像の検出手法を提案する。
提案手法は,ビデオの個々のRGBフレームから空間情報を学習することに焦点を当てた2つのコンポーネントで構成され,一方は連続するフレームから生成された光フロー場から時間的整合性情報を学習する。
論文 参考訳(メタデータ) (2023-06-12T05:49:23Z) - OpenForensics: Large-Scale Challenging Dataset For Multi-Face Forgery
Detection And Segmentation In-The-Wild [48.67582300190131]
本稿では,多面フォージェリ検出とセグメント化という2つの新しい対策課題について述べる。
制約のない自然の場面で、複数の人間の顔に偽の顔を置くことは、従来のディープフェイク認識タスクよりもはるかに難しい。
豊富なアノテーションによって、私たちのOpenForensicsデータセットは、ディープフェイク防止と一般的な人間の顔検出の両方の研究に大きな可能性を秘めています。
論文 参考訳(メタデータ) (2021-07-30T08:15:41Z) - Fast Facial Landmark Detection and Applications: A Survey [0.0]
ここ数年で品質が大幅に向上したアプローチは、大きなポーズと感情の多様性を持つデータセットに重点を置いています。
そこで我々は,300-W,AFLW,WFLW,COFWという,難易度と最新度のデータセットの品質比較を行った。
論文 参考訳(メタデータ) (2021-01-12T09:40:40Z) - Self-supervised Human Detection and Segmentation via Multi-view
Consensus [116.92405645348185]
本稿では,トレーニング中に幾何学的制約を多視点一貫性という形で組み込むマルチカメラフレームワークを提案する。
本手法は,標準ベンチマークから視覚的に外れた画像に対して,最先端の自己監視的人物検出とセグメンテーション技術に勝ることを示す。
論文 参考訳(メタデータ) (2020-12-09T15:47:21Z) - DeeperForensics-1.0: A Large-Scale Dataset for Real-World Face Forgery
Detection [93.24684159708114]
DeeperForensics-1.0は、これまでで最大の顔偽造検出データセットであり、合計で1760万フレームの6万本のビデオで構成されている。
生成されたビデオの品質は、既存のデータセットよりも優れており、ユーザ研究によって検証されている。
このベンチマークには隠れたテストセットがあり、人間の評価において高い認識スコアを達成する操作されたビデオを含んでいる。
論文 参考訳(メタデータ) (2020-01-09T14:37:17Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。