Fugu-MT 論文翻訳(概要): Dynamic texture analysis for detecting fake faces in video sequences

論文の概要: Dynamic texture analysis for detecting fake faces in video sequences

arxiv url: http://arxiv.org/abs/2007.15271v1
Date: Thu, 30 Jul 2020 07:21:24 GMT
ステータス: 翻訳完了
システム内更新日: 2022-11-05 14:41:57.609416
Title: Dynamic texture analysis for detecting fake faces in video sequences
Title（参考訳）: 映像中の偽顔検出のための動的テクスチャ解析
Authors: Mattia Bonomi and Cecilia Pasquini and Giulia Boato
Abstract要約: 本研究では,映像信号のテクスチャ・時間的ダイナミクスの解析について検討する。目標は、実際の偽のシーケンスを識別し、識別することである。時間セグメントの連成解析に基づいて複数の二分決定を構築することを提案する。
参考スコア（独自算出の注目度）: 6.1356022122903235
License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
Abstract: The creation of manipulated multimedia content involving human characters has reached in the last years unprecedented realism, calling for automated techniques to expose synthetically generated faces in images and videos. This work explores the analysis of spatio-temporal texture dynamics of the video signal, with the goal of characterizing and distinguishing real and fake sequences. We propose to build a binary decision on the joint analysis of multiple temporal segments and, in contrast to previous approaches, to exploit the textural dynamics of both the spatial and temporal dimensions. This is achieved through the use of Local Derivative Patterns on Three Orthogonal Planes (LDP-TOP), a compact feature representation known to be an important asset for the detection of face spoofing attacks. Experimental analyses on state-of-the-art datasets of manipulated videos show the discriminative power of such descriptors in separating real and fake sequences, and also identifying the creation method used. Linear Support Vector Machines (SVMs) are used which, despite the lower complexity, yield comparable performance to previously proposed deep models for fake content detection.
Abstract（参考訳）: 人間のキャラクターを含む操作されたマルチメディアコンテンツの作成は、過去数年で前例のないリアリズムに達し、画像やビデオに合成生成された顔を公開する自動化技術を求めている。本研究は,映像信号の時空間的テクスチャダイナミクスの解析を行い,実数列と偽数列を特徴付けることを目的とする。本稿では,複数時間セグメントの連成解析に基づく二項決定法を提案し,従来の手法とは対照的に空間次元と時間次元の両方のテクスチャダイナミクスを利用する。これは、3次元直交平面上の局所微分パターン(LDP-TOP)を用いることで達成される。操作されたビデオの最先端のデータセットに関する実験的解析は、実際のシーケンスと偽のシーケンスを分離するディスクリプタの識別能力を示し、また、使用される生成方法を特定する。線形サポートベクトルマシン(SVM)は、複雑さが低いにもかかわらず、以前に提案された偽コンテンツ検出のためのディープモデルと同等の性能を持つ。

関連論文リスト

Spotting tell-tale visual artifacts in face swapping videos: strengths and pitfalls of CNN detectors [2.89209645531276]
ビデオストリームにおける顔交換操作は、リモートビデオ通信における脅威の増大を表している。近年の文献では,ビデオフレームに導入された視覚的アーティファクトを,アルゴリズムのスワップによって特徴付け,活用することを提案する。本稿では,2つのデータコーパス上でのCNNに基づくデータ駆動モデルのベンチマークにより,本手法の有効性について検討する。
論文参考訳（メタデータ） (2025-06-19T17:51:11Z)
DiffusionSfM: Predicting Structure and Motion via Ray Origin and Endpoint Diffusion [53.70278210626701]
マルチビュー画像から3次元シーン形状とカメラポーズを直接推定するデータ駆動型マルチビュー推論手法を提案する。我々のフレームワークであるDiffusionSfMは、シーン幾何学とカメラを、グローバルフレーム内のピクセルワイズ線源とエンドポイントとしてパラメータ化します。我々は、DiffusionSfMを合成データセットと実データセットの両方で実証的に検証し、古典的および学習ベースのアプローチよりも優れていることを示す。
論文参考訳（メタデータ） (2025-05-08T17:59:47Z)
Extending Information Bottleneck Attribution to Video Sequences [4.996373299748921]
本稿では,映像系列への帰属にインフォメーション・ボトルネックを適応させることにより,説明可能な映像分類のための新しいアプローチであるVIBAを紹介する。以上の結果から,VIBAは時間的・空間的に一貫した説明を発生し,人間のアノテーションと密接に一致していることが示唆された。
論文参考訳（メタデータ） (2025-01-28T12:19:44Z)
Pre-training for Action Recognition with Automatically Generated Fractal Datasets [23.686476742398973]
本稿では,短い合成ビデオクリップの大規模データセットを自動生成する手法を提案する。生成されたビデオクリップは、複雑なマルチスケール構造を生成するフラクタルの自然能力に起因した顕著な多様性によって特徴づけられる。通常のKineeticsの事前トレーニングと比較すると、報告結果が近くなり、下流のデータセットよりも優れています。
論文参考訳（メタデータ） (2024-11-26T16:51:11Z)
UniForensics: Face Forgery Detection via General Facial Representation [60.5421627990707]
高レベルの意味的特徴は摂動の影響を受けにくく、フォージェリー固有の人工物に限らないため、より強い一般化がある。我々は、トランスフォーマーベースのビデオネットワークを活用する新しいディープフェイク検出フレームワークUniForensicsを導入し、顔の豊かな表現のためのメタファンクショナルな顔分類を行う。
論文参考訳（メタデータ） (2024-07-26T20:51:54Z)
Compressed Deepfake Video Detection Based on 3D Spatiotemporal Trajectories [10.913345858983275]
悪意あるアクターによるディープフェイク技術は、国家、社会、個人に潜在的な脅威をもたらす。本稿では,3次元動作特徴に基づくディープフェイク映像検出手法を提案する。提案手法は良好な結果をもたらし,実用化の可能性を示す。
論文参考訳（メタデータ） (2024-04-28T11:48:13Z)
Diffusion Priors for Dynamic View Synthesis from Monocular Videos [59.42406064983643]
ダイナミックノベルビュー合成は、ビデオ内の視覚的コンテンツの時間的進化を捉えることを目的としている。まず、ビデオフレーム上に予め訓練されたRGB-D拡散モデルをカスタマイズ手法を用いて微調整する。動的および静的なニューラルレイディアンス場を含む4次元表現に、微調整されたモデルから知識を蒸留する。
論文参考訳（メタデータ） (2024-01-10T23:26:41Z)
Appearance-Based Refinement for Object-Centric Motion Segmentation [85.2426540999329]
本稿では,ビデオストリームの時間的一貫性を利用して,不正確なフローベース提案を補正する外観に基づく改善手法を提案する。提案手法では,高精度なフロー予測マスクを模範として,シーケンスレベルの選択機構を用いる。パフォーマンスは、DAVIS、YouTube、SegTrackv2、FBMS-59など、複数のビデオセグメンテーションベンチマークで評価されている。
論文参考訳（メタデータ） (2023-12-18T18:59:51Z)
Parents and Children: Distinguishing Multimodal DeepFakes from Natural Images [60.34381768479834]
近年の拡散モデルの発展により、自然言語のテキストプロンプトから現実的なディープフェイクの生成が可能になった。我々は、最先端拡散モデルにより生成されたディープフェイク検出に関する体系的研究を開拓した。
論文参考訳（メタデータ） (2023-04-02T10:25:09Z)
HighlightMe: Detecting Highlights from Human-Centric Videos [52.84233165201391]
我々は,人間中心のビデオからハイライト可能な抜粋を検出するために,ドメインとユーザに依存しないアプローチを提案する。本研究では,時空間グラフ畳み込みを用いたオートエンコーダネットワークを用いて,人間の活動やインタラクションを検出する。我々は,最先端の手法に比べて,人手によるハイライトのマッチングの平均精度が4～12%向上したことを観察した。
論文参考訳（メタデータ） (2021-10-05T01:18:15Z)
Scene Synthesis via Uncertainty-Driven Attribute Synchronization [52.31834816911887]
本稿では,3次元シーンの多様な特徴パターンを捉えるニューラルシーン合成手法を提案する。提案手法は,ニューラルネットワークと従来のシーン合成手法の双方の長所を結合する。
論文参考訳（メタデータ） (2021-08-30T19:45:07Z)
Interpretable and Trustworthy Deepfake Detection via Dynamic Prototypes [20.358053429294458]
視覚的説明の一形態として動的プロトタイプを用いて顔画像の偽造を検知する新しい人間中心のアプローチを提案する。大規模な実験結果から、DPNetは、目に見えないテストデータセットでさえ、競争力のある予測性能を達成することが示された。
論文参考訳（メタデータ） (2020-06-28T00:25:34Z)
DeepFake Detection by Analyzing Convolutional Traces [0.0]
我々は,人間の顔のディープフェイクの分析に着目し,新しい検出方法を提案する。提案手法は, 予測最大化(EM)アルゴリズムを用いて, 基礎となる畳み込み生成過程をモデル化するための局所的特徴の集合を抽出する。その結果、異なるアーキテクチャと対応する生成過程を区別する手法の有効性が示された。
論文参考訳（メタデータ） (2020-04-22T09:02:55Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。