論文の概要: Fusion-SSAT: Unleashing the Potential of Self-supervised Auxiliary Task by Feature Fusion for Generalized Deepfake Detection
- arxiv url: http://arxiv.org/abs/2601.00789v1
- Date: Fri, 02 Jan 2026 18:47:36 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-01-05 15:04:33.625537
- Title: Fusion-SSAT: Unleashing the Potential of Self-supervised Auxiliary Task by Feature Fusion for Generalized Deepfake Detection
- Title(参考訳): Fusion-SSAT: 一般化ディープフェイク検出のための特徴フュージョンによる自己監督補助タスクの可能性
- Authors: Shukesh Reddy, Srijan Das, Abhijit Das,
- Abstract要約: 自己監督型補助タスクから特徴表現を融合させることが,課題に対する強力な特徴表現であることを示す。
私たちは、FaceForensics++、Celeb-DF、DFD、FaceShifter、UADFVを含む、大規模なデータセットの実験を行った。
その結果,現在の最先端検出器と比較して,データセット間評価の一般化性が向上した。
- 参考スコア(独自算出の注目度): 14.443591751734987
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: In this work, we attempted to unleash the potential of self-supervised learning as an auxiliary task that can optimise the primary task of generalised deepfake detection. To explore this, we examined different combinations of the training schemes for these tasks that can be most effective. Our findings reveal that fusing the feature representation from self-supervised auxiliary tasks is a powerful feature representation for the problem at hand. Such a representation can leverage the ultimate potential and bring in a unique representation of both the self-supervised and primary tasks, achieving better performance for the primary task. We experimented on a large set of datasets, which includes DF40, FaceForensics++, Celeb-DF, DFD, FaceShifter, UADFV, and our results showed better generalizability on cross-dataset evaluation when compared with current state-of-the-art detectors.
- Abstract(参考訳): 本研究では,一般化深度検出の主課題を最適化できる補助課題として,自己指導型学習の可能性の解き放つことを試みた。
そこで本研究では,これらの課題に対する学習方法の組み合わせについて検討した。
本研究は, 自己指導型補助課題から特徴表現を融合させることが, 課題に対する強力な特徴表現であることを示す。
このような表現は究極のポテンシャルを生かし、自己監督されたタスクと一次タスクの両方のユニークな表現をもたらし、一次タスクのより良いパフォーマンスを達成する。
DF40, FaceForensics++, Celeb-DF, DFD, FaceShifter, UADFVを含む大規模なデータセットを実験した結果, 現状の検出器と比較して, クロスデータセット評価の一般化性が向上した。
関連論文リスト
- A Real-Time Multi-Task Learning System for Joint Detection of Face,
Facial Landmark and Head Pose [3.661587008381534]
極度の頭位姿勢は、さまざまな顔分析タスクに共通の課題をもたらす。
本稿では,これらのタスクの統合,特に大角顔のポーズによって生じる複雑さに対処することに焦点を当てる。
本研究の主な貢献は,リアルタイムマルチタスク検出システムの提案である。
論文 参考訳(メタデータ) (2023-09-21T04:15:26Z) - Functional Knowledge Transfer with Self-supervised Representation
Learning [11.566644244783305]
本研究では,機能的知識伝達の方向における自己指導型表現学習の未探索ユーザビリティについて検討する。
本研究では,自己教師型学習課題と教師型学習課題の協調最適化により,機能的知識伝達を実現する。
論文 参考訳(メタデータ) (2023-03-12T21:14:59Z) - Composite Learning for Robust and Effective Dense Predictions [81.2055761433725]
マルチタスク学習は、目標タスクを補助タスクと協調的に最適化することで、より優れたモデル一般化を約束する。
自己監督型(補助的)タスクと密接な予測(目標)タスクを共同でトレーニングすることで、目標タスクの性能を継続的に向上し、補助タスクのラベル付けの必要性を排除できることが判明した。
論文 参考訳(メタデータ) (2022-10-13T17:59:16Z) - Provable Benefits of Representational Transfer in Reinforcement Learning [59.712501044999875]
本稿では,RLにおける表現伝達の問題について検討し,エージェントがまず複数のソースタスクを事前訓練し,共有表現を発見する。
本稿では,ソースタスクに対する生成的アクセスが与えられた場合,次に続く線形RL手法がほぼ最適ポリシーに迅速に収束する表現を発見できることを示す。
論文 参考訳(メタデータ) (2022-05-29T04:31:29Z) - On Exploring Pose Estimation as an Auxiliary Learning Task for
Visible-Infrared Person Re-identification [66.58450185833479]
本稿では,Pose Estimationを補助学習タスクとして活用して,エンドツーエンドフレームワークにおけるVI-ReIDタスクを支援する。
これら2つのタスクを相互に有利な方法で共同でトレーニングすることにより、高品質なモダリティ共有とID関連の特徴を学習する。
2つのベンチマークVI-ReIDデータセットの実験結果から,提案手法は一定のマージンで最先端の手法を継続的に改善することが示された。
論文 参考訳(メタデータ) (2022-01-11T09:44:00Z) - Reinforcement Learning with Prototypical Representations [114.35801511501639]
Proto-RLは、プロトタイプ表現を通じて表現学習と探索を結び付ける自己監督型フレームワークである。
これらのプロトタイプは、エージェントの探索経験の要約と同時に、観察を表す基盤としても機能する。
これにより、困難な連続制御タスクのセットで最新の下流ポリシー学習が可能になります。
論文 参考訳(メタデータ) (2021-02-22T18:56:34Z) - Reinforcement Learning for Sparse-Reward Object-Interaction Tasks in a
First-person Simulated 3D Environment [73.9469267445146]
高忠実な3Dシミュレーション環境において、AI2Thorのような一対一のオブジェクトインタラクションタスクは、強化学習エージェントに顕著なサンプル効率の課題をもたらす。
補助的なタスクとして注意的オブジェクトモデルを学ぶことで、監督なしに、ゼロからオブジェクトインタラクションタスクを学習できることが示される。
論文 参考訳(メタデータ) (2020-10-28T19:27:26Z) - FairMOT: On the Fairness of Detection and Re-Identification in Multiple
Object Tracking [92.48078680697311]
マルチオブジェクトトラッキング(MOT)はコンピュータビジョンにおいて重要な問題である。
本稿では,FairMOTと呼ばれる,アンカーフリーなオブジェクト検出アーキテクチャCenterNetをベースとした,シンプルかつ効果的なアプローチを提案する。
このアプローチは、検出と追跡の両方において高い精度を達成する。
論文 参考訳(メタデータ) (2020-04-04T08:18:00Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。