論文の概要: The Deepfakes We Missed: We Built Detectors for a Threat That Didn't Arrive
- arxiv url: http://arxiv.org/abs/2605.12075v1
- Date: Tue, 12 May 2026 13:02:13 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-05-13 21:48:56.87058
- Title: The Deepfakes We Missed: We Built Detectors for a Threat That Didn't Arrive
- Title(参考訳): 私たちが見逃したディープフェイク:怖くない脅威の検知器を私たちは作った
- Authors: Shaina Raza,
- Abstract要約: 本稿は、フィールドが用意した脅威が到着せず、到達した脅威が著しく異なることを論じる。
2022-2026年のディープフェイク事件の報告によると、支配的な害は、ピアジェネレーションのNon-Consensual Intimate Imagery(NCII)、家族やファイナンスワーカーをターゲットにした音声クローン詐欺、感情操作詐欺である。
ML研究コミュニティは、実際に成長している有害カテゴリーに対して、研究アジェンダを実質的に再バランスさせるべきだ、と我々は主張する。
- 参考スコア(独自算出の注目度): 7.322569681160197
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Nearly a decade of Machine Learning (ML) research on deepfake detection has been organized around a threat model inherited from 2017--2019, revolving around face-swap and talking-head manipulation of public figures, motivated by concerns about large-scale misinformation and video-evidence fraud. This position paper argues that the threat the field prepared for did not arrive, and the threats that did arrive are substantially different. An accounting of deepfake incidents in 2022--2026 shows that the dominant observed harms are peer-generated Non-Consensual Intimate Imagery (NCII), voice-clone scam calls targeting families and finance workers, and emotional-manipulation fraud. The predicted large-scale public-figure deepfake catastrophe did not materialize during the 2024 global information environment despite extensive preparation. Meanwhile, research effort, benchmarks, and detection methods remain concentrated on the inherited threat model. The central claim of this paper is that this misalignment is now the dominant bottleneck on real-world deepfake defense, not model capability. We argue the ML research community should substantially rebalance its research agenda toward the harm categories that are actually growing. We support this position with empirical accounting of research effort and harm distribution, identify the structural reasons the misalignment persists, and outline three concrete technical research agendas for the under-defended harm categories.
- Abstract(参考訳): ディープフェイク検出に関する機械学習(ML)研究の10年近くが、2017年から2019年にかけて受け継がれた脅威モデルを中心に組織されている。
このポジションペーパーでは、フィールドが準備した脅威が到着せず、到着した脅威は実質的に異なると論じている。
2022-2026年のディープフェイク事件の報告によると、支配的な害は、ピアジェネレーションのNon-Consensual Intimate Imagery(NCII)、家族やファイナンスワーカーをターゲットにした音声クローン詐欺、感情操作詐欺である。
2024年の世界情報環境において、大規模な公共施設の深層災害は大規模な準備にもかかわらず実現しなかった。
一方、研究の努力、ベンチマーク、検出方法は継承された脅威モデルに集中している。
本論文の中心的な主張は、このミスアライメントが、現在、モデル能力ではなく、現実世界のディープフェイク防衛における主要なボトルネックとなっていることである。
ML研究コミュニティは、実際に成長している有害カテゴリーに対して、研究アジェンダを実質的に再バランスさせるべきだ、と我々は主張する。
我々は、この立場を、研究努力の実証的な説明と害分布を用いて支援し、不一致が持続する構造的理由を特定し、未解決の害カテゴリーに関する3つの具体的な技術研究課題を概説する。
関連論文リスト
- Zero-Shot Visual Deepfake Detection: Can AI Predict and Prevent Fake Content Before It's Created? [7.89029114152292]
デジタルセキュリティ、メディアの完全性、および公的な信頼に対するディープフェイクの脅威は急速に増加している。
本研究は、モデルが特定のディープフェイク変化を見たことがない場合でも、ゼロショットディープフェイク検出(ゼロショットディープフェイク検出)を新たに行う方法である。
論文 参考訳(メタデータ) (2025-09-22T22:33:16Z) - Identity Deepfake Threats to Biometric Authentication Systems: Public and Expert Perspectives [18.51811906909478]
生成AI(Gen-AI)のディープフェイクは、バイオメトリック認証に対して急速に進化する脅威となる。
専門家は、顔や音声認識などの静的なモダリティの偽造について、重大な懸念を表明している。
本稿では、悪意あるアクターが生体認証システムに対して使用する特定の攻撃ベクトルをマッピングする新しいDeepfake Kill Chainモデルを提案する。
論文 参考訳(メタデータ) (2025-06-07T15:02:23Z) - Adversarial Alignment for LLMs Requires Simpler, Reproducible, and More Measurable Objectives [52.863024096759816]
相反する研究目的は、過去10年間に敵対的堅牢性研究の進展を妨げてきた。
我々は、対立するアライメントの有意義な進展には、リアライメントの目的が必要であると論じる。
論文 参考訳(メタデータ) (2025-02-17T15:28:40Z) - Harmful Fine-tuning Attacks and Defenses for Large Language Models: A Survey [7.945893812374361]
近年の研究では、ファインチューニング・アズ・ア・サービス・ビジネスモデルが深刻な安全上の懸念を浮き彫りにしている。
有害な微調整攻撃として知られるこの攻撃は、コミュニティの間で幅広い研究の関心を集めている。
本稿では,有害な微調整の3つの側面,すなわちアタック・セッティング,ディフェンス・デザイン,評価方法論について概観する。
論文 参考訳(メタデータ) (2024-09-26T17:55:22Z) - Designing an attack-defense game: how to increase robustness of
financial transaction models via a competition [69.08339915577206]
金融セクターにおける悪意ある攻撃のエスカレートリスクを考えると、機械学習モデルの敵戦略と堅牢な防御メカニズムを理解することが重要である。
本研究の目的は、逐次的な財務データを入力として使用するニューラルネットワークモデルに対する敵攻撃と防御の現状とダイナミクスを調査することである。
我々は、現代の金融取引データにおける問題の現実的かつ詳細な調査を可能にする競争を設計した。
参加者は直接対決するので、実生活に近い環境で攻撃や防御が検討される。
論文 参考訳(メタデータ) (2023-08-22T12:53:09Z) - Deep Fake Detection, Deterrence and Response: Challenges and
Opportunities [3.411353611073677]
カナダの組織の78%が2020年に少なくとも1回のサイバー攻撃を経験している。
専門家は、サイバー犯罪による世界的な損失が2025年までに年間10.5兆ドルに達すると予想している。
ディープフェイクはフェイクニュース、偽ニュース、リベンジポルノ、金融詐欺を制作する可能性に注意を向けた。
論文 参考訳(メタデータ) (2022-11-26T21:23:30Z) - Fact-Saboteurs: A Taxonomy of Evidence Manipulation Attacks against
Fact-Verification Systems [80.3811072650087]
証拠のクレームサレントスニペットを微調整し,多様かつクレームアラインな証拠を生成することが可能であることを示す。
この攻撃は、主張のポストホックな修正に対しても堅牢である。
これらの攻撃は、インスペクタブルとヒューマン・イン・ザ・ループの使用シナリオに有害な影響を及ぼす可能性がある。
論文 参考訳(メタデータ) (2022-09-07T13:39:24Z) - The Emerging Threats of Deepfake Attacks and Countermeasures [0.0]
Deepfake Technology(DT)は、新しいレベルの洗練を遂げました。
ディープフェイクによって世界中の企業、政治、司法システムに提示される脅威を強調する。
論文 参考訳(メタデータ) (2020-12-14T22:40:49Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。