論文の概要: Evolutionary Multi-Objective Fusion of Deepfake Speech Detectors
- arxiv url: http://arxiv.org/abs/2604.01330v1
- Date: Wed, 01 Apr 2026 19:17:59 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-04-03 14:21:09.857916
- Title: Evolutionary Multi-Objective Fusion of Deepfake Speech Detectors
- Title(参考訳): ディープフェイク音声検出器の進化的多目的融合
- Authors: Vojtěch Staněk, Martin Perešíni, Lukáš Sekanina, Anton Firc, Kamil Malinka,
- Abstract要約: 本稿では,検出誤差とシステム複雑性を両立させる多目的スコア融合フレームワークを提案する。
36個のSSLベースの検出器を用いたASVspoof 5データセットの実験では、得られたフロントは単純な平均値とロジスティック回帰基準よりも優れていた。
提案手法は多様なトレードオフソリューションも提供し,精度と計算コストのバランスをとるデプロイメントの選択を可能にする。
- 参考スコア(独自算出の注目度): 0.17398560678845076
- License: http://creativecommons.org/licenses/by-sa/4.0/
- Abstract: While deepfake speech detectors built on large self-supervised learning (SSL) models achieve high accuracy, employing standard ensemble fusion to further enhance robustness often results in oversized systems with diminishing returns. To address this, we propose an evolutionary multi-objective score fusion framework that jointly minimizes detection error and system complexity. We explore two encodings optimized by NSGA-II: binary-coded detector selection for score averaging and a real-valued scheme that optimizes detector weights for a weighted sum. Experiments on the ASVspoof 5 dataset with 36 SSL-based detectors show that the obtained Pareto fronts outperform simple averaging and logistic regression baselines. The real-valued variant achieves 2.37% EER (0.0684 minDCF) and identifies configurations that match state-of-the-art performance while significantly reducing system complexity, requiring only half the parameters. Our method also provides a diverse set of trade-off solutions, enabling deployment choices that balance accuracy and computational cost.
- Abstract(参考訳): 大きな自己教師付き学習(SSL)モデル上に構築されたディープフェイク音声検出器は高い精度を達成するが、堅牢性を高めるために標準アンサンブル融合を用いると、リターンが低下する過大なシステムが発生する。
そこで本研究では,検出誤差とシステム複雑性を両立させる多目的スコア融合フレームワークを提案する。
NSGA-IIにより最適化された2つの符号化について検討する: スコア平均化のためのバイナリ符号化検出器選択と重み付き和に対する検出器重みを最適化する実数値スキーム。
36個のSSLベースの検出器を用いたASVspoof 5データセットの実験では、得られたParetoフロントは単純な平均とロジスティック回帰ベースラインよりも優れていた。
実数値の変種は2.37%のEER(0.0684 minDCF)を達成し、ステート・オブ・ザ・アーツのパフォーマンスにマッチする構成を識別すると同時に、システムの複雑さを著しく低減し、パラメータの半分しか必要としない。
提案手法は多様なトレードオフソリューションも提供し,精度と計算コストのバランスをとるデプロイメントの選択を可能にする。
関連論文リスト
- SMR-Net:Robot Snap Detection Based on Multi-Scale Features and Self-Attention Network [0.0]
従来のビジュアルメソッドは、複雑なシナリオを扱う際に、ロバスト性や大きなローカライゼーションエラーに悩まされる。
本稿では,自己注意型マルチスケールオブジェクト検出アルゴリズムであるSMR-Netを提案する。
A型スナップデータセットとB型スナップデータセットの実験結果は、SMR-Netが従来のFaster R-CNNを大きく上回っていることを示している。
論文 参考訳(メタデータ) (2026-03-01T10:28:01Z) - UFO-DETR: Frequency-Guided End-to-End Detector for UAV Tiny Objects [7.1136620172045]
UAV画像の小さなターゲット検出は、スケールのばらつき、密度分布、小さなターゲットの優位性といった重要な課題に直面している。
本稿では、LSKNetベースのバックボーンネットワークを統合して、受容場を最適化し、パラメータ数を削減できる、エンドツーエンドのオブジェクト検出フレームワークUFO-DETRを提案する。
論文 参考訳(メタデータ) (2026-02-26T07:37:45Z) - A Multi-Step Comparative Framework for Anomaly Detection in IoT Data Streams [0.9208007322096533]
IoT(Internet of Things)デバイスは重要なセキュリティ問題を導入し、正確な異常検出の必要性を強調している。
本稿では,前処理選択が3つの機械学習アルゴリズムに与える影響を評価する多段階評価フレームワークを提案する。
IoTID20データセットの実験は、GBoostingが前処理設定で常に優れた精度を提供することを示している。
論文 参考訳(メタデータ) (2025-05-22T16:28:22Z) - Dense Object Detection Based on De-homogenized Queries [12.33849715319161]
デンス物体検出は、自動走行、ビデオ監視、その他の分野で広く利用されている。
現在、非最大抑圧(NMS)のような欲求的アルゴリズムに基づく検出手法は、密集したシナリオにおいて繰り返し予測や欠落検出をしばしば生成している。
終端から終端までのDETR(Detection TRansformer)をNMSなどの後処理の復号化能力をネットワークに組み込む検知器として利用することで,クエリベースの検出器における均一なクエリがネットワークの復号化能力とエンコーダの学習効率を低下させることがわかった。
論文 参考訳(メタデータ) (2025-02-11T02:36:10Z) - Efficient Decoder-free Object Detection with Transformers [75.00499377197475]
視覚変換器(ViT)は、物体検出アプローチのランドスケープを変化させている。
本稿では,デコーダフリー完全トランス(DFFT)オブジェクト検出器を提案する。
DFFT_SMALLは、トレーニングおよび推論段階で高い効率を達成する。
論文 参考訳(メタデータ) (2022-06-14T13:22:19Z) - Real-Time Scene Text Detection with Differentiable Binarization and
Adaptive Scale Fusion [62.269219152425556]
セグメンテーションに基づくシーンテキスト検出手法はシーンテキスト検出分野において大きな注目を集めている。
本稿では,二項化処理をセグメンテーションネットワークに統合する分散二項化(DB)モジュールを提案する。
アダプティブ・スケール・フュージョン (ASF) モジュールは, 異なるスケールの特徴を適応的に融合させることにより, スケールのロバスト性を向上させる。
論文 参考訳(メタデータ) (2022-02-21T15:30:14Z) - Adaptive Anomaly Detection for Internet of Things in Hierarchical Edge
Computing: A Contextual-Bandit Approach [81.5261621619557]
階層エッジコンピューティング(HEC)を用いた適応型異常検出手法を提案する。
まず,複雑性を増した複数のDNNモデルを構築し,それぞれを対応するHEC層に関連付ける。
そこで我々は、文脈帯域問題として定式化され、強化学習ポリシーネットワークを用いて解決される適応モデル選択スキームを設計する。
論文 参考訳(メタデータ) (2021-08-09T08:45:47Z) - ESAD: End-to-end Deep Semi-supervised Anomaly Detection [85.81138474858197]
正規データと異常データの間のKL偏差を計測する新たな目的関数を提案する。
提案手法は,複数のベンチマークデータセットの最先端性能を著しく上回っている。
論文 参考訳(メタデータ) (2020-12-09T08:16:35Z) - AP-Loss for Accurate One-Stage Object Detection [49.13608882885456]
一段階の物体検出器は、分類損失と局所化損失を同時に最適化することによって訓練される。
前者は、多数のアンカーのため、非常に前景と後方のアンカーの不均衡に悩まされる。
本稿では,一段検知器の分類タスクをランキングタスクに置き換える新しい枠組みを提案する。
論文 参考訳(メタデータ) (2020-08-17T13:22:01Z) - SADet: Learning An Efficient and Accurate Pedestrian Detector [68.66857832440897]
本稿では,一段検出器の検出パイプラインに対する一連の最適化手法を提案する。
効率的な歩行者検出のための単発アンカーベース検出器(SADet)を形成する。
構造的には単純だが、VGA解像度の画像に対して最先端の結果と20ドルFPSのリアルタイム速度を示す。
論文 参考訳(メタデータ) (2020-07-26T12:32:38Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。