論文の概要: Reject Threshold Adaptation for Open-Set Model Attribution of Deepfake Audio
- arxiv url: http://arxiv.org/abs/2412.01425v1
- Date: Mon, 02 Dec 2024 12:06:50 GMT
- ステータス: 翻訳完了
- システム内更新日: 2024-12-04 15:41:52.005122
- Title: Reject Threshold Adaptation for Open-Set Model Attribution of Deepfake Audio
- Title(参考訳): ディープフェイク音声のオープンセットモデル属性に対するreject Threshold Adaptation
- Authors: Xinrui Yan, Jiangyan Yi, Jianhua Tao, Yujie Chen, Hao Gu, Guanjun Li, Junzuo Zhou, Yong Ren, Tao Xu,
- Abstract要約: 本稿では,rejection threshold adapt (ReTA) を用いたディープフェイク音声のオープンセットモデル帰属のための新しいフレームワークを提案する。
ReTAは、システム指紋の表現を、ターゲットクラスまたはランダムに選択された他のクラスラベルに対応するラベルと組み合わせて訓練する。
拒絶しきい値算出モジュールは、ガウス確率推定を利用して、マッチングと非マッチング再構成誤差の分布に適合する。
- 参考スコア(独自算出の注目度): 37.399771023763485
- License:
- Abstract: Open environment oriented open set model attribution of deepfake audio is an emerging research topic, aiming to identify the generation models of deepfake audio. Most previous work requires manually setting a rejection threshold for unknown classes to compare with predicted probabilities. However, models often overfit training instances and generate overly confident predictions. Moreover, thresholds that effectively distinguish unknown categories in the current dataset may not be suitable for identifying known and unknown categories in another data distribution. To address the issues, we propose a novel framework for open set model attribution of deepfake audio with rejection threshold adaptation (ReTA). Specifically, the reconstruction error learning module trains by combining the representation of system fingerprints with labels corresponding to either the target class or a randomly chosen other class label. This process generates matching and non-matching reconstructed samples, establishing the reconstruction error distributions for each class and laying the foundation for the reject threshold calculation module. The reject threshold calculation module utilizes gaussian probability estimation to fit the distributions of matching and non-matching reconstruction errors. It then computes adaptive reject thresholds for all classes through probability minimization criteria. The experimental results demonstrate the effectiveness of ReTA in improving the open set model attributes of deepfake audio.
- Abstract(参考訳): ディープフェイク音声の生成モデルを特定することを目的とした,オープン環境指向のオープンセットモデル帰結が,新たな研究課題である。
これまでの作業のほとんどは、予測された確率と比較するために、未知のクラスに対して手動で拒絶しきい値を設定する必要がある。
しかし、モデルはしばしばトレーニングインスタンスに適合せず、自信過剰な予測を生成する。
さらに、現在のデータセットにおける未知のカテゴリを効果的に識別する閾値は、他のデータ分布における未知のカテゴリを識別するのに適さないかもしれない。
この問題に対処するために,rejection threshold adapt (ReTA) を用いたディープフェイク音声のオープンセットモデル帰属のための新しいフレームワークを提案する。
特に、再構成誤り学習モジュールは、システム指紋の表現と、ターゲットクラスまたはランダムに選択された他のクラスラベルに対応するラベルとを組み合わせて訓練する。
このプロセスは、マッチングと非マッチングの再構成サンプルを生成し、各クラスに対する再構成エラー分布を確立し、拒絶しきい値計算モジュールの基礎を配置する。
拒絶しきい値算出モジュールは、ガウス確率推定を利用して、マッチングと非マッチング再構成誤差の分布に適合する。
そして、確率最小化基準により、全てのクラスに対する適応的拒絶閾値を計算する。
実験結果から,ReTAがディープフェイク音声のオープンセットモデル特性を改善する効果が示された。
関連論文リスト
- Rejection via Learning Density Ratios [50.91522897152437]
拒絶による分類は、モデルを予測しないことを許容する学習パラダイムとして現れます。
そこで我々は,事前学習したモデルの性能を最大化する理想的なデータ分布を求める。
私たちのフレームワークは、クリーンでノイズの多いデータセットで実証的にテストされます。
論文 参考訳(メタデータ) (2024-05-29T01:32:17Z) - Onboard Out-of-Calibration Detection of Deep Learning Models using Conformal Prediction [4.856998175951948]
本研究では,共形予測アルゴリズムが深層学習モデルの不確かさと関係があることを示し,この関係が深層学習モデルが校正外であるかどうかを検出するのに有効であることを示す。
モデル不確かさと共形予測セットの平均サイズに関連する校正外検出手順を示す。
論文 参考訳(メタデータ) (2024-05-04T11:05:52Z) - Noisy Correspondence Learning with Self-Reinforcing Errors Mitigation [63.180725016463974]
クロスモーダル検索は、実際は精力的な、十分に整合した大規模データセットに依存している。
我々は、新しい雑音対応学習フレームワーク、textbfSelf-textbfReinforcing textbfErrors textbfMitigation(SREM)を導入する。
論文 参考訳(メタデータ) (2023-12-27T09:03:43Z) - OpenMix: Exploring Outlier Samples for Misclassification Detection [37.43981354073841]
我々は、非ターゲットクラスからのラベル付きサンプルとして、容易に利用できる外れ値サンプルを利用して、誤分類エラーを検出する。
オープンワールドの知識を取り入れたOpenMixという新しい手法を提案する。
論文 参考訳(メタデータ) (2023-03-30T01:47:23Z) - Denoising diffusion models for out-of-distribution detection [2.113925122479677]
我々は,確率拡散モデル(DDPM)を自己エンコーダの復号化として活用する。
DDPMを用いてノイズレベルの範囲の入力を再構成し,結果の多次元再構成誤差を用いてアウト・オブ・ディストリビューション入力を分類する。
論文 参考訳(メタデータ) (2022-11-14T20:35:11Z) - Autoencoder Attractors for Uncertainty Estimation [13.618797548020462]
本稿では,オートエンコーダモデルに基づく不確実性推定手法を提案する。
提案手法は,車室内における占有者分類の産業的応用だけでなく,いくつかのデータセットの組み合わせについても検討した。
論文 参考訳(メタデータ) (2022-04-01T12:10:06Z) - Open Set Recognition with Conditional Probabilistic Generative Models [51.40872765917125]
オープンセット認識のための条件付き確率生成モデル(CPGM)を提案する。
CPGMは未知のサンプルを検出できるが、異なる潜在特徴を条件付きガウス分布に近似させることで、既知のクラスを分類できる。
複数のベンチマークデータセットの実験結果から,提案手法がベースラインを著しく上回ることがわかった。
論文 参考訳(メタデータ) (2020-08-12T06:23:49Z) - Ensemble Wrapper Subsampling for Deep Modulation Classification [70.91089216571035]
受信した無線信号のサブサンプリングは、ハードウェア要件と信号処理アルゴリズムの計算コストを緩和するために重要である。
本稿では,無線通信システムにおけるディープラーニングを用いた自動変調分類のためのサブサンプリング手法を提案する。
論文 参考訳(メタデータ) (2020-05-10T06:11:13Z) - Hybrid Models for Open Set Recognition [28.62025409781781]
オープンセット認識は、トレーニングセット内のどのクラスにも属さないサンプルを検出するために分類器を必要とする。
本稿では,入力データを結合埋め込み空間にエンコードするエンコーダと,サンプルを不整クラスに分類する分類器と,フローベース密度推定器からなるOpenHybridを提案する。
標準オープンセットベンチマークの実験では、エンドツーエンドの訓練されたOpenHybridモデルは最先端の手法やフローベースのベースラインを大きく上回っている。
論文 参考訳(メタデータ) (2020-03-27T16:14:27Z) - Progressive Identification of True Labels for Partial-Label Learning [112.94467491335611]
部分ラベル学習(Partial-label Learning, PLL)は、典型的な弱教師付き学習問題であり、各トレーニングインスタンスには、真のラベルである候補ラベルのセットが設けられている。
既存のほとんどの手法は、特定の方法で解決しなければならない制約付き最適化として精巧に設計されており、計算複雑性をビッグデータにスケールアップするボトルネックにしている。
本稿では,モデルと最適化アルゴリズムの柔軟性を備えた分類器の新しいフレームワークを提案する。
論文 参考訳(メタデータ) (2020-02-19T08:35:15Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。