論文の概要: Improving Security in McAdams Coefficient-Based Speaker Anonymization by
Watermarking Method
- arxiv url: http://arxiv.org/abs/2107.07223v1
- Date: Thu, 15 Jul 2021 09:56:08 GMT
- ステータス: 処理完了
- システム内更新日: 2021-07-16 22:03:58.794564
- Title: Improving Security in McAdams Coefficient-Based Speaker Anonymization by
Watermarking Method
- Title(参考訳): ウォーターマーキング法によるMcAdams係数に基づく話者匿名化の安全性向上
- Authors: Candy Olivia Mawalim and Masashi Unoki
- Abstract要約: そこで本稿では,McAdams係数に基づく話者匿名化の安全性向上手法を提案する。
提案手法は, 埋込用と検出用という2つの主要なプロセスから構成される。
- 参考スコア(独自算出の注目度): 8.684378639046642
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Speaker anonymization aims to suppress speaker individuality to protect
privacy in speech while preserving the other aspects, such as speech content.
One effective solution for anonymization is to modify the McAdams coefficient.
In this work, we propose a method to improve the security for speaker
anonymization based on the McAdams coefficient by using a speech watermarking
approach. The proposed method consists of two main processes: one for embedding
and one for detection. In embedding process, two different McAdams coefficients
represent binary bits ``0" and ``1". The watermarked speech is then obtained by
frame-by-frame bit inverse switching. Subsequently, the detection process is
carried out by a power spectrum comparison. We conducted objective evaluations
with reference to the VoicePrivacy 2020 Challenge (VP2020) and of the speech
watermarking with reference to the Information Hiding Challenge (IHC) and found
that our method could satisfy the blind detection, inaudibility, and robustness
requirements in watermarking. It also significantly improved the anonymization
performance in comparison to the secondary baseline system in VP2020.
- Abstract(参考訳): 話者匿名化は、話者の個人性を抑制し、音声コンテンツなどの他の側面を保存しながら、音声のプライバシーを保護することを目的としている。
匿名化の効果的な解決策の1つは、マクアダムス係数を変更することである。
本研究では,mcadams係数に基づく話者匿名化の安全性を,音声透かし法を用いて向上させる手法を提案する。
提案手法は, 埋込用と検出用という2つの主要なプロセスから構成される。
埋め込み過程において、2つの異なるマクアダム係数は二進ビット ``0" と ``1 を表す。
次に、フレーム単位のビット逆スイッチングにより、透かし音声を得る。
その後、パワースペクトル比較により検出処理を行う。
我々は,voiceprivacy 2020 challenge (vp2020) と音声透かしについて,情報隠れチャレンジ (ihc) を参考に客観的評価を行い, 透かしにおけるブラインド検出, 可視性, 頑健性要件を満足できることを確認した。
またVP2020のセカンダリベースラインシステムと比較して、匿名化性能も大幅に向上した。
関連論文リスト
- A Benchmark for Multi-speaker Anonymization [9.990701310620368]
本稿では,実世界のアプリケーションを対象としたマルチ話者匿名化ベンチマークを提案する。
カスケードシステムは、話者ダイアリゼーションを使用して、各話者の音声を集約し、話者匿名化を行い、話者のプライバシーを隠蔽し、音声コンテンツを保存する。
非オーバーラップシミュレーションと実世界のデータセットによる実験は、マルチスピーカー匿名化システムの有効性を実証している。
論文 参考訳(メタデータ) (2024-07-08T04:48:43Z) - Asynchronous Voice Anonymization Using Adversarial Perturbation On Speaker Embedding [46.25816642820348]
我々は、人間の知覚を維持しながら、音声認識に対して音声属性を変更することに重点を置いている。
話者ゆがみ機構を組み込んだ音声生成フレームワークを用いて匿名化音声を生成する。
LibriSpeechデータセットで行った実験では、話者の属性は、その人の知覚が処理された発話の60.71%で保存されていることが判明した。
論文 参考訳(メタデータ) (2024-06-12T13:33:24Z) - Improving the Generation Quality of Watermarked Large Language Models
via Word Importance Scoring [81.62249424226084]
トークンレベルの透かしは、トークン確率分布を変更して生成されたテキストに透かしを挿入する。
この透かしアルゴリズムは、生成中のロジットを変化させ、劣化したテキストの品質につながる可能性がある。
We propose to improve the quality of texts generated by a watermarked language model by Watermarking with Importance Scoring (WIS)。
論文 参考訳(メタデータ) (2023-11-16T08:36:00Z) - SemStamp: A Semantic Watermark with Paraphrastic Robustness for Text Generation [72.10931780019297]
既存の透かしアルゴリズムはトークンレベルの設計のため、パラフレーズ攻撃に弱い。
局所性に敏感なハッシュ(LSH)に基づく頑健な文レベルのセマンティック透かしアルゴリズムSemStampを提案する。
実験結果から,本アルゴリズムは従来手法に比べて,従来手法よりも頑健であるだけでなく,生成品質の維持にも有効であることが示唆された。
論文 参考訳(メタデータ) (2023-10-06T03:33:42Z) - Diff-Privacy: Diffusion-based Face Privacy Protection [58.1021066224765]
本稿では,Diff-Privacyと呼ばれる拡散モデルに基づく顔のプライバシー保護手法を提案する。
具体的には、提案したマルチスケール画像インバージョンモジュール(MSI)をトレーニングし、元の画像のSDMフォーマット条件付き埋め込みのセットを得る。
本研究は,条件付き埋め込みに基づいて,組込みスケジューリング戦略を設計し,デノナイズプロセス中に異なるエネルギー関数を構築し,匿名化と視覚的アイデンティティ情報隠蔽を実現する。
論文 参考訳(メタデータ) (2023-09-11T09:26:07Z) - WavMark: Watermarking for Audio Generation [70.65175179548208]
本稿では,わずか1秒の音声スニペット内に最大32ビットの透かしを符号化する,革新的な音声透かしフレームワークを提案する。
透かしは人間の感覚に影響されず、様々な攻撃に対して強い弾力性を示す。
合成音声の効果的な識別子として機能し、オーディオ著作権保護の幅広い応用の可能性を秘めている。
論文 参考訳(メタデータ) (2023-08-24T13:17:35Z) - Anonymizing Speech: Evaluating and Designing Speaker Anonymization
Techniques [1.2691047660244337]
音声ユーザインタフェースの利用が増加し、音声データの収集と保存が急増した。
本論文は、音声の匿名化と匿名化の程度を評価するためのソリューションを提案する。
論文 参考訳(メタデータ) (2023-08-05T16:14:17Z) - Symmetric Saliency-based Adversarial Attack To Speaker Identification [17.087523686496958]
我々は、対称サリエンシに基づくエンコーダデコーダ(SSED)と呼ばれる、新しい世代ネットワークベースのアプローチを提案する。
まず,新規な唾液マップデコーダを用いて,対象話者識別システムの決定に対する音声サンプルの重要性を学習する。
第2に,話者を音源から遠ざける角度損失関数を提案する。
論文 参考訳(メタデータ) (2022-10-30T08:54:02Z) - Speaker anonymisation using the McAdams coefficient [19.168733328810962]
本稿では,既存の手法とは異なり,トレーニングデータを必要としない匿名化アプローチについて報告する。
提案手法は,McAdams係数を用いて音声信号のスペクトル包絡を変換する。
結果は、ランダムに最適化された変換が匿名化の点で競合する解より優れていることを示している。
論文 参考訳(メタデータ) (2020-11-02T17:07:17Z) - Design Choices for X-vector Based Speaker Anonymization [48.46018902334472]
第1回VoicePrivacy Challengeのベースラインとして,フレキシブルな擬似話者選択手法を提案する。
LibriSpeechから派生したデータセットを使用して実験を行い、プライバシとユーティリティの観点から設計選択の最適な組み合わせを見つける。
論文 参考訳(メタデータ) (2020-05-18T11:32:14Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。