Fugu-MT 論文翻訳(概要): DiffAnon: Diffusion-based Prosody Control for Voice Anonymization

論文の概要: DiffAnon: Diffusion-based Prosody Control for Voice Anonymization

arxiv url: http://arxiv.org/abs/2604.26281v1
Date: Wed, 29 Apr 2026 04:22:59 GMT
ステータス: 翻訳完了
システム内更新日: 2026-04-30 15:59:36.253393
Title: DiffAnon: Diffusion-based Prosody Control for Voice Anonymization
Title（参考訳）: DiffAnon:音声匿名化のための拡散に基づく韻律制御
Authors: Ismail Rasim Ulgen, Zexin Cai, Nicholas Andrews, Philipp Koehn, Berrak Sisman,
Abstract要約: プロソディ保存を連続的に制御する拡散型匿名化手法DiffAnonを提案する。実験では、構造化されたトレードオフ動作を示し、コントロール可能な運用ポイント間での競合プライバシーを維持しながら、強力なユーティリティを実現する。
参考スコア（独自算出の注目度）: 22.52514120166268
License: http://creativecommons.org/licenses/by/4.0/
Abstract: To preserve or not to preserve prosody is a central question in voice anonymization. Prosody conveys meaning and affect, yet is tightly coupled with speaker identity. Existing methods either discard prosody for privacy or lack a principled mechanism to control the utility-privacy trade-off, operating at fixed design points. We propose DiffAnon, a diffusion-based anonymization method with classifier-free guidance (CFG) that provides explicit, continuous inference-time control over prosody preservation. DiffAnon refines acoustic detail over semantic embeddings of an RVQ codec, enabling smooth interpolation between anonymization strength and prosodic fidelity within a single model. To the best of our knowledge, it is the first voice anonymization framework to provide structured, interpolatable inference-time prosody control. Experiments demonstrate structured trade-off behavior, achieving strong utility while maintaining competitive privacy across controllable operating points.
Abstract（参考訳）: 韻律を保存するか否かは、音声匿名化における中心的な問題である。韻律は意味と影響を伝達するが、話者のアイデンティティと強く結びついている。既存の方法は、プライバシのためにプロソディを破棄するか、固定設計ポイントで運用するユーティリティプライバシトレードオフを制御するための原則的なメカニズムを欠くかのどちらかである。そこで我々は,DiffAnonを提案する。DiffAnonは拡散に基づく匿名化手法で,韻律保存の明示的かつ連続的な推論時間制御を実現する。 DiffAnonは、RVQコーデックのセマンティック埋め込みに関する音響的詳細を洗練し、単一のモデルにおける匿名化強度と韻律忠実度の間の滑らかな補間を可能にする。我々の知る限りでは、構造化され、解釈可能な推論時韻律制御を提供する最初の音声匿名化フレームワークである。実験では、構造化されたトレードオフ動作を示し、コントロール可能な運用ポイント間での競合プライバシーを維持しながら、強力なユーティリティを実現する。

関連論文リスト

Mask-Free Privacy Extraction and Rewriting: A Domain-Aware Approach via Prototype Learning [13.300036863281996]
プライバシーに敏感なドメインに対するDAMPER(Domain-Aware Mask-free Privacy extract and Rewriting)を提案する。 Damperは、遅延プライバシーセマンティクスを、対照的な学習を通じてコンパクトなドメインプライバシプロトタイプに運用する。サンプリングベースのExponential Mechanismを統合し、厳密なスパンレベルの差分プライバシー保証を提供する。
論文参考訳（メタデータ） (2026-04-11T10:21:00Z)
You Only Anonymize What Is Not Intent-Relevant: Suppressing Non-Intent Privacy Evidence [25.1631668864743]
目的条件付き露光制御を行うユーティリティ保存匿名化手法を提案する。 IntentAnonyは実用的な意図をモデル化し、プライバシ推論エビデンスチェーンを構築する。その結果、プライバシーとユーティリティのトレードオフ全体の約30%の改善が示されている。
論文参考訳（メタデータ） (2026-01-07T07:54:23Z)
VoxGuard: Evaluating User and Attribute Privacy in Speech via Membership Inference Attacks [51.68795949691009]
差分プライバシとメンバシップ推論に基づくフレームワークであるVoxGuardを紹介した。属性については, 匿名化後も, 性別やアクセントをほぼ完全精度で再現できることが示唆された。以上の結果から,EERはリークを著しく過小評価し,低FPR評価の必要性を浮き彫りにしている。
論文参考訳（メタデータ） (2025-09-22T20:57:48Z)
Knockoffs Inference under Privacy Constraints [7.615990547453691]
差分プライバシーパラダイム内でのノックオフ推論のための包括的フレームワークを提案する。提案手法は,元のモデル-Xのノックオフ手順に係わる正確なFDR制御を保ちながら,堅牢なプライバシ保護を保証する。
論文参考訳（メタデータ） (2025-06-11T13:06:21Z)
VoiceCloak: A Multi-Dimensional Defense Framework against Unauthorized Diffusion-based Voice Cloning [14.907575859145423]
拡散モデル(DM)は現実的な音声クローニング(VC)において顕著な成功を収めた DMは、拡散の複雑な生成機構により、プロアクティブな防御と相容れないことが証明されている。我々はVoiceCloakを紹介した。VoiceCloakは多次元のプロアクティブ・ディフェンス・フレームワークで、話者のアイデンティティを曖昧にし、潜在的な不正なVCの品質を劣化させることを目的としている。
論文参考訳（メタデータ） (2025-05-18T09:58:48Z)
Enhancing Privacy in Semantic Communication over Wiretap Channels leveraging Differential Privacy [51.028047763426265]
セマンティック通信(SemCom)は,タスク関連情報に着目して伝送効率を向上させる。セマンティックリッチなデータをセキュアでないチャネルで送信すると、プライバシのリスクが生じる。本稿では,セマンティックなセマンティックな特徴を保護するために,差分プライバシー機構を統合した新しいSemComフレームワークを提案する。
論文参考訳（メタデータ） (2025-04-23T08:42:44Z)
Collaborative Inference over Wireless Channels with Feature Differential Privacy [57.68286389879283]
複数の無線エッジデバイス間の協調推論は、人工知能(AI)アプリケーションを大幅に強化する可能性がある。抽出された特徴を抽出することは、プロセス中に機密性の高い個人情報が暴露されるため、重大なプライバシーリスクをもたらす。本稿では,ネットワーク内の各エッジデバイスが抽出された機能のプライバシを保護し,それらを中央サーバに送信して推論を行う,新たなプライバシ保存協調推論機構を提案する。
論文参考訳（メタデータ） (2024-10-25T18:11:02Z)
Breaking the Communication-Privacy-Accuracy Tradeoff with $f$-Differential Privacy [51.11280118806893]
サーバが複数のユーザの協調的なデータ分析を,プライバシの懸念と限られた通信能力で調整する,フェデレートされたデータ分析問題を考える。有限出力空間を有する離散値機構の局所的差分プライバシー保証を$f$-differential privacy (DP) レンズを用いて検討する。より具体的には、様々な離散的評価機構の厳密な$f$-DP保証を導出することにより、既存の文献を前進させる。
論文参考訳（メタデータ） (2023-02-19T16:58:53Z)
SPAct: Self-supervised Privacy Preservation for Action Recognition [73.79886509500409]
アクション認識におけるプライバシー漏洩を緩和するための既存のアプローチは、ビデオデータセットのアクションラベルとともに、プライバシラベルを必要とする。自己教師付き学習(SSL)の最近の進歩は、未ラベルデータの未発見の可能性を解き放ちつつある。本稿では、プライバシーラベルを必要とせず、自己管理的な方法で、入力ビデオからプライバシー情報を除去する新しいトレーニングフレームワークを提案する。
論文参考訳（メタデータ） (2022-03-29T02:56:40Z)
A Shuffling Framework for Local Differential Privacy [40.92785300658643]
ldpデプロイメントは、敵がノイズ応答をアイデンティティにリンクできるため、推論攻撃に対して脆弱である。別のモデルであるシャッフルDPは、ノイズ応答をランダムにシャッフルすることでこれを防止している。雑音応答の体系的なシャッフルは、意味のあるデータ学習性を維持しつつ、特定の推論攻撃を抑えることができることを示す。
論文参考訳（メタデータ） (2021-06-11T20:36:23Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。