論文の概要: InfoShield: Privacy-Preserving Speech Representations for Mental Health Screening via Information-Theoretic Optimization
- arxiv url: http://arxiv.org/abs/2606.05561v1
- Date: Thu, 04 Jun 2026 01:16:01 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-06-05 22:39:44.469041
- Title: InfoShield: Privacy-Preserving Speech Representations for Mental Health Screening via Information-Theoretic Optimization
- Title(参考訳): InfoShield:情報理論最適化によるメンタルヘルススクリーニングのためのプライバシ保護音声表現
- Authors: Xueyang Wu, Siyuan Liu, Kezhuo Yang, Guang Ling,
- Abstract要約: 本稿では,抑うつ分類精度を維持しつつ,音声表現と感性属性の相互情報を最小限に抑えるInfoShieldを提案する。
Androidでの実験では、InfoShieldは性別の推測を92.6%から55.5%に減らし、年齢の推測を55.7%から30.3%に減らした。
- 参考スコア(独自算出の注目度): 4.935686846272998
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Speech-based mental health screening offers scalable depression detection, yet clinical deployment faces a significant barrier: users' privacy concerns about demographic information exposure. Current techniques struggle to resolve this conflict. Adversarial training often fails against unseen threats, whereas Differential Privacy tends to compromise diagnostic performance by injecting noise across all features. This paper presents InfoShield, which minimizes mutual information between speech representations and sensitive attributes while preserving depression classification accuracy. We identify that standard MINE estimators struggle with sequential speech due to temporal-static misalignment, and introduce TimeAwareMINE with cross-modal attention to align acoustic frames with attribute embeddings. Experiments on the Androids Corpus show InfoShield reduces gender inference from 92.6\% to 55.5\% and age inference from 55.7\% to 30.3\% with limited utility loss (6\% F1 reduction), achieving F1=0.784 compared to prior SOTA's 0.723.
- Abstract(参考訳): 音声ベースのメンタルヘルススクリーニングは、スケーラブルなうつ病検出を提供するが、臨床展開は重大な障壁に直面している。
現在の技術はこの紛争を解決するのに苦労している。
敵対的なトレーニングは、目に見えない脅威に対して失敗することが多いが、差分プライバシーは、すべての機能にノイズを注入することで診断性能を損なう傾向がある。
本稿では,抑うつ分類精度を維持しつつ,音声表現と感性属性の相互情報を最小化するInfoShieldを提案する。
標準MINE推定器は時相的不整合による逐次的音声に苦しむことを確認し, 音響フレームを属性埋め込みに整合させるため, 時間的注意を伴うTimeAwareMINEを導入する。
Androids Corpusの実験では、InfoShieldは性別の推測を92.6\%から55.5\%に減らし、年齢の推測を55.7\%から30.3\%に減らした。
関連論文リスト
- VoxGuard: Evaluating User and Attribute Privacy in Speech via Membership Inference Attacks [51.68795949691009]
差分プライバシとメンバシップ推論に基づくフレームワークであるVoxGuardを紹介した。
属性については, 匿名化後も, 性別やアクセントをほぼ完全精度で再現できることが示唆された。
以上の結果から,EERはリークを著しく過小評価し,低FPR評価の必要性を浮き彫りにしている。
論文 参考訳(メタデータ) (2025-09-22T20:57:48Z) - A False Sense of Privacy: Evaluating Textual Data Sanitization Beyond Surface-level Privacy Leakage [77.83757117924995]
我々は、データリリース時の個人のプライバシーリスクを定量化するために、再識別攻撃を評価する新しいフレームワークを提案する。
本手法は, 衛生データから年齢や物質使用履歴などのセンシティブな属性を推測するために, 一見無害な補助情報を利用できることを示す。
論文 参考訳(メタデータ) (2025-04-28T01:16:27Z) - Differential privacy enables fair and accurate AI-based analysis of speech disorders while protecting patient data [10.6135892856374]
本研究は,病的音声データにおける差分プライバシーを初めて研究したものである。
プライバシ、診断精度、公正性のトレードオフに焦点を当てている。
以上の結果から,DPは音声障害検出におけるプライバシーと利便性のバランスがとれることが明らかとなった。
論文 参考訳(メタデータ) (2024-09-27T18:25:54Z) - Prosody-Driven Privacy-Preserving Dementia Detection [3.9530780161144667]
本研究の目的は,認知症検出のための診断ユーティリティを保ちつつ,埋め込みを匿名化することである。
本稿では,認知症に関連する韻律的特徴を話者埋め込みから切り離すために,ドメイン知識を活用した新しいアプローチを提案する。
論文 参考訳(メタデータ) (2024-07-03T19:34:47Z) - Non-Invasive Suicide Risk Prediction Through Speech Analysis [74.8396086718266]
自動自殺リスク評価のための非侵襲的音声ベースアプローチを提案する。
我々は、wav2vec、解釈可能な音声・音響特徴、深層学習に基づくスペクトル表現の3つの特徴セットを抽出する。
我々の最も効果的な音声モデルは、6.6.2,%$のバランスの取れた精度を達成する。
論文 参考訳(メタデータ) (2024-04-18T12:33:57Z) - Mental Health Diagnosis in the Digital Age: Harnessing Sentiment
Analysis on Social Media Platforms upon Ultra-Sparse Feature Content [3.6195994708545016]
3次元構造を持つ新しい意味的特徴前処理手法を提案する。
強化されたセマンティック機能により、精神障害を予測および分類するために機械学習モデルを訓練する。
提案手法は,7つのベンチマークモデルと比較して,大幅な性能向上を示した。
論文 参考訳(メタデータ) (2023-11-09T00:15:06Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。