論文の概要: Perceptual Implications of Automatic Anonymization in Pathological Speech
- arxiv url: http://arxiv.org/abs/2505.00409v1
- Date: Thu, 01 May 2025 09:03:03 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-05-02 19:15:55.273059
- Title: Perceptual Implications of Automatic Anonymization in Pathological Speech
- Title(参考訳): 病理音声における自動匿名化の知覚的意味
- Authors: Soroosh Tayebi Arasteh, Saba Afza, Tri-Thien Nguyen, Lukas Buess, Maryam Parvin, Tomas Arias-Vergara, Paula Andrea Perez-Toro, Hiu Ching Hung, Mahshad Lotfinia, Thomas Gorges, Elmar Noeth, Maria Schuster, Seung Hee Yang, Andreas Maier,
- Abstract要約: 本研究は, 匿名化音声の包括的人間中心分析を行った最初の事例である。
聞き手は180人の話者から匿名化された発声対を評価した。
有意な性差は認められなかった。
- 参考スコア(独自算出の注目度): 5.590563891072664
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Automatic anonymization techniques are essential for ethical sharing of pathological speech data, yet their perceptual consequences remain understudied. This study presents the first comprehensive human-centered analysis of anonymized pathological speech, using a structured perceptual protocol involving ten native and non-native German listeners with diverse linguistic, clinical, and technical backgrounds. Listeners evaluated anonymized-original utterance pairs from 180 speakers spanning Cleft Lip and Palate, Dysarthria, Dysglossia, Dysphonia, and age-matched healthy controls. Speech was anonymized using state-of-the-art automatic methods (equal error rates in the range of 30-40%). Listeners completed Turing-style discrimination and quality rating tasks under zero-shot (single-exposure) and few-shot (repeated-exposure) conditions. Discrimination accuracy was high overall (91% zero-shot; 93% few-shot), but varied by disorder (repeated-measures ANOVA: p=0.007), ranging from 96% (Dysarthria) to 86% (Dysphonia). Anonymization consistently reduced perceived quality (from 83% to 59%, p<0.001), with pathology-specific degradation patterns (one-way ANOVA: p=0.005). Native listeners rated original speech slightly higher than non-native listeners (Delta=4%, p=0.199), but this difference nearly disappeared after anonymization (Delta=1%, p=0.724). No significant gender-based bias was observed. Critically, human perceptual outcomes did not correlate with automatic privacy or clinical utility metrics. These results underscore the need for listener-informed, disorder- and context-specific anonymization strategies that preserve privacy while maintaining interpretability, communicative functions, and diagnostic utility, especially for vulnerable populations such as children.
- Abstract(参考訳): 病的音声データの倫理的共有には自動匿名化技術が不可欠である。
本研究では, 言語, 臨床, 技術的背景が多様である10人の母国・非母国ドイツ語聴取者を含む, 構造化された知覚プロトコルを用いて, 匿名化音声の包括的人間中心分析を行った。
聴取者は口唇口蓋裂・口蓋裂・Dysarthria・Dysglossia・Dysphonia・年齢整合健常者の180人の話者から発声対を匿名化して評価した。
音声は、最先端の自動手法(30~40%の範囲の誤り率)を用いて匿名化された。
リスナーは、ゼロショット(単一露光)と少数ショット(繰り返し露光)条件下でチューリングスタイルの差別と品質評価タスクを完了した。
判別精度は総合的に高い(91%ゼロショット、93%少数ショット)が、障害(ANOVA: p=0.007)によって変化し、96%(Dysarthria)から86%(Dysphonia)まで変化した。
匿名化は認識品質(83%から59%,p<0.001)を連続的に低下させ,病理特異的な劣化パターン(片方向ANOVA:p=0.005)を呈していた。
ネイティブリスナーは、非ネイティブリスナー(Delta=4%、p=0.199)よりもオリジナルスピーチの方が若干高い評価を受けたが、匿名化後(Delta=1%、p=0.724)にこの差はほとんど消失した。
有意な性差は認められなかった。
批判的に、人間の知覚の結果は、自動的なプライバシーや臨床的効用指標と相関しなかった。
これらの結果は、特に子どもなどの脆弱な人口に対して、解釈可能性、コミュニケーション機能、診断ユーティリティを維持しながらプライバシーを維持するリスナーインフォームド、障害特異的匿名化戦略の必要性を浮き彫りにした。
関連論文リスト
- Evaluating Spoken Language as a Biomarker for Automated Screening of Cognitive Impairment [37.40606157690235]
言語と言語の変化は、アルツハイマー病と関連する認知症を早期に予測できる。
音声言語からのADRDスクリーニングと重度予測のための機械学習手法の評価を行った。
リスク階層化と言語的特徴重要度分析は、予測の解釈可能性と臨床的有用性を高めた。
論文 参考訳(メタデータ) (2025-01-30T20:17:17Z) - Prosody-Driven Privacy-Preserving Dementia Detection [3.9530780161144667]
本研究の目的は,認知症検出のための診断ユーティリティを保ちつつ,埋め込みを匿名化することである。
本稿では,認知症に関連する韻律的特徴を話者埋め込みから切り離すために,ドメイン知識を活用した新しいアプローチを提案する。
論文 参考訳(メタデータ) (2024-07-03T19:34:47Z) - Non-Invasive Suicide Risk Prediction Through Speech Analysis [74.8396086718266]
自動自殺リスク評価のための非侵襲的音声ベースアプローチを提案する。
我々は、wav2vec、解釈可能な音声・音響特徴、深層学習に基づくスペクトル表現の3つの特徴セットを抽出する。
我々の最も効果的な音声モデルは、6.6.2,%$のバランスの取れた精度を達成する。
論文 参考訳(メタデータ) (2024-04-18T12:33:57Z) - The Impact of Speech Anonymization on Pathology and Its Limits [6.687980678659259]
本研究では,ドイツの複数の機関の2700人以上の話者を対象に,匿名化が病的スピーチに与える影響について検討した。
Dysarthria, Dysphonia, Cleft Lip and Palateなどの特定の疾患は最小限の効用変化を経験し, Dysglossiaはわずかに改善した。
論文 参考訳(メタデータ) (2024-04-11T18:06:35Z) - Locally Differentially Private Document Generation Using Zero Shot
Prompting [61.20953109732442]
本稿では,DP-Prompt と呼ばれる局所的に異なるプライベートなメカニズムを提案し,作者の匿名化攻撃に対処する。
DP-PromptをChatGPT(gpt-3.5)のような強力な言語モデルで使用すると、匿名化攻撃の成功率の顕著な低下が観察される。
論文 参考訳(メタデータ) (2023-10-24T18:25:13Z) - Automatically measuring speech fluency in people with aphasia: first
achievements using read-speech data [55.84746218227712]
本研究の目的は,言語習得の分野で開発された信号処理algorithmの関連性を評価することである。
論文 参考訳(メタデータ) (2023-08-09T07:51:40Z) - On the Impact of Voice Anonymization on Speech Diagnostic Applications: a Case Study on COVID-19 Detection [13.227360396362707]
話者のプライバシーとアイデンティティを維持するために、音声匿名化への関心が高まっている。
しかし、感情コンピューティングや疾患モニタリングのアプリケーションにとって、パラ言語的コンテンツはより重要かもしれない。
我々は3つの匿名化手法と、5つの異なる最先端の新型コロナウイルス診断システムへの影響を検証した。
論文 参考訳(メタデータ) (2023-04-05T01:09:58Z) - Private, fair and accurate: Training large-scale, privacy-preserving AI models in medical imaging [47.99192239793597]
我々は,AIモデルのプライバシ保護トレーニングが,非プライベートトレーニングと比較して精度と公平性に与える影響を評価した。
我々の研究は、実際の臨床データセットの困難な現実的な状況下では、診断深層学習モデルのプライバシー保護トレーニングは、優れた診断精度と公正さで可能であることを示しています。
論文 参考訳(メタデータ) (2023-02-03T09:49:13Z) - Identification of Hypokinetic Dysarthria Using Acoustic Analysis of Poem
Recitation [0.0]
パーキンソン病(PD)患者の90%以上が低運動性変形性関節症(HD)を患っている
特殊詩朗読課題から抽出した不明瞭な調音, ディズプロソディ, 音声のディフルエンス, 音質劣化のパワーを分析し, HDを識別した。
論文 参考訳(メタデータ) (2022-03-18T11:45:01Z) - Investigation of Data Augmentation Techniques for Disordered Speech
Recognition [69.50670302435174]
本稿では,不規則音声認識のための一連のデータ拡張手法について検討する。
正常な音声と無秩序な音声の両方が増強過程に利用された。
UASpeechコーパスを用いた最終話者適応システムと、最大2.92%の絶対単語誤り率(WER)の速度摂動に基づく最良の拡張アプローチ
論文 参考訳(メタデータ) (2022-01-14T17:09:22Z) - Mitigating Biases in Toxic Language Detection through Invariant
Rationalization [70.36701068616367]
性別、人種、方言などの属性に対するバイアスは、毒性検出のためのほとんどのトレーニングデータセットに存在する。
本稿では,論理生成器と予測器から構成されるゲーム理論フレームワークである不変合理化(InvRat)を用いて,特定の構文パターンの素早い相関を除外することを提案する。
本手法は, 語彙属性と方言属性の両方において, 従来のデバイアス法よりも低い偽陽性率を示す。
論文 参考訳(メタデータ) (2021-06-14T08:49:52Z) - NUVA: A Naming Utterance Verifier for Aphasia Treatment [49.114436579008476]
失語症(PWA)患者の治療介入に対する反応の診断とモニタリングの両立のための画像命名タスクを用いた音声性能評価
本稿では,失語症脳卒中患者の「正しい」と「正しくない」を分類する深層学習要素を組み込んだ発話検証システムであるNUVAについて述べる。
イギリス系英語8ヶ国語でのテストでは、システムの性能精度は83.6%から93.6%の範囲であり、10倍のクロスバリデーション平均は89.5%であった。
論文 参考訳(メタデータ) (2021-02-10T13:00:29Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。