Fugu-MT 論文翻訳(概要): On the Impact of Voice Anonymization on Speech Diagnostic Applications: a Case Study on COVID-19 Detection

論文の概要: On the Impact of Voice Anonymization on Speech Diagnostic Applications: a Case Study on COVID-19 Detection

arxiv url: http://arxiv.org/abs/2304.02181v2
Date: Wed, 26 Jun 2024 17:58:42 GMT
ステータス: 翻訳完了
システム内更新日: 2024-06-27 20:03:37.817363
Title: On the Impact of Voice Anonymization on Speech Diagnostic Applications: a Case Study on COVID-19 Detection
Title（参考訳）: 音声の匿名化が音声診断に与える影響について : COVID-19検出を事例として
Authors: Yi Zhu, Mohamed Imoussaïne-Aïkous, Carolyn Côté-Lussier, Tiago H. Falk,
Abstract要約: 話者のプライバシーとアイデンティティを維持するために、音声匿名化への関心が高まっている。しかし、感情コンピューティングや疾患モニタリングのアプリケーションにとって、パラ言語的コンテンツはより重要かもしれない。我々は3つの匿名化手法と、5つの異なる最先端の新型コロナウイルス診断システムへの影響を検証した。
参考スコア（独自算出の注目度）: 13.227360396362707
License: http://creativecommons.org/licenses/by/4.0/
Abstract: With advances seen in deep learning, voice-based applications are burgeoning, ranging from personal assistants, affective computing, to remote disease diagnostics. As the voice contains both linguistic and para-linguistic information (e.g., vocal pitch, intonation, speech rate, loudness), there is growing interest in voice anonymization to preserve speaker privacy and identity. Voice privacy challenges have emerged over the last few years and focus has been placed on removing speaker identity while keeping linguistic content intact. For affective computing and disease monitoring applications, however, the para-linguistic content may be more critical. Unfortunately, the effects that anonymization may have on these systems are still largely unknown. In this paper, we fill this gap and focus on one particular health monitoring application: speech-based COVID-19 diagnosis. We test three anonymization methods and their impact on five different state-of-the-art COVID-19 diagnostic systems using three public datasets. We validate the effectiveness of the anonymization methods, compare their computational complexity, and quantify the impact across different testing scenarios for both within- and across-dataset conditions. Additionally, we provided a comprehensive evaluation of the importance of different speech aspects for diagnostics and showed how they are affected by different types of anonymizers. Lastly, we show the benefits of using anonymized external data as a data augmentation tool to help recover some of the COVID-19 diagnostic accuracy loss seen with anonymization.
Abstract（参考訳）: ディープラーニングの進歩により、音声ベースのアプリケーションは、パーソナルアシスタント、感情コンピューティング、リモート病の診断など、急速に進歩している。音声は言語情報とパラ言語情報の両方(例えば、声のピッチ、イントネーション、発話速度、大声)を含んでいるため、話者のプライバシーとアイデンティティを維持するために、音声匿名化への関心が高まっている。音声によるプライバシーの問題はここ数年で浮上し、言語的コンテンツをそのまま維持しながら話者のアイデンティティを削除することに焦点が当てられている。しかし、感情コンピューティングや疾患モニタリングのアプリケーションにとって、パラ言語的コンテンツはより重要かもしれない。残念ながら、匿名化がこれらのシステムに与える影響は、いまだに不明である。本稿では、このギャップを埋め、特定の健康モニタリングアプリケーション、すなわち音声による新型コロナウイルスの診断に焦点を当てる。我々は,3つの匿名化手法と,その3つの公開データセットを用いた5種類の最先端の新型コロナウイルス診断システムへの影響を検証した。匿名化手法の有効性を検証し、それらの計算複雑性を比較し、データ内およびデータ間条件の異なるテストシナリオにおける影響を定量化する。さらに、診断における異なる音声側面の重要性を包括的に評価し、それらが異なる種類の匿名化要因にどのように影響されているかを示した。最後に、匿名化された外部データをデータ拡張ツールとして使用することにより、匿名化に伴う新型コロナウイルスの診断精度の低下を回復する利点を示す。

関連論文リスト

Anonymising Elderly and Pathological Speech: Voice Conversion Using DDSP and Query-by-Example [4.42160195007899]
音声の匿名化は、言語内容を保持しながら、音声中の個人識別子を変更することによって話者のアイデンティティを保護することを目的としている。現在の方法では、高齢者や病的音声領域で見られる韻律や独特の音声パターンを維持できない。可変ディジタル信号処理とクエリ・バイ・サンプルを用いた音声変換方式(DDSP-QbE)を提案する。
論文参考訳（メタデータ） (2024-10-20T20:40:56Z)
Differential privacy enables fair and accurate AI-based analysis of speech disorders while protecting patient data [10.6135892856374]
本研究は,ディファレンシャルプライバシ(DP)が病的音声データに与える影響を初めて調べたものである。プライバシーレベルの高いDPのトレーニングでは,最大3.85%の精度低下が観察された。言語や障害にまたがる知見を一般化するため,スペイン語を話すパーキンソン病患者のデータセットに対するアプローチを検証した。
論文参考訳（メタデータ） (2024-09-27T18:25:54Z)
Selfsupervised learning for pathological speech detection [0.0]
音声生成は、様々な神経変性疾患による影響と破壊を受けやすい。これらの障害は、異常な発声パターンと不正確な調音を特徴とする病的発声を引き起こす。ニューロタイプ話者とは異なり、言語障害や障害のある患者は、AlexaやSiriなど、さまざまなバーチャルアシスタントにアクセスできない。
論文参考訳（メタデータ） (2024-05-16T07:12:47Z)
The Impact of Speech Anonymization on Pathology and Its Limits [6.687980678659259]
本研究では,ドイツの複数の機関の2700人以上の話者を対象に,匿名化が病的スピーチに与える影響について検討した。 Dysarthria, Dysphonia, Cleft Lip and Palateなどの特定の疾患は最小限の効用変化を経験し, Dysglossiaはわずかに改善した。
論文参考訳（メタデータ） (2024-04-11T18:06:35Z)
Anonymizing Speech: Evaluating and Designing Speaker Anonymization Techniques [1.2691047660244337]
音声ユーザインタフェースの利用が増加し、音声データの収集と保存が急増した。本論文は、音声の匿名化と匿名化の程度を評価するためのソリューションを提案する。
論文参考訳（メタデータ） (2023-08-05T16:14:17Z)
Exploiting Cross-domain And Cross-Lingual Ultrasound Tongue Imaging Features For Elderly And Dysarthric Speech Recognition [55.25565305101314]
調音機能は音響信号歪みに不変であり、音声認識システムにうまく組み込まれている。本稿では,A2Aモデルにおける24時間TaLコーパスの並列音声・超音波舌画像(UTI)データを利用したクロスドメインおよびクロスランガルA2Aインバージョン手法を提案する。生成した調音機能を組み込んだ3つのタスクの実験は、ベースラインのTDNNとコンフォーマーASRシステムより一貫して優れていた。
論文参考訳（メタデータ） (2022-06-15T07:20:28Z)
The effect of speech pathology on automatic speaker verification -- a large-scale study [6.468412158245622]
病的スピーチは健康なスピーチに比べてプライバシー侵害のリスクが高まっていますディスフォニアの成人は再識別のリスクが高まる一方、ディスフォニアのような症状は健康な話者に匹敵する結果をもたらす。病理型間でデータをマージすると、EERは著しく低下し、自動話者検証における病理多様性の潜在的利点が示唆された。
論文参考訳（メタデータ） (2022-04-13T15:17:00Z)
Deep Learning for Hate Speech Detection: A Comparative Study [54.42226495344908]
ここでは, ディープ・ヘイト・音声検出法と浅いヘイト・音声検出法を大規模に比較した。私たちの目標は、この地域の進歩を照らし、現在の最先端の強みと弱点を特定することです。そこで我々は,ヘイトスピーチ検出の実践的利用に関するガイダンスの提供,最先端の定量化,今後の研究方向の特定を目的としている。
論文参考訳（メタデータ） (2022-02-19T03:48:20Z)
Investigation of Data Augmentation Techniques for Disordered Speech Recognition [69.50670302435174]
本稿では,不規則音声認識のための一連のデータ拡張手法について検討する。正常な音声と無秩序な音声の両方が増強過程に利用された。 UASpeechコーパスを用いた最終話者適応システムと、最大2.92%の絶対単語誤り率(WER)の速度摂動に基づく最良の拡張アプローチ
論文参考訳（メタデータ） (2022-01-14T17:09:22Z)
Protecting gender and identity with disentangled speech representations [49.00162808063399]
音声における性情報保護は,話者識別情報のモデル化よりも効果的であることを示す。性別情報をエンコードし、2つの敏感な生体識別子を解読する新しい方法を提示する。
論文参考訳（メタデータ） (2021-04-22T13:31:41Z)
NUVA: A Naming Utterance Verifier for Aphasia Treatment [49.114436579008476]
失語症(PWA)患者の治療介入に対する反応の診断とモニタリングの両立のための画像命名タスクを用いた音声性能評価本稿では,失語症脳卒中患者の「正しい」と「正しくない」を分類する深層学習要素を組み込んだ発話検証システムであるNUVAについて述べる。イギリス系英語8ヶ国語でのテストでは、システムの性能精度は83.6%から93.6%の範囲であり、10倍のクロスバリデーション平均は89.5%であった。
論文参考訳（メタデータ） (2021-02-10T13:00:29Z)
Speaker De-identification System using Autoencoders and Adversarial Training [58.720142291102135]
本稿では,対人訓練とオートエンコーダに基づく話者識別システムを提案する。実験結果から, 対向学習とオートエンコーダを組み合わせることで, 話者検証システムの誤り率が同等になることがわかった。
論文参考訳（メタデータ） (2020-11-09T19:22:05Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。