論文の概要: On the Impact of Voice Anonymization on Speech-Based COVID-19 Detection
- arxiv url: http://arxiv.org/abs/2304.02181v1
- Date: Wed, 5 Apr 2023 01:09:58 GMT
- ステータス: 処理完了
- システム内更新日: 2023-04-06 13:47:21.548900
- Title: On the Impact of Voice Anonymization on Speech-Based COVID-19 Detection
- Title(参考訳): 音声匿名化がcovid-19検出に与える影響について
- Authors: Yi Zhu, Mohamed Imoussa\"ine-A\"ikous, Carolyn C\^ot\'e-Lussier, and
Tiago H. Falk
- Abstract要約: 我々は2つの一般的な匿名化手法と、その5つの最先端の新型コロナウイルス診断システムへの影響を検証した。
データ拡張ツールとしての匿名化の利点は、匿名化データで見られる新型コロナウイルスの診断精度の低下を回復するのに有効である。
- 参考スコア(独自算出の注目度): 13.068141063003576
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: With advances seen in deep learning, voice-based applications are burgeoning,
ranging from personal assistants, affective computing, to remote disease
diagnostics. As the voice contains both linguistic and paralinguistic
information (e.g., vocal pitch, intonation, speech rate, loudness), there is
growing interest in voice anonymization to preserve speaker privacy and
identity. Voice privacy challenges have emerged over the last few years and
focus has been placed on removing speaker identity while keeping linguistic
content intact. For affective computing and disease monitoring applications,
however, the paralinguistic content may be more critical. Unfortunately, the
effects that anonymization may have on these systems are still largely unknown.
In this paper, we fill this gap and focus on one particular health monitoring
application: speech-based COVID-19 diagnosis. We test two popular anonymization
methods and their impact on five different state-of-the-art COVID-19 diagnostic
systems using three public datasets. We validate the effectiveness of the
anonymization methods, compare their computational complexity, and quantify the
impact across different testing scenarios for both within- and across-dataset
conditions. Lastly, we show the benefits of anonymization as a data
augmentation tool to help recover some of the COVID-19 diagnostic accuracy loss
seen with anonymized data.
- Abstract(参考訳): ディープラーニングの進歩とともに、パーソナルアシスタントから感情コンピューティング、遠隔病診断まで、音声ベースのアプリケーションが急成長している。
音声には言語情報とパラ言語情報(例えば、音声ピッチ、イントネーション、発声率、大声)が含まれているため、話者のプライバシーとアイデンティティを維持するために、音声匿名化への関心が高まっている。
音声プライバシの課題はここ数年で浮上し、言語コンテンツを維持しながら話者のアイデンティティを取り除くことに焦点が当てられている。
しかし、情緒的コンピューティングと病気モニタリングアプリケーションにとって、パラ言語的コンテンツはより重要かもしれない。
残念ながら、匿名化がこれらのシステムに与える影響は、いまだに不明である。
本稿では、このギャップを埋め、特定の健康モニタリングアプリケーション、すなわち音声による新型コロナウイルスの診断に焦点を当てる。
我々は、2つの一般的な匿名化手法と、3つのパブリックデータセットを使用して、5つの異なる最先端のCOVID-19診断システムへの影響をテストする。
匿名化手法の有効性を検証し,計算複雑性を比較し,データセット内およびデータセット内における異なるテストシナリオにおける影響を定量化する。
最後に、匿名化データで見られる新型コロナウイルスの診断精度の損失を回復するためのデータ拡張ツールとしての匿名化の利点を示す。
関連論文リスト
- Anonymising Elderly and Pathological Speech: Voice Conversion Using DDSP and Query-by-Example [4.42160195007899]
音声の匿名化は、言語内容を保持しながら、音声中の個人識別子を変更することによって話者のアイデンティティを保護することを目的としている。
現在の方法では、高齢者や病的音声領域で見られる韻律や独特の音声パターンを維持できない。
可変ディジタル信号処理とクエリ・バイ・サンプルを用いた音声変換方式(DDSP-QbE)を提案する。
論文 参考訳(メタデータ) (2024-10-20T20:40:56Z) - Selfsupervised learning for pathological speech detection [0.0]
音声生成は、様々な神経変性疾患による影響と破壊を受けやすい。
これらの障害は、異常な発声パターンと不正確な調音を特徴とする病的発声を引き起こす。
ニューロタイプ話者とは異なり、言語障害や障害のある患者は、AlexaやSiriなど、さまざまなバーチャルアシスタントにアクセスできない。
論文 参考訳(メタデータ) (2024-05-16T07:12:47Z) - The Impact of Speech Anonymization on Pathology and Its Limits [6.687980678659259]
本研究では,ドイツの複数の機関の2700人以上の話者を対象に,匿名化が病的スピーチに与える影響について検討した。
Dysarthria, Dysphonia, Cleft Lip and Palateなどの特定の疾患は最小限の効用変化を経験し, Dysglossiaはわずかに改善した。
論文 参考訳(メタデータ) (2024-04-11T18:06:35Z) - Anonymizing Speech: Evaluating and Designing Speaker Anonymization
Techniques [1.2691047660244337]
音声ユーザインタフェースの利用が増加し、音声データの収集と保存が急増した。
本論文は、音声の匿名化と匿名化の程度を評価するためのソリューションを提案する。
論文 参考訳(メタデータ) (2023-08-05T16:14:17Z) - Exploiting Cross-domain And Cross-Lingual Ultrasound Tongue Imaging
Features For Elderly And Dysarthric Speech Recognition [55.25565305101314]
調音機能は音響信号歪みに不変であり、音声認識システムにうまく組み込まれている。
本稿では,A2Aモデルにおける24時間TaLコーパスの並列音声・超音波舌画像(UTI)データを利用したクロスドメインおよびクロスランガルA2Aインバージョン手法を提案する。
生成した調音機能を組み込んだ3つのタスクの実験は、ベースラインのTDNNとコンフォーマーASRシステムより一貫して優れていた。
論文 参考訳(メタデータ) (2022-06-15T07:20:28Z) - The effect of speech pathology on automatic speaker verification -- a
large-scale study [6.468412158245622]
病的スピーチは 健康なスピーチに比べて プライバシー侵害のリスクが高まっています
ディスフォニアの成人は再識別のリスクが高まる一方、ディスフォニアのような症状は健康な話者に匹敵する結果をもたらす。
病理型間でデータをマージすると、EERは著しく低下し、自動話者検証における病理多様性の潜在的利点が示唆された。
論文 参考訳(メタデータ) (2022-04-13T15:17:00Z) - Deep Learning for Hate Speech Detection: A Comparative Study [54.42226495344908]
ここでは, ディープ・ヘイト・音声検出法と浅いヘイト・音声検出法を大規模に比較した。
私たちの目標は、この地域の進歩を照らし、現在の最先端の強みと弱点を特定することです。
そこで我々は,ヘイトスピーチ検出の実践的利用に関するガイダンスの提供,最先端の定量化,今後の研究方向の特定を目的としている。
論文 参考訳(メタデータ) (2022-02-19T03:48:20Z) - Investigation of Data Augmentation Techniques for Disordered Speech
Recognition [69.50670302435174]
本稿では,不規則音声認識のための一連のデータ拡張手法について検討する。
正常な音声と無秩序な音声の両方が増強過程に利用された。
UASpeechコーパスを用いた最終話者適応システムと、最大2.92%の絶対単語誤り率(WER)の速度摂動に基づく最良の拡張アプローチ
論文 参考訳(メタデータ) (2022-01-14T17:09:22Z) - Protecting gender and identity with disentangled speech representations [49.00162808063399]
音声における性情報保護は,話者識別情報のモデル化よりも効果的であることを示す。
性別情報をエンコードし、2つの敏感な生体識別子を解読する新しい方法を提示する。
論文 参考訳(メタデータ) (2021-04-22T13:31:41Z) - NUVA: A Naming Utterance Verifier for Aphasia Treatment [49.114436579008476]
失語症(PWA)患者の治療介入に対する反応の診断とモニタリングの両立のための画像命名タスクを用いた音声性能評価
本稿では,失語症脳卒中患者の「正しい」と「正しくない」を分類する深層学習要素を組み込んだ発話検証システムであるNUVAについて述べる。
イギリス系英語8ヶ国語でのテストでは、システムの性能精度は83.6%から93.6%の範囲であり、10倍のクロスバリデーション平均は89.5%であった。
論文 参考訳(メタデータ) (2021-02-10T13:00:29Z) - Speaker De-identification System using Autoencoders and Adversarial
Training [58.720142291102135]
本稿では,対人訓練とオートエンコーダに基づく話者識別システムを提案する。
実験結果から, 対向学習とオートエンコーダを組み合わせることで, 話者検証システムの誤り率が同等になることがわかった。
論文 参考訳(メタデータ) (2020-11-09T19:22:05Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。