論文の概要: On the Impact of Voice Anonymization on Speech-Based COVID-19 Detection
- arxiv url: http://arxiv.org/abs/2304.02181v1
- Date: Wed, 5 Apr 2023 01:09:58 GMT
- ステータス: 処理完了
- システム内更新日: 2023-04-06 13:47:21.548900
- Title: On the Impact of Voice Anonymization on Speech-Based COVID-19 Detection
- Title(参考訳): 音声匿名化がcovid-19検出に与える影響について
- Authors: Yi Zhu, Mohamed Imoussa\"ine-A\"ikous, Carolyn C\^ot\'e-Lussier, and
Tiago H. Falk
- Abstract要約: 我々は2つの一般的な匿名化手法と、その5つの最先端の新型コロナウイルス診断システムへの影響を検証した。
データ拡張ツールとしての匿名化の利点は、匿名化データで見られる新型コロナウイルスの診断精度の低下を回復するのに有効である。
- 参考スコア(独自算出の注目度): 13.068141063003576
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: With advances seen in deep learning, voice-based applications are burgeoning,
ranging from personal assistants, affective computing, to remote disease
diagnostics. As the voice contains both linguistic and paralinguistic
information (e.g., vocal pitch, intonation, speech rate, loudness), there is
growing interest in voice anonymization to preserve speaker privacy and
identity. Voice privacy challenges have emerged over the last few years and
focus has been placed on removing speaker identity while keeping linguistic
content intact. For affective computing and disease monitoring applications,
however, the paralinguistic content may be more critical. Unfortunately, the
effects that anonymization may have on these systems are still largely unknown.
In this paper, we fill this gap and focus on one particular health monitoring
application: speech-based COVID-19 diagnosis. We test two popular anonymization
methods and their impact on five different state-of-the-art COVID-19 diagnostic
systems using three public datasets. We validate the effectiveness of the
anonymization methods, compare their computational complexity, and quantify the
impact across different testing scenarios for both within- and across-dataset
conditions. Lastly, we show the benefits of anonymization as a data
augmentation tool to help recover some of the COVID-19 diagnostic accuracy loss
seen with anonymized data.
- Abstract(参考訳): ディープラーニングの進歩とともに、パーソナルアシスタントから感情コンピューティング、遠隔病診断まで、音声ベースのアプリケーションが急成長している。
音声には言語情報とパラ言語情報(例えば、音声ピッチ、イントネーション、発声率、大声)が含まれているため、話者のプライバシーとアイデンティティを維持するために、音声匿名化への関心が高まっている。
音声プライバシの課題はここ数年で浮上し、言語コンテンツを維持しながら話者のアイデンティティを取り除くことに焦点が当てられている。
しかし、情緒的コンピューティングと病気モニタリングアプリケーションにとって、パラ言語的コンテンツはより重要かもしれない。
残念ながら、匿名化がこれらのシステムに与える影響は、いまだに不明である。
本稿では、このギャップを埋め、特定の健康モニタリングアプリケーション、すなわち音声による新型コロナウイルスの診断に焦点を当てる。
我々は、2つの一般的な匿名化手法と、3つのパブリックデータセットを使用して、5つの異なる最先端のCOVID-19診断システムへの影響をテストする。
匿名化手法の有効性を検証し,計算複雑性を比較し,データセット内およびデータセット内における異なるテストシナリオにおける影響を定量化する。
最後に、匿名化データで見られる新型コロナウイルスの診断精度の損失を回復するためのデータ拡張ツールとしての匿名化の利点を示す。
関連論文リスト
- SAIC: Integration of Speech Anonymization and Identity Classification [3.8871771267431035]
音声匿名化と同一性分類を統合する革新的なパイプラインであるSAICを提案する。
SAICは、Voxceleb1データセット上の話者識別分類タスクにおいて、顕著なパフォーマンスを示し、最先端の96.1%の精度で最先端に到達している。
論文 参考訳(メタデータ) (2023-12-23T08:14:33Z) - Anonymizing Speech: Evaluating and Designing Speaker Anonymization
Techniques [1.2691047660244337]
音声ユーザインタフェースの利用が増加し、音声データの収集と保存が急増した。
本論文は、音声の匿名化と匿名化の程度を評価するためのソリューションを提案する。
論文 参考訳(メタデータ) (2023-08-05T16:14:17Z) - Evaluation of Speaker Anonymization on Emotional Speech [9.223908421919733]
音声データには、話者のアイデンティティや感情状態など、さまざまな個人情報が含まれている。
最近の研究は、音声のプライバシーを守るという話題に対処している。
VoicePrivacy 2020 Challenge(VPC)は、話者の匿名化に関するものだ。
論文 参考訳(メタデータ) (2023-04-15T20:50:29Z) - V-Cloak: Intelligibility-, Naturalness- & Timbre-Preserving Real-Time
Voice Anonymization [0.0]
我々は,V-Cloakという音声匿名化システムを開発し,リアルタイム音声匿名化を実現する。
設計した匿名化器は、異なる周波数レベルでオリジナル音声の特徴を変調するワンショット生成モデルを備えている。
実験結果から,V-Cloakは匿名性能において5つのベースラインより優れていたことが確認された。
論文 参考訳(メタデータ) (2022-10-27T02:58:57Z) - Exploiting Cross-domain And Cross-Lingual Ultrasound Tongue Imaging
Features For Elderly And Dysarthric Speech Recognition [55.25565305101314]
調音機能は音響信号歪みに不変であり、音声認識システムにうまく組み込まれている。
本稿では,A2Aモデルにおける24時間TaLコーパスの並列音声・超音波舌画像(UTI)データを利用したクロスドメインおよびクロスランガルA2Aインバージョン手法を提案する。
生成した調音機能を組み込んだ3つのタスクの実験は、ベースラインのTDNNとコンフォーマーASRシステムより一貫して優れていた。
論文 参考訳(メタデータ) (2022-06-15T07:20:28Z) - The effect of speech pathology on automatic speaker verification -- a
large-scale study [6.468412158245622]
病的スピーチは 健康なスピーチに比べて プライバシー侵害のリスクが高まっています
ディスフォニアの成人は再識別のリスクが高まる一方、ディスフォニアのような症状は健康な話者に匹敵する結果をもたらす。
病理型間でデータをマージすると、EERは著しく低下し、自動話者検証における病理多様性の潜在的利点が示唆された。
論文 参考訳(メタデータ) (2022-04-13T15:17:00Z) - Investigation of Data Augmentation Techniques for Disordered Speech
Recognition [69.50670302435174]
本稿では,不規則音声認識のための一連のデータ拡張手法について検討する。
正常な音声と無秩序な音声の両方が増強過程に利用された。
UASpeechコーパスを用いた最終話者適応システムと、最大2.92%の絶対単語誤り率(WER)の速度摂動に基づく最良の拡張アプローチ
論文 参考訳(メタデータ) (2022-01-14T17:09:22Z) - Learning Language and Multimodal Privacy-Preserving Markers of Mood from
Mobile Data [74.60507696087966]
精神状態は、先進医療に共通する国でも診断されていない。
人間の行動を監視するための有望なデータソースのひとつは、日々のスマートフォンの利用だ。
本研究では,自殺行動のリスクが高い青少年集団の移動行動のデータセットを用いて,日常生活の行動マーカーについて検討した。
論文 参考訳(メタデータ) (2021-06-24T17:46:03Z) - Protecting gender and identity with disentangled speech representations [49.00162808063399]
音声における性情報保護は,話者識別情報のモデル化よりも効果的であることを示す。
性別情報をエンコードし、2つの敏感な生体識別子を解読する新しい方法を提示する。
論文 参考訳(メタデータ) (2021-04-22T13:31:41Z) - NUVA: A Naming Utterance Verifier for Aphasia Treatment [49.114436579008476]
失語症(PWA)患者の治療介入に対する反応の診断とモニタリングの両立のための画像命名タスクを用いた音声性能評価
本稿では,失語症脳卒中患者の「正しい」と「正しくない」を分類する深層学習要素を組み込んだ発話検証システムであるNUVAについて述べる。
イギリス系英語8ヶ国語でのテストでは、システムの性能精度は83.6%から93.6%の範囲であり、10倍のクロスバリデーション平均は89.5%であった。
論文 参考訳(メタデータ) (2021-02-10T13:00:29Z) - Speaker De-identification System using Autoencoders and Adversarial
Training [58.720142291102135]
本稿では,対人訓練とオートエンコーダに基づく話者識別システムを提案する。
実験結果から, 対向学習とオートエンコーダを組み合わせることで, 話者検証システムの誤り率が同等になることがわかった。
論文 参考訳(メタデータ) (2020-11-09T19:22:05Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。