論文の概要: Risk of re-identification for shared clinical speech recordings
- arxiv url: http://arxiv.org/abs/2210.09975v2
- Date: Mon, 21 Aug 2023 21:10:21 GMT
- ステータス: 処理完了
- システム内更新日: 2023-08-23 15:07:01.978657
- Title: Risk of re-identification for shared clinical speech recordings
- Title(参考訳): 共有臨床音声記録における再同定の危険性
- Authors: Daniela A. Wiepert, Bradley A. Malin, Joseph R. Duffy, Rene L.
Utianski, John L. Stricker, David T. Jones, and Hugo Botha
- Abstract要約: 本研究では, 話者認識システムを用いて, 人口統計やメタデータによらず, 音声記録の再同定リスクについて検討した。
小さな検索スペースではリスクが高いが、検索スペースが大きくなるにつれて減少する。
- 参考スコア(独自算出の注目度): 4.963535122670078
- License: http://creativecommons.org/licenses/by-nc-sa/4.0/
- Abstract: Large, curated datasets are required to leverage speech-based tools in
healthcare. These are costly to produce, resulting in increased interest in
data sharing. As speech can potentially identify speakers (i.e., voiceprints),
sharing recordings raises privacy concerns. We examine the re-identification
risk for speech recordings, without reference to demographic or metadata, using
a state-of-the-art speaker recognition system. We demonstrate that the risk is
inversely related to the number of comparisons an adversary must consider,
i.e., the search space. Risk is high for a small search space but drops as the
search space grows ($precision >0.85$ for $<1*10^{6}$ comparisons, $precision
<0.5$ for $>3*10^{6}$ comparisons). Next, we show that the nature of a speech
recording influences re-identification risk, with non-connected speech (e.g.,
vowel prolongation) being harder to identify. Our findings suggest that speaker
recognition systems can be used to re-identify participants in specific
circumstances, but in practice, the re-identification risk appears low.
- Abstract(参考訳): 大規模でキュレートされたデータセットは、医療における音声ベースのツールを活用するために必要です。
これらは製造にコストがかかり、データ共有への関心が高まる。
音声が話者(例えば音声プリント)を識別できるため、録音を共有することはプライバシーの懸念を引き起こす。
話者認識システムを用いて、人口統計やメタデータによらず、音声記録の再識別リスクを検討する。
リスクは、相手が考慮しなければならない比較数、すなわち探索空間と逆関係であることを示す。
小さな検索スペースではリスクが高いが、検索スペースが大きくなると減少する(precision >0.85$ for $<1*10^{6}$ comparisons, $precision <0.5$ for $>3*10^{6}$ comparisons)。
次に,音声記録の性質が再識別のリスクに影響を与え,非接続音声(母音延長など)の識別が困難であることを示す。
以上の結果から,話者認識システムは特定の状況下での参加者の再識別に有効であることが示唆された。
関連論文リスト
- Character-aware audio-visual subtitling in context [58.95580154761008]
本稿では,テレビ番組における文字認識型音声視覚サブタイピングのための改良されたフレームワークを提案する。
提案手法は,音声認識,話者ダイアリゼーション,文字認識を統合し,音声と視覚の両方を活用する。
提案手法を12テレビ番組のデータセット上で検証し,既存手法と比較して話者ダイアリゼーションと文字認識精度に優れた性能を示す。
論文 参考訳(メタデータ) (2024-10-14T20:27:34Z) - Towards Probing Speech-Specific Risks in Large Multimodal Models: A Taxonomy, Benchmark, and Insights [50.89022445197919]
本研究は,8つのリスクカテゴリーを敵意(悪意的皮肉と脅し),悪意的模倣(年齢,性別,民族),ステレオタイプ的バイアス(年齢,性別,民族)を対象とする音声特異的リスク分類法を提案する。
分類に基づいて,これらのリスクのカテゴリを検出するために,現在のLMM能力を評価するための小規模データセットを作成する。
論文 参考訳(メタデータ) (2024-06-25T10:08:45Z) - The effect of speech pathology on automatic speaker verification -- a
large-scale study [6.468412158245622]
病的スピーチは 健康なスピーチに比べて プライバシー侵害のリスクが高まっています
ディスフォニアの成人は再識別のリスクが高まる一方、ディスフォニアのような症状は健康な話者に匹敵する結果をもたらす。
病理型間でデータをマージすると、EERは著しく低下し、自動話者検証における病理多様性の潜在的利点が示唆された。
論文 参考訳(メタデータ) (2022-04-13T15:17:00Z) - Protecting gender and identity with disentangled speech representations [49.00162808063399]
音声における性情報保護は,話者識別情報のモデル化よりも効果的であることを示す。
性別情報をエンコードし、2つの敏感な生体識別子を解読する新しい方法を提示する。
論文 参考訳(メタデータ) (2021-04-22T13:31:41Z) - Streaming Multi-talker Speech Recognition with Joint Speaker
Identification [77.46617674133556]
SURITは、音声認識と話者識別の両方のバックボーンとして、リカレントニューラルネットワークトランスデューサ(RNN-T)を採用しています。
Librispeechから派生したマルチストーカーデータセットであるLibrispeechデータセットに関するアイデアを検証し、奨励的な結果を提示した。
論文 参考訳(メタデータ) (2021-04-05T18:37:33Z) - Triplet loss based embeddings for forensic speaker identification in
Spanish [0.0]
三重項損失を用いたCNNの訓練により得られた音声埋め込みの利用を検討する。
主に男性話者によって構成されるデータ設定のいくつかの制限を示す。
三重項損失は、フォレンジックスピーカー識別のための音声埋め込みを作成するための良い選択肢であることを示す。
論文 参考訳(メタデータ) (2021-02-24T21:24:25Z) - Multimodal Attention Fusion for Target Speaker Extraction [108.73502348754842]
マルチモーダル核融合のための新しい注意機構とその訓練方法を提案する。
シミュレーションデータに対する従来の核融合機構よりも,信号対歪み比(SDR)を1.0dB向上させる。
論文 参考訳(メタデータ) (2021-02-02T05:59:35Z) - Speaker De-identification System using Autoencoders and Adversarial
Training [58.720142291102135]
本稿では,対人訓練とオートエンコーダに基づく話者識別システムを提案する。
実験結果から, 対向学習とオートエンコーダを組み合わせることで, 話者検証システムの誤り率が同等になることがわかった。
論文 参考訳(メタデータ) (2020-11-09T19:22:05Z) - Private Speech Classification with Secure Multiparty Computation [15.065527713259542]
深層学習に基づく音声分類のための最初のプライバシ保護ソリューションを提案する。
我々のアプローチでは、BobがAliceの音声信号を暗号化されていない方法で見ることなく、あるパーティの音声信号を別のパーティのディープニューラルネットワークで分類することができる。
畳み込みニューラルネットワークを用いた音声からのプライバシー保護感情検出のユースケースとして,提案手法の効率・セキュリティ・正確性トレードオフを評価する。
論文 参考訳(メタデータ) (2020-07-01T05:26:06Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。