論文の概要: Regularized Federated Learning for Privacy-Preserving Dysarthric and Elderly Speech Recognition
- arxiv url: http://arxiv.org/abs/2506.11069v1
- Date: Mon, 02 Jun 2025 01:34:20 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-06-22 23:32:14.543163
- Title: Regularized Federated Learning for Privacy-Preserving Dysarthric and Elderly Speech Recognition
- Title(参考訳): プライバシ保存型外科・高齢者音声認識のための正規化フェデレーション学習
- Authors: Tao Zhong, Mengzhe Geng, Shujie Hu, Guinan Li, Xunying Liu,
- Abstract要約: 本稿では,プライバシ保存型変形性関節症および高齢者の音声認識における正規化FL手法の体系的検討を行う。
正規化FLシステムは、統計的に有意なWERの0.55%の絶対値(2.13%の相対値)の還元により、ベースラインのFedAvgシステムより一貫して優れている
- 参考スコア(独自算出の注目度): 25.775415870854435
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Accurate recognition of dysarthric and elderly speech remains challenging to date. While privacy concerns have driven a shift from centralized approaches to federated learning (FL) to ensure data confidentiality, this further exacerbates the challenges of data scarcity, imbalanced data distribution and speaker heterogeneity. To this end, this paper conducts a systematic investigation of regularized FL techniques for privacy-preserving dysarthric and elderly speech recognition, addressing different levels of the FL process by 1) parameter-based, 2) embedding-based and 3) novel loss-based regularization. Experiments on the benchmark UASpeech dysarthric and DementiaBank Pitt elderly speech corpora suggest that regularized FL systems consistently outperform the baseline FedAvg system by statistically significant WER reductions of up to 0.55\% absolute (2.13\% relative). Further increasing communication frequency to one exchange per batch approaches centralized training performance.
- Abstract(参考訳): 変形性関節症と高齢者の発話の正確な認識はいまだに困難である。
プライバシの懸念は、中央集権的なアプローチから、データ機密性を保証するためのフェデレーションラーニング(FL)へと移行させた一方で、データ不足、不均衡なデータ分散、話者の不均一性の課題をさらに悪化させた。
そこで本稿では, FLプロセスの異なるレベルに対処するため, プライバシ保存型顎関節症および高齢者音声認識におけるFL手法の体系的検討を行う。
1)パラメータベース
2)埋め込み型および組込み型
3) 新しい損失ベース正規化。
UASpeech dysarthric と DementiaBank の高齢者音声コーパスのベンチマーク実験では、正規化されたFLシステムは、統計学的に有意な WER の絶対値 0.55 % (2.13 %) の削減により、ベースラインの FedAvg システムより一貫して優れていることが示唆されている。
バッチ毎の1つの交換に対する通信周波数の増大は、集中的なトレーニングパフォーマンスにアプローチする。
関連論文リスト
- Quantum-Inspired Privacy-Preserving Federated Learning Framework for Secure Dementia Classification [0.0]
本稿では,認知症分類のための量子インスピレーション暗号技術とフェデレーション学習を統合した新しいフレームワークを提案する。
このフレームワークは、低所得国と中所得国でAI駆動型認知症診断へのアクセスを民主化する上で重要な意味を持つ。
論文 参考訳(メタデータ) (2025-03-05T08:49:31Z) - Automatically measuring speech fluency in people with aphasia: first
achievements using read-speech data [55.84746218227712]
本研究の目的は,言語習得の分野で開発された信号処理algorithmの関連性を評価することである。
論文 参考訳(メタデータ) (2023-08-09T07:51:40Z) - Hyper-parameter Adaptation of Conformer ASR Systems for Elderly and
Dysarthric Speech Recognition [64.9816313630768]
ファインチューニングは、多くの非高齢および健康な音声事前訓練モデルを利用するためにしばしば用いられる。
本稿では,Librispeech corpus 上で事前学習した Conformer ASR システムのハイパーパラメータ適応について検討する。
論文 参考訳(メタデータ) (2023-06-27T07:49:35Z) - Conformer Based Elderly Speech Recognition System for Alzheimer's
Disease Detection [62.23830810096617]
アルツハイマー病(AD)の早期診断は、予防ケアがさらなる進行を遅らせるのに不可欠である。
本稿では,DementiaBank Pitt コーパスをベースとした最新のコンバータに基づく音声認識システムの開発について述べる。
論文 参考訳(メタデータ) (2022-06-23T12:50:55Z) - Personalized Adversarial Data Augmentation for Dysarthric and Elderly
Speech Recognition [30.885165674448352]
本稿では,高齢者および変形性音声認識のための新しい話者依存型(GAN)に基づくデータ拡張手法を提案する。
GANベースのデータ拡張アプローチは、ベースライン速度摂動法を最大0.91%、絶対値3.0%で一貫して上回っている。
LHUCベースの話者適応を適用した後、一貫性のある性能改善が維持される。
論文 参考訳(メタデータ) (2022-05-13T04:29:49Z) - On-the-Fly Feature Based Rapid Speaker Adaptation for Dysarthric and
Elderly Speech Recognition [53.17176024917725]
話者レベルのデータの共有化は、データ集約型モデルに基づく話者適応手法の実用的利用を制限する。
本稿では,2種類のデータ効率,特徴量に基づくオンザフライ話者適応手法を提案する。
論文 参考訳(メタデータ) (2022-03-28T09:12:24Z) - Investigation of Data Augmentation Techniques for Disordered Speech
Recognition [69.50670302435174]
本稿では,不規則音声認識のための一連のデータ拡張手法について検討する。
正常な音声と無秩序な音声の両方が増強過程に利用された。
UASpeechコーパスを用いた最終話者適応システムと、最大2.92%の絶対単語誤り率(WER)の速度摂動に基づく最良の拡張アプローチ
論文 参考訳(メタデータ) (2022-01-14T17:09:22Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。