論文の概要: Convolutional Neural Networks and a Transfer Learning Strategy to
Classify Parkinson's Disease from Speech in Three Different Languages
- arxiv url: http://arxiv.org/abs/2002.04374v1
- Date: Tue, 11 Feb 2020 13:48:38 GMT
- ステータス: 処理完了
- システム内更新日: 2023-01-02 01:00:31.422179
- Title: Convolutional Neural Networks and a Transfer Learning Strategy to
Classify Parkinson's Disease from Speech in Three Different Languages
- Title(参考訳): 3言語音声からパーキンソン病を分類するための畳み込みニューラルネットワークと伝達学習戦略
- Authors: J. C. V\'asquez-Correa, T. Arias-Vergara, C. D. Rios-Urrego, M.
Schuster, J. Rusz, J. R. Orozco-Arroyave, E. N\"oth
- Abstract要約: 本稿では,パーキンソン病を3つの言語(スペイン語,ドイツ語,チェコ語)で分類する手法を提案する。
提案手法では,3言語間の時間周波数表現と伝達学習戦略を訓練した畳み込みニューラルネットワークを検討する。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Parkinson's disease patients develop different speech impairments that affect
their communication capabilities. The automatic assessment of the speech of the
patients allows the development of computer aided tools to support the
diagnosis and the evaluation of the disease severity. This paper introduces a
methodology to classify Parkinson's disease from speech in three different
languages: Spanish, German, and Czech. The proposed approach considers
convolutional neural networks trained with time frequency representations and a
transfer learning strategy among the three languages. The transfer learning
scheme aims to improve the accuracy of the models when the weights of the
neural network are initialized with utterances from a different language than
the used for the test set. The results suggest that the proposed strategy
improves the accuracy of the models in up to 8\% when the base model used to
initialize the weights of the classifier is robust enough. In addition, the
results obtained after the transfer learning are in most cases more balanced in
terms of specificity-sensitivity than those trained without the transfer
learning strategy.
- Abstract(参考訳): パーキンソン病患者は、コミュニケーション能力に影響する異なる言語障害を発症する。
患者の音声の自動評価により、コンピュータ支援ツールの開発により、疾患重症度の診断と評価を支援することができる。
本稿では,パーキンソン病を3つの言語(スペイン語,ドイツ語,チェコ語)で分類する手法を提案する。
提案手法では,3言語間の時間周波数表現と伝達学習戦略を訓練した畳み込みニューラルネットワークを検討する。
転送学習方式は、ニューラルネットワークの重みがテストセットで使用されるものとは異なる言語からの発話で初期化されると、モデルの精度を向上させることを目的としている。
提案手法は,分類器の重み付け初期化に使用するベースモデルが十分に頑健である場合に,最大8倍の精度でモデルの精度を向上させることを示唆している。
また, 転帰学習後に得られた結果は, 転校学習戦略を使わずに訓練した者よりも, 具体性に敏感な場合が多い。
関連論文リスト
- Automatically measuring speech fluency in people with aphasia: first
achievements using read-speech data [55.84746218227712]
本研究の目的は,言語習得の分野で開発された信号処理algorithmの関連性を評価することである。
論文 参考訳(メタデータ) (2023-08-09T07:51:40Z) - Assessing Language Disorders using Artificial Intelligence: a Paradigm
Shift [0.13393465195776774]
言語障害、言語障害、コミュニケーション障害は、ほとんどの神経変性症候群にみられる。
我々は,機械学習手法,自然言語処理,現代人工知能(AI)を言語評価に活用することは,従来の手作業による評価よりも優れていると論じている。
論文 参考訳(メタデータ) (2023-05-31T17:20:45Z) - Federated learning for secure development of AI models for Parkinson's
disease detection using speech from different languages [10.04992537510352]
本稿では,ドイツ,スペイン,チェコの3つの実世界の言語コーパスからの音声信号を用いたPD検出にフェデレートラーニング(FL)を用いる。
その結果, FLモデルでは, 全局所モデルよりも診断精度が高いが, 集中的に組み合わせたトレーニングセットでは, モデルとは全く異なる性能が得られないことがわかった。
論文 参考訳(メタデータ) (2023-05-18T20:04:55Z) - Neural Language Models are not Born Equal to Fit Brain Data, but
Training Helps [75.84770193489639]
音声ブックを聴く被験者の機能的磁気共鳴イメージングの時間軸予測に及ぼすテスト損失,トレーニングコーパス,モデルアーキテクチャの影響について検討した。
各モデルの訓練されていないバージョンは、同じ単語をまたいだ脳反応の類似性を捉えることで、脳内のかなりの量のシグナルをすでに説明していることがわかりました。
ニューラル言語モデルを用いたヒューマン・ランゲージ・システムの説明を目的とした今後の研究の実践を提案する。
論文 参考訳(メタデータ) (2022-07-07T15:37:17Z) - Exploiting Cross-domain And Cross-Lingual Ultrasound Tongue Imaging
Features For Elderly And Dysarthric Speech Recognition [55.25565305101314]
調音機能は音響信号歪みに不変であり、音声認識システムにうまく組み込まれている。
本稿では,A2Aモデルにおける24時間TaLコーパスの並列音声・超音波舌画像(UTI)データを利用したクロスドメインおよびクロスランガルA2Aインバージョン手法を提案する。
生成した調音機能を組み込んだ3つのタスクの実験は、ベースラインのTDNNとコンフォーマーASRシステムより一貫して優れていた。
論文 参考訳(メタデータ) (2022-06-15T07:20:28Z) - Dependency-based Mixture Language Models [53.152011258252315]
依存性に基づく混合言語モデルを紹介する。
より詳しくは、依存関係モデリングの新たな目的により、まずニューラルネットワークモデルを訓練する。
次に、前回の依存性モデリング確率分布と自己意図を混合することにより、次の確率を定式化する。
論文 参考訳(メタデータ) (2022-03-19T06:28:30Z) - Model-based analysis of brain activity reveals the hierarchy of language
in 305 subjects [82.81964713263483]
言語の神経基盤を分解する一般的なアプローチは、個人間で異なる刺激に対する脳の反応を関連付けている。
そこで本研究では,自然刺激に曝露された被験者に対して,モデルに基づくアプローチが等価な結果が得られることを示す。
論文 参考訳(メタデータ) (2021-10-12T15:30:21Z) - Factorized Neural Transducer for Efficient Language Model Adaptation [51.81097243306204]
空白および語彙予測を分解し,ニューラルトランスデューサの因子化モデルを提案する。
この因子化は、音声認識のためのトランスデューサにスタンドアロン言語モデルの改善を移すことが期待できる。
提案した因子化ニューラルトランスデューサは、言語モデル適応にドメイン外テキストデータを使用する場合、15%から20%のWER改善が得られることを示す。
論文 参考訳(メタデータ) (2021-09-27T15:04:00Z) - Parkinsonian Chinese Speech Analysis towards Automatic Classification of
Parkinson's Disease [31.431256876809343]
パーキンソン病(PD)の早期に発する発声障害
中国語の音声コーパスを新たに構築し,PD患者の分類について検討した。
我々の分類精度は最先端の研究をはるかに上回った。
論文 参考訳(メタデータ) (2021-05-31T04:51:44Z) - Multi-Modal Detection of Alzheimer's Disease from Speech and Text [3.702631194466718]
本稿では,アルツハイマー病(AD)の診断に音声と対応する文字を同時に利用する深層学習手法を提案する。
提案手法は,Dementiabank Pitt corpus のトレーニングおよび評価において,85.3%のクロスバリデーション精度を実現する。
論文 参考訳(メタデータ) (2020-11-30T21:18:17Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。