論文の概要: Convolutional Neural Networks and a Transfer Learning Strategy to
Classify Parkinson's Disease from Speech in Three Different Languages
- arxiv url: http://arxiv.org/abs/2002.04374v1
- Date: Tue, 11 Feb 2020 13:48:38 GMT
- ステータス: 処理完了
- システム内更新日: 2023-01-02 01:00:31.422179
- Title: Convolutional Neural Networks and a Transfer Learning Strategy to
Classify Parkinson's Disease from Speech in Three Different Languages
- Title(参考訳): 3言語音声からパーキンソン病を分類するための畳み込みニューラルネットワークと伝達学習戦略
- Authors: J. C. V\'asquez-Correa, T. Arias-Vergara, C. D. Rios-Urrego, M.
Schuster, J. Rusz, J. R. Orozco-Arroyave, E. N\"oth
- Abstract要約: 本稿では,パーキンソン病を3つの言語(スペイン語,ドイツ語,チェコ語)で分類する手法を提案する。
提案手法では,3言語間の時間周波数表現と伝達学習戦略を訓練した畳み込みニューラルネットワークを検討する。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Parkinson's disease patients develop different speech impairments that affect
their communication capabilities. The automatic assessment of the speech of the
patients allows the development of computer aided tools to support the
diagnosis and the evaluation of the disease severity. This paper introduces a
methodology to classify Parkinson's disease from speech in three different
languages: Spanish, German, and Czech. The proposed approach considers
convolutional neural networks trained with time frequency representations and a
transfer learning strategy among the three languages. The transfer learning
scheme aims to improve the accuracy of the models when the weights of the
neural network are initialized with utterances from a different language than
the used for the test set. The results suggest that the proposed strategy
improves the accuracy of the models in up to 8\% when the base model used to
initialize the weights of the classifier is robust enough. In addition, the
results obtained after the transfer learning are in most cases more balanced in
terms of specificity-sensitivity than those trained without the transfer
learning strategy.
- Abstract(参考訳): パーキンソン病患者は、コミュニケーション能力に影響する異なる言語障害を発症する。
患者の音声の自動評価により、コンピュータ支援ツールの開発により、疾患重症度の診断と評価を支援することができる。
本稿では,パーキンソン病を3つの言語(スペイン語,ドイツ語,チェコ語)で分類する手法を提案する。
提案手法では,3言語間の時間周波数表現と伝達学習戦略を訓練した畳み込みニューラルネットワークを検討する。
転送学習方式は、ニューラルネットワークの重みがテストセットで使用されるものとは異なる言語からの発話で初期化されると、モデルの精度を向上させることを目的としている。
提案手法は,分類器の重み付け初期化に使用するベースモデルが十分に頑健である場合に,最大8倍の精度でモデルの精度を向上させることを示唆している。
また, 転帰学習後に得られた結果は, 転校学習戦略を使わずに訓練した者よりも, 具体性に敏感な場合が多い。
関連論文リスト
- A Lesion-aware Edge-based Graph Neural Network for Predicting Language Ability in Patients with Post-stroke Aphasia [12.129896943547912]
本稿では,脳卒中後失語症患者の安静時fMRI(r-fMRI)接続から言語能力を予測するために,病変認識型グラフニューラルネットワーク(LEGNet)を提案する。
本モデルでは,脳領域間の機能的接続を符号化するエッジベース学習モジュール,病変符号化モジュール,サブグラフ学習モジュールの3つのコンポーネントを統合する。
論文 参考訳(メタデータ) (2024-09-03T21:28:48Z) - Adapting Mental Health Prediction Tasks for Cross-lingual Learning via Meta-Training and In-context Learning with Large Language Model [3.3590922002216193]
モデルに依存しないメタラーニングと,このギャップに対処するために大規模言語モデル(LLM)を活用する。
まず,自己超越型メタラーニングモデルを適用し,迅速な適応と言語間移動のためのモデル初期化を改良する。
並行して、LLMのインコンテキスト学習機能を用いて、スワヒリのメンタルヘルス予測タスクにおけるパフォーマンスの精度を評価する。
論文 参考訳(メタデータ) (2024-04-13T17:11:35Z) - Neural Sign Actors: A diffusion model for 3D sign language production from text [51.81647203840081]
手話 (SL) は難聴者および難聴者コミュニティの主要なコミュニケーション手段である。
この研究は、現実的なニューラルサインアバターに向けて重要な一歩を踏み出し、聴覚と聴覚のコミュニティ間のコミュニケーションギャップを埋める。
論文 参考訳(メタデータ) (2023-12-05T12:04:34Z) - Automatically measuring speech fluency in people with aphasia: first
achievements using read-speech data [55.84746218227712]
本研究の目的は,言語習得の分野で開発された信号処理algorithmの関連性を評価することである。
論文 参考訳(メタデータ) (2023-08-09T07:51:40Z) - Assessing Language Disorders using Artificial Intelligence: a Paradigm
Shift [0.13393465195776774]
言語障害、言語障害、コミュニケーション障害は、ほとんどの神経変性症候群にみられる。
我々は,機械学習手法,自然言語処理,現代人工知能(AI)を言語評価に活用することは,従来の手作業による評価よりも優れていると論じている。
論文 参考訳(メタデータ) (2023-05-31T17:20:45Z) - Federated learning for secure development of AI models for Parkinson's
disease detection using speech from different languages [10.04992537510352]
本稿では,ドイツ,スペイン,チェコの3つの実世界の言語コーパスからの音声信号を用いたPD検出にフェデレートラーニング(FL)を用いる。
その結果, FLモデルでは, 全局所モデルよりも診断精度が高いが, 集中的に組み合わせたトレーニングセットでは, モデルとは全く異なる性能が得られないことがわかった。
論文 参考訳(メタデータ) (2023-05-18T20:04:55Z) - Neural Language Models are not Born Equal to Fit Brain Data, but
Training Helps [75.84770193489639]
音声ブックを聴く被験者の機能的磁気共鳴イメージングの時間軸予測に及ぼすテスト損失,トレーニングコーパス,モデルアーキテクチャの影響について検討した。
各モデルの訓練されていないバージョンは、同じ単語をまたいだ脳反応の類似性を捉えることで、脳内のかなりの量のシグナルをすでに説明していることがわかりました。
ニューラル言語モデルを用いたヒューマン・ランゲージ・システムの説明を目的とした今後の研究の実践を提案する。
論文 参考訳(メタデータ) (2022-07-07T15:37:17Z) - Exploiting Cross-domain And Cross-Lingual Ultrasound Tongue Imaging
Features For Elderly And Dysarthric Speech Recognition [55.25565305101314]
調音機能は音響信号歪みに不変であり、音声認識システムにうまく組み込まれている。
本稿では,A2Aモデルにおける24時間TaLコーパスの並列音声・超音波舌画像(UTI)データを利用したクロスドメインおよびクロスランガルA2Aインバージョン手法を提案する。
生成した調音機能を組み込んだ3つのタスクの実験は、ベースラインのTDNNとコンフォーマーASRシステムより一貫して優れていた。
論文 参考訳(メタデータ) (2022-06-15T07:20:28Z) - Model-based analysis of brain activity reveals the hierarchy of language
in 305 subjects [82.81964713263483]
言語の神経基盤を分解する一般的なアプローチは、個人間で異なる刺激に対する脳の反応を関連付けている。
そこで本研究では,自然刺激に曝露された被験者に対して,モデルに基づくアプローチが等価な結果が得られることを示す。
論文 参考訳(メタデータ) (2021-10-12T15:30:21Z) - Factorized Neural Transducer for Efficient Language Model Adaptation [51.81097243306204]
空白および語彙予測を分解し,ニューラルトランスデューサの因子化モデルを提案する。
この因子化は、音声認識のためのトランスデューサにスタンドアロン言語モデルの改善を移すことが期待できる。
提案した因子化ニューラルトランスデューサは、言語モデル適応にドメイン外テキストデータを使用する場合、15%から20%のWER改善が得られることを示す。
論文 参考訳(メタデータ) (2021-09-27T15:04:00Z) - Multi-Modal Detection of Alzheimer's Disease from Speech and Text [3.702631194466718]
本稿では,アルツハイマー病(AD)の診断に音声と対応する文字を同時に利用する深層学習手法を提案する。
提案手法は,Dementiabank Pitt corpus のトレーニングおよび評価において,85.3%のクロスバリデーション精度を実現する。
論文 参考訳(メタデータ) (2020-11-30T21:18:17Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。