論文の概要: Speech foundation models in healthcare: Effect of layer selection on pathological speech feature prediction
- arxiv url: http://arxiv.org/abs/2402.01796v2
- Date: Fri, 21 Jun 2024 13:49:56 GMT
- ステータス: 処理完了
- システム内更新日: 2024-06-24 19:58:24.487537
- Title: Speech foundation models in healthcare: Effect of layer selection on pathological speech feature prediction
- Title(参考訳): 医療における音声基盤モデル:病的音声特徴予測における層選択の影響
- Authors: Daniela A. Wiepert, Rene L. Utianski, Joseph R. Duffy, John L. Stricker, Leland R. Barnard, David T. Jones, Hugo Botha,
- Abstract要約: 病的音声特徴の予測における下流課題に対する層選択の影響について検討する。
最適なレイヤを選択することで、パフォーマンスが大幅に向上することがわかった。
学習された重み付け和は、分配における平均的な最高の層に匹敵するパフォーマンスを提供する。
- 参考スコア(独自算出の注目度): 0.40151799356083073
- License: http://creativecommons.org/licenses/by-nc-sa/4.0/
- Abstract: Accurately extracting clinical information from speech is critical to the diagnosis and treatment of many neurological conditions. As such, there is interest in leveraging AI for automatic, objective assessments of clinical speech to facilitate diagnosis and treatment of speech disorders. We explore transfer learning using foundation models, focusing on the impact of layer selection for the downstream task of predicting pathological speech features. We find that selecting an optimal layer can greatly improve performance (~15.8% increase in balanced accuracy per feature as compared to worst layer, ~13.6% increase as compared to final layer), though the best layer varies by predicted feature and does not always generalize well to unseen data. A learned weighted sum offers comparable performance to the average best layer in-distribution (only ~1.2% lower) and had strong generalization for out-of-distribution data (only 1.5% lower than the average best layer).
- Abstract(参考訳): 音声から正確な臨床情報を抽出することは、多くの神経疾患の診断と治療に重要である。
このように、AIを臨床音声の自動的客観的評価に活用して、音声障害の診断と治療を容易にすることに関心がある。
基礎モデルを用いた伝達学習について検討し,病的音声特徴を予測する下流課題における層選択の影響に着目した。
最適層を選択することで性能が大幅に向上する(最悪の層に比べて1機能当たりのバランス精度が15.8%向上し、最終層に比べて13.6%向上)が、最高の層は予測された特徴によって異なり、常に見当たらないデータに対して一般化されるとは限らない。
学習された重み付け和は、平均的な最上位層(約1.2%低い)に匹敵する性能を示し、分配外データ(平均最下位層よりもわずか1.5%低い)を強く一般化した。
関連論文リスト
- Automatic Prediction of Amyotrophic Lateral Sclerosis Progression using Longitudinal Speech Transformer [56.17737749551133]
ニューラルネットワークを用いたALS病進行自動予測器であるALS長手音声変換器(ALST)を提案する。
録音における高品質な事前訓練音声特徴と長手情報を活用することで、最良のモデルが91.0%のAUCを達成できる。
ALSTはALS進行の細粒度で解釈可能な予測が可能で、特に稀な症例と重篤な症例の区別が可能である。
論文 参考訳(メタデータ) (2024-06-26T13:28:24Z) - Evaluating Echo State Network for Parkinson's Disease Prediction using
Voice Features [1.2289361708127877]
本研究の目的は,偽陰性の最小化と高精度化を両立できる診断モデルを開発することである。
Echo State Networks (ESN)、Random Forest、k-nearest Neighbors、Support Vector、Extreme Gradient Boosting、Decision Treeなど、さまざまな機械学習手法が採用され、徹底的に評価されている。
ESNは83%の症例で8%未満の偽陰性率を維持している。
論文 参考訳(メタデータ) (2024-01-28T14:39:43Z) - Wav2vec-based Detection and Severity Level Classification of Dysarthria
from Speech [15.150153248025543]
事前訓練したwav2vec 2.0モデルは, 検出および重度分類システムを構築するための特徴抽出器として研究されている。
一般的なUA音声データベースを用いて実験を行った。
論文 参考訳(メタデータ) (2023-09-25T13:00:33Z) - A Few-Shot Approach to Dysarthric Speech Intelligibility Level
Classification Using Transformers [0.0]
発声障害(Dysarthria)は、言葉の発音が難しいことによるコミュニケーションを妨げる言語障害である。
文献の多くは、変形性音声に対するASRシステムの改善に焦点を当てている。
この研究は、変形の有無を正確に分類できるモデルを開発することを目的としている。
論文 参考訳(メタデータ) (2023-09-17T17:23:41Z) - Automatic diagnosis of knee osteoarthritis severity using Swin
transformer [55.01037422579516]
変形性膝関節症 (KOA) は膝関節の慢性的な痛みと硬直を引き起こす疾患である。
我々は,Swin Transformer を用いて KOA の重大度を予測する自動手法を提案する。
論文 参考訳(メタデータ) (2023-07-10T09:49:30Z) - Tissue Classification During Needle Insertion Using Self-Supervised
Contrastive Learning and Optical Coherence Tomography [53.38589633687604]
針先端で取得した複雑なCT信号の位相および強度データから組織を分類するディープニューラルネットワークを提案する。
トレーニングセットの10%で、提案した事前学習戦略により、モデルが0.84のF1スコアを達成するのに対して、モデルが0.60のF1スコアを得るのに対して、モデルが0.84のF1スコアを得るのに役立ちます。
論文 参考訳(メタデータ) (2023-04-26T14:11:04Z) - Learning to diagnose cirrhosis from radiological and histological labels
with joint self and weakly-supervised pretraining strategies [62.840338941861134]
そこで本稿では, 放射線学者が注釈付けした大規模データセットからの転写学習を活用して, 小さい付加データセットで利用できる組織学的スコアを予測することを提案する。
我々は,肝硬変の予測を改善するために,異なる事前訓練法,すなわち弱い指導法と自己指導法を比較した。
この方法は、METAVIRスコアのベースライン分類を上回り、AUCが0.84、バランスの取れた精度が0.75に達する。
論文 参考訳(メタデータ) (2023-02-16T17:06:23Z) - Adaptation of Autoencoder for Sparsity Reduction From Clinical Notes
Representation Learning [0.19573380763700707]
本稿では,臨床ノート表現の空間的縮小を生かしたオートエンコーダ学習アルゴリズムを提案する。
その動機は, 臨床注記表現特徴空間の次元を小さくすることで, スパースな高次元データを圧縮する方法を決定することである。
提案手法により,評価毎に最大3%の性能向上が得られた。
論文 参考訳(メタデータ) (2022-09-26T16:37:37Z) - Multiple Time Series Fusion Based on LSTM An Application to CAP A Phase
Classification Using EEG [56.155331323304]
本研究では,深層学習に基づく脳波チャンネルの特徴レベル融合を行う。
チャネル選択,融合,分類手順を2つの最適化アルゴリズムで最適化した。
論文 参考訳(メタデータ) (2021-12-18T14:17:49Z) - Medulloblastoma Tumor Classification using Deep Transfer Learning with
Multi-Scale EfficientNets [63.62764375279861]
本稿では,エンド・ツー・エンドのMB腫瘍分類を提案し,様々な入力サイズとネットワーク次元の一致した移動学習を提案する。
161ケースのデータセットを用いて、より大規模な入力解像度を持つ事前学習されたEfficientNetが、大幅な性能改善をもたらすことを実証した。
論文 参考訳(メタデータ) (2021-09-10T13:07:11Z) - Optimization of Genomic Classifiers for Clinical Deployment: Evaluation
of Bayesian Optimization to Select Predictive Models of Acute Infection and
In-Hospital Mortality [0.0]
血液から特定の遺伝子の発現レベルを定量化することにより、患者の免疫反応を特徴づけることにより、両方のタスクを遂行する潜在的によりタイムリーで正確な手段を示す。
機械学習手法は、デプロイ対応の分類モデルの開発にこの‘ホスト応答’を活用するプラットフォームを提供する。
急性感染症の診断分類器の開発におけるHO法と29の診断マーカーの遺伝子発現による院内死亡率の比較を行った。
論文 参考訳(メタデータ) (2020-03-27T10:22:02Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。