Fugu-MT 論文翻訳(概要): Speech foundation models in healthcare: Effect of layer selection on pathological speech feature prediction

論文の概要: Speech foundation models in healthcare: Effect of layer selection on pathological speech feature prediction

arxiv url: http://arxiv.org/abs/2402.01796v2
Date: Fri, 21 Jun 2024 13:49:56 GMT
ステータス: 翻訳完了
システム内更新日: 2024-06-24 19:58:24.487537
Title: Speech foundation models in healthcare: Effect of layer selection on pathological speech feature prediction
Title（参考訳）: 医療における音声基盤モデル:病的音声特徴予測における層選択の影響
Authors: Daniela A. Wiepert, Rene L. Utianski, Joseph R. Duffy, John L. Stricker, Leland R. Barnard, David T. Jones, Hugo Botha,
Abstract要約: 病的音声特徴の予測における下流課題に対する層選択の影響について検討する。最適なレイヤを選択することで、パフォーマンスが大幅に向上することがわかった。学習された重み付け和は、分配における平均的な最高の層に匹敵するパフォーマンスを提供する。
参考スコア（独自算出の注目度）: 0.40151799356083073
License: http://creativecommons.org/licenses/by-nc-sa/4.0/
Abstract: Accurately extracting clinical information from speech is critical to the diagnosis and treatment of many neurological conditions. As such, there is interest in leveraging AI for automatic, objective assessments of clinical speech to facilitate diagnosis and treatment of speech disorders. We explore transfer learning using foundation models, focusing on the impact of layer selection for the downstream task of predicting pathological speech features. We find that selecting an optimal layer can greatly improve performance (~15.8% increase in balanced accuracy per feature as compared to worst layer, ~13.6% increase as compared to final layer), though the best layer varies by predicted feature and does not always generalize well to unseen data. A learned weighted sum offers comparable performance to the average best layer in-distribution (only ~1.2% lower) and had strong generalization for out-of-distribution data (only 1.5% lower than the average best layer).
Abstract（参考訳）: 音声から正確な臨床情報を抽出することは、多くの神経疾患の診断と治療に重要である。このように、AIを臨床音声の自動的客観的評価に活用して、音声障害の診断と治療を容易にすることに関心がある。基礎モデルを用いた伝達学習について検討し,病的音声特徴を予測する下流課題における層選択の影響に着目した。最適層を選択することで性能が大幅に向上する(最悪の層に比べて1機能当たりのバランス精度が15.8%向上し、最終層に比べて13.6%向上)が、最高の層は予測された特徴によって異なり、常に見当たらないデータに対して一般化されるとは限らない。学習された重み付け和は、平均的な最上位層(約1.2%低い)に匹敵する性能を示し、分配外データ(平均最下位層よりもわずか1.5%低い)を強く一般化した。

関連論文リスト

Enhancing Skin Cancer Diagnosis (SCD) Using Late Discrete Wavelet Transform (DWT) and New Swarm-Based Optimizers [0.0]
皮膚がんは最も致命的ながんの1つであり、診断を受けなければ危険が増幅され、迅速に治療される。早期発見と皮膚がん診断(SCD)の強力なツールとしてディープラーニングが登場した本稿では,事前に訓練されたネットワークとウェーブレット変換を併用した最適化手法を用いて,皮膚がん検出のための新しいアプローチを提案する。
論文参考訳（メタデータ） (2024-11-30T13:17:52Z)
Brain Tumor Classification on MRI in Light of Molecular Markers [61.77272414423481]
1p/19q遺伝子の同時欠失は、低グレードグリオーマの臨床成績と関連している。本研究の目的は,MRIを用いた畳み込みニューラルネットワークを脳がん検出に活用することである。
論文参考訳（メタデータ） (2024-09-29T07:04:26Z)
Machine Learning for ALSFRS-R Score Prediction: Making Sense of the Sensor Data [44.99833362998488]
筋萎縮性側索硬化症(Amyotrophic Lateral Sclerosis、ALS)は、急速に進行する神経変性疾患である。 iDPP@CLEF 2024チャレンジを先導した今回の調査は,アプリから得られるセンサデータを活用することに焦点を当てている。
論文参考訳（メタデータ） (2024-07-10T19:17:23Z)
Evaluating Echo State Network for Parkinson's Disease Prediction using Voice Features [1.2289361708127877]
本研究の目的は,偽陰性の最小化と高精度化を両立できる診断モデルを開発することである。 Echo State Networks (ESN)、Random Forest、k-nearest Neighbors、Support Vector、Extreme Gradient Boosting、Decision Treeなど、さまざまな機械学習手法が採用され、徹底的に評価されている。 ESNは83%の症例で8%未満の偽陰性率を維持している。
論文参考訳（メタデータ） (2024-01-28T14:39:43Z)
Wav2vec-based Detection and Severity Level Classification of Dysarthria from Speech [15.150153248025543]
事前訓練したwav2vec 2.0モデルは, 検出および重度分類システムを構築するための特徴抽出器として研究されている。一般的なUA音声データベースを用いて実験を行った。
論文参考訳（メタデータ） (2023-09-25T13:00:33Z)
A Few-Shot Approach to Dysarthric Speech Intelligibility Level Classification Using Transformers [0.0]
発声障害(Dysarthria)は、言葉の発音が難しいことによるコミュニケーションを妨げる言語障害である。文献の多くは、変形性音声に対するASRシステムの改善に焦点を当てている。この研究は、変形の有無を正確に分類できるモデルを開発することを目的としている。
論文参考訳（メタデータ） (2023-09-17T17:23:41Z)
Automatic diagnosis of knee osteoarthritis severity using Swin transformer [55.01037422579516]
変形性膝関節症 (KOA) は膝関節の慢性的な痛みと硬直を引き起こす疾患である。我々は,Swin Transformer を用いて KOA の重大度を予測する自動手法を提案する。
論文参考訳（メタデータ） (2023-07-10T09:49:30Z)
Tissue Classification During Needle Insertion Using Self-Supervised Contrastive Learning and Optical Coherence Tomography [53.38589633687604]
針先端で取得した複雑なCT信号の位相および強度データから組織を分類するディープニューラルネットワークを提案する。トレーニングセットの10%で、提案した事前学習戦略により、モデルが0.84のF1スコアを達成するのに対して、モデルが0.60のF1スコアを得るのに対して、モデルが0.84のF1スコアを得るのに役立ちます。
論文参考訳（メタデータ） (2023-04-26T14:11:04Z)
Learning to diagnose cirrhosis from radiological and histological labels with joint self and weakly-supervised pretraining strategies [62.840338941861134]
そこで本稿では, 放射線学者が注釈付けした大規模データセットからの転写学習を活用して, 小さい付加データセットで利用できる組織学的スコアを予測することを提案する。我々は,肝硬変の予測を改善するために,異なる事前訓練法,すなわち弱い指導法と自己指導法を比較した。この方法は、METAVIRスコアのベースライン分類を上回り、AUCが0.84、バランスの取れた精度が0.75に達する。
論文参考訳（メタデータ） (2023-02-16T17:06:23Z)
Adaptation of Autoencoder for Sparsity Reduction From Clinical Notes Representation Learning [0.19573380763700707]
本稿では,臨床ノート表現の空間的縮小を生かしたオートエンコーダ学習アルゴリズムを提案する。その動機は, 臨床注記表現特徴空間の次元を小さくすることで, スパースな高次元データを圧縮する方法を決定することである。提案手法により,評価毎に最大3%の性能向上が得られた。
論文参考訳（メタデータ） (2022-09-26T16:37:37Z)
Multiple Time Series Fusion Based on LSTM An Application to CAP A Phase Classification Using EEG [56.155331323304]
本研究では,深層学習に基づく脳波チャンネルの特徴レベル融合を行う。チャネル選択,融合,分類手順を2つの最適化アルゴリズムで最適化した。
論文参考訳（メタデータ） (2021-12-18T14:17:49Z)
Medulloblastoma Tumor Classification using Deep Transfer Learning with Multi-Scale EfficientNets [63.62764375279861]
本稿では,エンド・ツー・エンドのMB腫瘍分類を提案し,様々な入力サイズとネットワーク次元の一致した移動学習を提案する。 161ケースのデータセットを用いて、より大規模な入力解像度を持つ事前学習されたEfficientNetが、大幅な性能改善をもたらすことを実証した。
論文参考訳（メタデータ） (2021-09-10T13:07:11Z)
Optimization of Genomic Classifiers for Clinical Deployment: Evaluation of Bayesian Optimization to Select Predictive Models of Acute Infection and In-Hospital Mortality [0.0]
血液から特定の遺伝子の発現レベルを定量化することにより、患者の免疫反応を特徴づけることにより、両方のタスクを遂行する潜在的によりタイムリーで正確な手段を示す。機械学習手法は、デプロイ対応の分類モデルの開発にこの‘ホスト応答’を活用するプラットフォームを提供する。急性感染症の診断分類器の開発におけるHO法と29の診断マーカーの遺伝子発現による院内死亡率の比較を行った。
論文参考訳（メタデータ） (2020-03-27T10:22:02Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。