論文の概要: Unified Pathological Speech Analysis with Prompt Tuning
- arxiv url: http://arxiv.org/abs/2411.04142v1
- Date: Tue, 05 Nov 2024 06:47:26 GMT
- ステータス: 翻訳完了
- システム内更新日: 2024-11-08 19:37:42.858901
- Title: Unified Pathological Speech Analysis with Prompt Tuning
- Title(参考訳): Prompt Tuning を用いた統一型病的音声解析
- Authors: Fei Yang, Xuenan Xu, Mengyue Wu, Kai Yu,
- Abstract要約: そこで本研究では,3つの疾患を対象とした統一的な病的音声解析システムを提案する。
本システムでは, プロンプトチューニングを用いて, パラメータのごく一部だけを調整し, 考えられる患者の音声から異なる疾患を検出する。
アルツハイマー病,うつ病,パーキンソン病について検討した。
- 参考スコア(独自算出の注目度): 27.997527691768173
- License:
- Abstract: Pathological speech analysis has been of interest in the detection of certain diseases like depression and Alzheimer's disease and attracts much interest from researchers. However, previous pathological speech analysis models are commonly designed for a specific disease while overlooking the connection between diseases, which may constrain performance and lower training efficiency. Instead of fine-tuning deep models for different tasks, prompt tuning is a much more efficient training paradigm. We thus propose a unified pathological speech analysis system for as many as three diseases with the prompt tuning technique. This system uses prompt tuning to adjust only a small part of the parameters to detect different diseases from speeches of possible patients. Our system leverages a pre-trained spoken language model and demonstrates strong performance across multiple disorders while only fine-tuning a fraction of the parameters. This efficient training approach leads to faster convergence and improved F1 scores by allowing knowledge to be shared across tasks. Our experiments on Alzheimer's disease, Depression, and Parkinson's disease show competitive results, highlighting the effectiveness of our method in pathological speech analysis.
- Abstract(参考訳): 病理学的音声分析はうつ病やアルツハイマー病などの特定の疾患の検出に興味を持ち、研究者から多くの関心を集めている。
しかし, 従来の病的音声解析モデルでは, 疾患間の関連性を見越しながら, パフォーマンスや訓練効率の低下を抑えつつ, 特定の疾患に対して設計されている。
異なるタスクのためのディープモデルを微調整する代わりに、プロンプトチューニングはより効率的なトレーニングパラダイムである。
そこで本研究では,本手法を用いて,最大3つの疾患を対象とした統一的な病的音声解析システムを提案する。
本システムでは, プロンプトチューニングを用いて, パラメータのごく一部だけを調整し, 考えられる患者の音声から異なる疾患を検出する。
本システムは、事前学習した音声言語モデルを活用し、パラメータのごく一部を微調整しながら、複数の障害にまたがる強い性能を示す。
この効率的なトレーニングアプローチは、タスク間で知識を共有することによって、より早く収束し、F1スコアを改善します。
アルツハイマー病, うつ病, パーキンソン病に対する実験は, 競合する結果を示し, 病的音声解析における本法の有効性を浮き彫りにした。
関連論文リスト
- Explainable cognitive decline detection in free dialogues with a Machine Learning approach based on pre-trained Large Language Models [6.817247544942709]
我々は,認知の低下を検出するために,自由対話から特徴を抽出するために,Large Language Modelsを提案する。
本ソリューションは, (i) 事前処理, (ii) 自然言語処理技術による特徴工学, (iii) 性能を最適化するための特徴解析と選択, (iv) 自動説明可能性による分類を含む。
論文 参考訳(メタデータ) (2024-11-04T12:38:08Z) - Selfsupervised learning for pathological speech detection [0.0]
音声生成は、様々な神経変性疾患による影響と破壊を受けやすい。
これらの障害は、異常な発声パターンと不正確な調音を特徴とする病的発声を引き起こす。
ニューロタイプ話者とは異なり、言語障害や障害のある患者は、AlexaやSiriなど、さまざまなバーチャルアシスタントにアクセスできない。
論文 参考訳(メタデータ) (2024-05-16T07:12:47Z) - MMGPL: Multimodal Medical Data Analysis with Graph Prompt Learning [31.21351373001379]
神経疾患の診断のための多モード大規模モデルの微調整過程におけるグラフプロンプトの学習による新しいプロンプト学習モデルを提案する。
具体的には、まずGPT-4を利用して、関連する疾患の概念を取得し、これらの概念とすべてのパッチのセマンティックな類似性を計算する。
第2に、各パッチと疾患関連概念のセマンティックな類似性に応じて、無関係パッチの重量を減少させる。
論文 参考訳(メタデータ) (2023-12-22T10:10:50Z) - Empowering Psychotherapy with Large Language Models: Cognitive
Distortion Detection through Diagnosis of Thought Prompting [82.64015366154884]
本研究では,認知的歪み検出の課題について検討し,思考の早期発見(DoT)を提案する。
DoTは、事実と思考を分離するための主観的評価、思考と矛盾する推論プロセスを引き出すための対照的な推論、認知スキーマを要約するスキーマ分析という3つの段階を通して、患者のスピーチの診断を行う。
実験により、DoTは認知的歪み検出のためのChatGPTよりも大幅に改善され、一方で人間の専門家が承認した高品質な合理性を生成することが示された。
論文 参考訳(メタデータ) (2023-10-11T02:47:21Z) - Leveraging Pretrained Representations with Task-related Keywords for
Alzheimer's Disease Detection [69.53626024091076]
アルツハイマー病(AD)は高齢者に特に顕著である。
事前学習モデルの最近の進歩は、AD検出モデリングを低レベル特徴から高レベル表現にシフトさせる動機付けとなっている。
本稿では,高レベルの音響・言語的特徴から,より優れたAD関連手がかりを抽出する,いくつかの効率的な手法を提案する。
論文 参考訳(メタデータ) (2023-03-14T16:03:28Z) - NeuralSympCheck: A Symptom Checking and Disease Diagnostic Neural Model
with Logic Regularization [59.15047491202254]
症状検査システムは、患者に症状を問い合わせ、迅速で手頃な価格の医療評価を行う。
本稿では,論理正則化を用いたニューラルネットワークの教師付き学習に基づく新しい手法を提案する。
以上の結果から,本手法は診断回数や症状が大きい場合の診断精度において,最も優れた方法であることがわかった。
論文 参考訳(メタデータ) (2022-06-02T07:57:17Z) - Multi-modal fusion with gating using audio, lexical and disfluency
features for Alzheimer's Dementia recognition from spontaneous speech [11.34426502082293]
本論文は、自発音声(ADReSS)によるアルツハイマー認知症への挑戦である。
本研究の目的は、音声データからアルツハイマー病の重症度の自動予測を支援する方法を開発することである。
論文 参考訳(メタデータ) (2021-06-17T17:20:57Z) - A Preliminary Study of a Two-Stage Paradigm for Preserving Speaker
Identity in Dysarthric Voice Conversion [50.040466658605524]
変形性音声変換(DVC)における話者同一性維持のための新しいパラダイムを提案する。
変形性音声の質は統計VCによって大幅に改善される。
しかし, 変形性関節症患者の通常の発話は, ほとんど収集できないため, 過去の研究は患者の個性を取り戻すことはできなかった。
論文 参考訳(メタデータ) (2021-06-02T18:41:03Z) - Parkinsonian Chinese Speech Analysis towards Automatic Classification of
Parkinson's Disease [31.431256876809343]
パーキンソン病(PD)の早期に発する発声障害
中国語の音声コーパスを新たに構築し,PD患者の分類について検討した。
我々の分類精度は最先端の研究をはるかに上回った。
論文 参考訳(メタデータ) (2021-05-31T04:51:44Z) - Select-ProtoNet: Learning to Select for Few-Shot Disease Subtype
Prediction [55.94378672172967]
本研究は, 類似患者のサブグループを同定し, 数発の疾患のサブタイプ予測問題に焦点を当てた。
新しいモデルを開発するためにメタラーニング技術を導入し、関連する臨床課題から共通の経験や知識を抽出する。
我々の新しいモデルは、単純だが効果的なメタ学習マシンであるPrototypeal Networkと呼ばれる、慎重に設計されたメタラーナーに基づいて構築されている。
論文 参考訳(メタデータ) (2020-09-02T02:50:30Z) - Detecting Parkinsonian Tremor from IMU Data Collected In-The-Wild using
Deep Multiple-Instance Learning [59.74684475991192]
パーキンソン病(英: Parkinson's Disease、PD)は、60歳以上の人口の約1%に影響を与える徐々に進化する神経学的疾患である。
PD症状には、震動、剛性、ブレイキネジアがある。
本稿では,スマートフォン端末から受信したIMU信号に基づいて,PDに関連するトレモラスなエピソードを自動的に識別する手法を提案する。
論文 参考訳(メタデータ) (2020-05-06T09:02:30Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。