論文の概要: Towards Interpretability of Speech Pause in Dementia Detection using
Adversarial Learning
- arxiv url: http://arxiv.org/abs/2111.07454v1
- Date: Sun, 14 Nov 2021 21:26:18 GMT
- ステータス: 処理完了
- システム内更新日: 2021-11-16 17:49:20.316880
- Title: Towards Interpretability of Speech Pause in Dementia Detection using
Adversarial Learning
- Title(参考訳): 逆学習を用いた認知症検出における音声ポーズの解釈可能性の検討
- Authors: Youxiang Zhu, Bang Tran, Xiaohui Liang, John A. Batsis, Robert M. Roth
- Abstract要約: 発声停止は認知症検出に有効なバイオマーカーである。
近年のディープラーニングモデルは、高精度な認知症検出を実現するために、音声停止を利用した。
対人学習を用いた認知症感受性停止の位置と長さについて検討する。
- 参考スコア(独自算出の注目度): 4.19159477763309
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Speech pause is an effective biomarker in dementia detection. Recent deep
learning models have exploited speech pauses to achieve highly accurate
dementia detection, but have not exploited the interpretability of speech
pauses, i.e., what and how positions and lengths of speech pauses affect the
result of dementia detection. In this paper, we will study the positions and
lengths of dementia-sensitive pauses using adversarial learning approaches.
Specifically, we first utilize an adversarial attack approach by adding the
perturbation to the speech pauses of the testing samples, aiming to reduce the
confidence levels of the detection model. Then, we apply an adversarial
training approach to evaluate the impact of the perturbation in training
samples on the detection model. We examine the interpretability from the
perspectives of model accuracy, pause context, and pause length. We found that
some pauses are more sensitive to dementia than other pauses from the model's
perspective, e.g., speech pauses near to the verb "is". Increasing lengths of
sensitive pauses or adding sensitive pauses leads the model inference to
Alzheimer's Disease, while decreasing the lengths of sensitive pauses or
deleting sensitive pauses leads to non-AD.
- Abstract(参考訳): 発話停止は認知症検出に有効なバイオマーカーである。
近年の深層学習モデルは、高い精度の認知症検出を実現するために、音声ポーズを利用するが、音声ポーズの解釈可能性、すなわち、音声ポーズの位置と長さが認知症検出の結果に与える影響を活用していない。
本稿では,認知症に敏感なポーズの位置と長さについて,敵対的学習手法を用いて検討する。
具体的には,まず,テストサンプルの音声ポーズに摂動を付加して,検出モデルの信頼性レベルを低下させることにより,対角攻撃アプローチを利用する。
次に, 学習サンプルの摂動が検出モデルに与える影響を評価するために, 逆訓練手法を適用した。
モデル精度,停止状況,停止時間の観点から,解釈可能性について検討する。
いくつかのポーズは、モデルの観点から見た他のポーズよりも認知症に敏感であることがわかった。
敏感なポーズの長さの増加や敏感なポーズの追加はアルツハイマー病のモデル推論につながり、敏感なポーズの長さの減少や敏感なポーズの削除は非adに繋がる。
関連論文リスト
- Self-supervised Speech Models for Word-Level Stuttered Speech Detection [66.46810024006712]
自己教師付き音声モデルを利用した単語レベルの発声音声検出モデルを提案する。
本評価は, 単語レベルの発声検出において, 従来の手法を超越していることを示す。
論文 参考訳(メタデータ) (2024-09-16T20:18:20Z) - Infusing Acoustic Pause Context into Text-Based Dementia Assessment [7.8642589679025034]
本研究は, 認知障害のない被験者の認知状態, 軽度認知障害, およびアルツハイマー認知症を, 臨床的評価に基づいて区別するために, 言語モデルにおける停止強調文字の使用について検討した。
この性能は、ドイツ語の言語頻度テストと画像記述テストの実験を通じて評価され、異なる音声生成コンテキストにおけるモデルの有効性を比較した。
論文 参考訳(メタデータ) (2024-08-27T16:44:41Z) - Inappropriate Pause Detection In Dysarthric Speech Using Large-Scale
Speech Recognition [2.7309692684728617]
不適切な停止は重度評価や言語療法において重要な指標である。
変形性音声における不適切なポーズ検出のための大規模音声認識モデルを提案する。
本実験により, 変形性関節症音声における不適切なポーズを, ベースラインよりもよく検出できることが示唆された。
論文 参考訳(メタデータ) (2024-02-29T07:29:42Z) - Regressor-Segmenter Mutual Prompt Learning for Crowd Counting [70.49246560246736]
本稿では,アノテーションの差によるバイアスや不正確性を解決するために,相互学習(mPrompt)を提案する。
実験により、mPromptは平均誤差(MAE)を著しく減少させることが示された。
論文 参考訳(メタデータ) (2023-12-04T07:53:59Z) - Automatically measuring speech fluency in people with aphasia: first
achievements using read-speech data [55.84746218227712]
本研究の目的は,言語習得の分野で開発された信号処理algorithmの関連性を評価することである。
論文 参考訳(メタデータ) (2023-08-09T07:51:40Z) - Leveraging Pretrained Representations with Task-related Keywords for
Alzheimer's Disease Detection [69.53626024091076]
アルツハイマー病(AD)は高齢者に特に顕著である。
事前学習モデルの最近の進歩は、AD検出モデリングを低レベル特徴から高レベル表現にシフトさせる動機付けとなっている。
本稿では,高レベルの音響・言語的特徴から,より優れたAD関連手がかりを抽出する,いくつかの効率的な手法を提案する。
論文 参考訳(メタデータ) (2023-03-14T16:03:28Z) - Deep Learning for Hate Speech Detection: A Comparative Study [54.42226495344908]
ここでは, ディープ・ヘイト・音声検出法と浅いヘイト・音声検出法を大規模に比較した。
私たちの目標は、この地域の進歩を照らし、現在の最先端の強みと弱点を特定することです。
そこで我々は,ヘイトスピーチ検出の実践的利用に関するガイダンスの提供,最先端の定量化,今後の研究方向の特定を目的としている。
論文 参考訳(メタデータ) (2022-02-19T03:48:20Z) - Incremental False Negative Detection for Contrastive Learning [95.68120675114878]
本稿では,自己指導型コントラスト学習のための新たな偽陰性検出手法を提案する。
対照的な学習では、検出された偽陰性を明示的に除去する2つの戦略について議論する。
提案手法は,制限された計算内での複数のベンチマークにおいて,他の自己教師付きコントラスト学習フレームワークよりも優れる。
論文 参考訳(メタデータ) (2021-06-07T15:29:14Z) - Stuttering Speech Disfluency Prediction using Explainable Attribution
Vectors of Facial Muscle Movements [2.6540572249827514]
発声などの発声障害は、不随意反復、延長、音節や音節のブロックによって、通常の発声を阻害する。
近年,音声発声時の呼吸速度,音声等からAIアルゴリズムを用いて発声を自動的に検出する手法が研究されている。
非侵襲的にキャプチャ可能な、AWSの音声前の顔活動には、今後の発声を流音または発声のいずれかとして正確に分類するための十分な情報が含まれている、という仮説を立てています。
論文 参考訳(メタデータ) (2020-10-02T23:45:41Z) - Identification of Dementia Using Audio Biomarkers [15.740689461116762]
本研究の目的は、認知症のステージを自動的に識別するために、音声処理と機械学習技術を使用することである。
非言語的音響パラメータはこの目的のために使われ、言語に依存しないアプローチとなっている。
我々は, スペクトル, 時間, ケプストラム等の音響特性の寄与と, 認知症ステージの同定への選択について分析した。
論文 参考訳(メタデータ) (2020-02-27T13:54:00Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。