論文の概要: Psychophysiological Arousal in Young Children Who Stutter: An
Interpretable AI Approach
- arxiv url: http://arxiv.org/abs/2208.08859v1
- Date: Wed, 3 Aug 2022 13:28:15 GMT
- ステータス: 処理完了
- システム内更新日: 2022-08-28 22:28:28.470435
- Title: Psychophysiological Arousal in Young Children Who Stutter: An
Interpretable AI Approach
- Title(参考訳): 若年者における心理的覚醒 : 解釈可能なAIアプローチ
- Authors: Harshit Sharma, Yi Xiao, Victoria Tumanova, Asif Salekin
- Abstract要約: 本研究は, 幼児期(CWS)児における, 子ども期(CWNS)児の生理的覚醒における第2・第2パターンの差異を効果的に把握し, 可視化するものである。
後者は言語的、認知的、コミュニケーション的要求を話者に導入する。
- 参考スコア(独自算出の注目度): 6.507353572917133
- License: http://creativecommons.org/licenses/by-nc-sa/4.0/
- Abstract: The presented first-of-its-kind study effectively identifies and visualizes
the second-by-second pattern differences in the physiological arousal of
preschool-age children who do stutter (CWS) and who do not stutter (CWNS) while
speaking perceptually fluently in two challenging conditions i.e speaking in
stressful situations and narration. The first condition may affect children's
speech due to high arousal; the latter introduces linguistic, cognitive, and
communicative demands on speakers. We collected physiological parameters data
from 70 children in the two target conditions. First, we adopt a novel
modality-wise multiple-instance-learning (MI-MIL) approach to classify CWS vs.
CWNS in different conditions effectively. The evaluation of this classifier
addresses four critical research questions that align with state-of-the-art
speech science studies' interests. Later, we leverage SHAP classifier
interpretations to visualize the salient, fine-grain, and temporal
physiological parameters unique to CWS at the population/group-level and
personalized-level. While group-level identification of distinct patterns would
enhance our understanding of stuttering etiology and development, the
personalized-level identification would enable remote, continuous, and
real-time assessment of stuttering children's physiological arousal, which may
lead to personalized, just-in-time interventions, resulting in an improvement
in speech fluency. The presented MI-MIL approach is novel, generalizable to
different domains, and real-time executable. Finally, comprehensive evaluations
are done on multiple datasets, presented framework, and several baselines that
identified notable insights on CWSs' physiological arousal during speech
production.
- Abstract(参考訳): 本研究は, ストレスのある状況とナレーションの2つの課題条件において, 幼児期(CWS)に起因し, CWNSに起因しない子どもの生理的覚醒における第2・第2パターンの差異を効果的に把握し, 可視化するものである。
第一の条件は、高覚醒による子供の発話に影響する可能性があるが、後者は話者に対する言語的、認知的、コミュニケーション的要求を導入する。
2つの対象条件において70名の小児の生理的パラメーターを収集した。
まず,CWS と CWNS を異なる条件で効果的に分類するために,MI-MIL (Modality-wise multiple-instance-learning) アプローチを採用する。
この分類器の評価は、最先端の音声科学研究の関心に沿った4つの重要な研究課題に対処する。
その後,shap分類器の解釈を活用し,個体群・集団・個人レベルでのcws特有の塩分,細粒度,時間的生理的パラメータを可視化した。
異なるパターンの集団レベルでの識別は、発声の根源と発達の理解を高めるが、パーソナライズドレベルの識別は、リモート、連続、リアルタイムに、発声の生理的覚醒の評価を可能にし、それがパーソナライズされたジャストインタイムの介入につながる可能性がある。
提案したMI-MILアプローチは斬新で、異なる領域に一般化可能であり、リアルタイム実行可能である。
最後に、複数のデータセット、提示されたフレームワーク、および音声生成中のCWSの生理的覚醒に関する注目すべき洞察を識別するいくつかのベースラインについて包括的な評価を行う。
関連論文リスト
- Egocentric Speaker Classification in Child-Adult Dyadic Interactions: From Sensing to Computational Modeling [30.099739460287566]
自閉症スペクトラム障害(Autism spectrum disorder、ASD)は、社会的コミュニケーション、反復行動、感覚処理における課題を特徴とする神経発達状態である。
ASDにおける重要な研究領域は、治療中の子供の行動変化を評価することである。
これらの相互作用における子どもの行動を理解する基本的な側面は、自動音声理解である。
論文 参考訳(メタデータ) (2024-09-14T07:03:08Z) - Selfsupervised learning for pathological speech detection [0.0]
音声生成は、様々な神経変性疾患による影響と破壊を受けやすい。
これらの障害は、異常な発声パターンと不正確な調音を特徴とする病的発声を引き起こす。
ニューロタイプ話者とは異なり、言語障害や障害のある患者は、AlexaやSiriなど、さまざまなバーチャルアシスタントにアクセスできない。
論文 参考訳(メタデータ) (2024-05-16T07:12:47Z) - Exploring Speech Pattern Disorders in Autism using Machine Learning [12.469348589699766]
本研究は, 被験者と患者との対話の分析を通じて, 独特の音声パターンを識別するための包括的アプローチを提案する。
我々は,40の音声関連特徴を抽出し,周波数,ゼロクロス速度,エネルギー,スペクトル特性,メル周波数ケプストラル係数(MFCC),バランスに分類した。
分類モデルはASDと非ASDを区別することを目的としており、精度は87.75%である。
論文 参考訳(メタデータ) (2024-05-03T02:59:15Z) - Identification of Cognitive Decline from Spoken Language through Feature
Selection and the Bag of Acoustic Words Model [0.0]
記憶障害の症状の早期発見は、集団の健康確保に重要な役割を担っている。
臨床環境における標準化された音声テストの欠如は、自然音声言語を解析するための自動機械学習技術の開発にますます重点を置いている。
この研究は特徴選択に関するアプローチを示し、ジュネーブの最小音響パラメータセットと相対音声停止から診断に必要な重要な特徴を自動的に選択することを可能にする。
論文 参考訳(メタデータ) (2024-02-02T17:06:03Z) - CIAO! A Contrastive Adaptation Mechanism for Non-Universal Facial
Expression Recognition [80.07590100872548]
本稿では、顔エンコーダの最後の層に異なるデータセットの特定の感情特性を適応させるメカニズムであるContrastive Inhibitory Adaptati On(CIAO)を提案する。
CIAOは、非常にユニークな感情表現を持つ6つの異なるデータセットに対して、表情認識性能が改善されている。
論文 参考訳(メタデータ) (2022-08-10T15:46:05Z) - Self-supervised models of audio effectively explain human cortical
responses to speech [71.57870452667369]
我々は、自己教師型音声表現学習の進歩に乗じて、人間の聴覚システムの最先端モデルを作成する。
これらの結果から,ヒト大脳皮質における音声処理の異なる段階に関連する情報の階層構造を,自己教師型モデルで効果的に把握できることが示唆された。
論文 参考訳(メタデータ) (2022-05-27T22:04:02Z) - Perception Point: Identifying Critical Learning Periods in Speech for
Bilingual Networks [58.24134321728942]
ディープニューラルベース視覚唇読解モデルにおける認知的側面を比較し,識別する。
我々は、認知心理学におけるこれらの理論と独自のモデリングの間に強い相関関係を観察する。
論文 参考訳(メタデータ) (2021-10-13T05:30:50Z) - Automatic Analysis of the Emotional Content of Speech in Daylong
Child-Centered Recordings from a Neonatal Intensive Care Unit [3.7373314439051106]
フィンランドとエストニアの2つの病院から、幼児の音声環境から毎日何百時間もの録音が収集された。
本稿では、当初未発表の大規模実世界の音声データセットを導入し、フィンランドのサブセットを対象とした機能的SERシステムの開発について述べる。
最適性能モデルは73.4%の非重み付き平均リコールの分類性能を達成可能であることを示す。
論文 参考訳(メタデータ) (2021-06-14T11:17:52Z) - A Preliminary Study of a Two-Stage Paradigm for Preserving Speaker
Identity in Dysarthric Voice Conversion [50.040466658605524]
変形性音声変換(DVC)における話者同一性維持のための新しいパラダイムを提案する。
変形性音声の質は統計VCによって大幅に改善される。
しかし, 変形性関節症患者の通常の発話は, ほとんど収集できないため, 過去の研究は患者の個性を取り戻すことはできなかった。
論文 参考訳(メタデータ) (2021-06-02T18:41:03Z) - Pose-based Body Language Recognition for Emotion and Psychiatric Symptom
Interpretation [75.3147962600095]
通常のRGBビデオから始まるボディーランゲージに基づく感情認識のための自動フレームワークを提案する。
心理学者との連携により,精神症状予測の枠組みを拡張した。
提案されたフレームワークの特定のアプリケーションドメインは限られた量のデータしか供給しないため、フレームワークは小さなトレーニングセットで動作するように設計されている。
論文 参考訳(メタデータ) (2020-10-30T18:45:16Z) - 1-D Convlutional Neural Networks for the Analysis of Pupil Size
Variations in Scotopic Conditions [79.71065005161566]
1次元畳み込みニューラルネットワークモデルは、短距離配列の分類のために訓練されている。
モデルは、ホールドアウトテストセット上で、高い平均精度で予測を提供する。
論文 参考訳(メタデータ) (2020-02-06T17:25:37Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。