論文の概要: Psychophysiological Arousal in Young Children Who Stutter: An
Interpretable AI Approach
- arxiv url: http://arxiv.org/abs/2208.08859v1
- Date: Wed, 3 Aug 2022 13:28:15 GMT
- ステータス: 処理完了
- システム内更新日: 2022-08-28 22:28:28.470435
- Title: Psychophysiological Arousal in Young Children Who Stutter: An
Interpretable AI Approach
- Title(参考訳): 若年者における心理的覚醒 : 解釈可能なAIアプローチ
- Authors: Harshit Sharma, Yi Xiao, Victoria Tumanova, Asif Salekin
- Abstract要約: 本研究は, 幼児期(CWS)児における, 子ども期(CWNS)児の生理的覚醒における第2・第2パターンの差異を効果的に把握し, 可視化するものである。
後者は言語的、認知的、コミュニケーション的要求を話者に導入する。
- 参考スコア(独自算出の注目度): 6.507353572917133
- License: http://creativecommons.org/licenses/by-nc-sa/4.0/
- Abstract: The presented first-of-its-kind study effectively identifies and visualizes
the second-by-second pattern differences in the physiological arousal of
preschool-age children who do stutter (CWS) and who do not stutter (CWNS) while
speaking perceptually fluently in two challenging conditions i.e speaking in
stressful situations and narration. The first condition may affect children's
speech due to high arousal; the latter introduces linguistic, cognitive, and
communicative demands on speakers. We collected physiological parameters data
from 70 children in the two target conditions. First, we adopt a novel
modality-wise multiple-instance-learning (MI-MIL) approach to classify CWS vs.
CWNS in different conditions effectively. The evaluation of this classifier
addresses four critical research questions that align with state-of-the-art
speech science studies' interests. Later, we leverage SHAP classifier
interpretations to visualize the salient, fine-grain, and temporal
physiological parameters unique to CWS at the population/group-level and
personalized-level. While group-level identification of distinct patterns would
enhance our understanding of stuttering etiology and development, the
personalized-level identification would enable remote, continuous, and
real-time assessment of stuttering children's physiological arousal, which may
lead to personalized, just-in-time interventions, resulting in an improvement
in speech fluency. The presented MI-MIL approach is novel, generalizable to
different domains, and real-time executable. Finally, comprehensive evaluations
are done on multiple datasets, presented framework, and several baselines that
identified notable insights on CWSs' physiological arousal during speech
production.
- Abstract(参考訳): 本研究は, ストレスのある状況とナレーションの2つの課題条件において, 幼児期(CWS)に起因し, CWNSに起因しない子どもの生理的覚醒における第2・第2パターンの差異を効果的に把握し, 可視化するものである。
第一の条件は、高覚醒による子供の発話に影響する可能性があるが、後者は話者に対する言語的、認知的、コミュニケーション的要求を導入する。
2つの対象条件において70名の小児の生理的パラメーターを収集した。
まず,CWS と CWNS を異なる条件で効果的に分類するために,MI-MIL (Modality-wise multiple-instance-learning) アプローチを採用する。
この分類器の評価は、最先端の音声科学研究の関心に沿った4つの重要な研究課題に対処する。
その後,shap分類器の解釈を活用し,個体群・集団・個人レベルでのcws特有の塩分,細粒度,時間的生理的パラメータを可視化した。
異なるパターンの集団レベルでの識別は、発声の根源と発達の理解を高めるが、パーソナライズドレベルの識別は、リモート、連続、リアルタイムに、発声の生理的覚醒の評価を可能にし、それがパーソナライズされたジャストインタイムの介入につながる可能性がある。
提案したMI-MILアプローチは斬新で、異なる領域に一般化可能であり、リアルタイム実行可能である。
最後に、複数のデータセット、提示されたフレームワーク、および音声生成中のCWSの生理的覚醒に関する注目すべき洞察を識別するいくつかのベースラインについて包括的な評価を行う。
関連論文リスト
- Identification of Cognitive Decline from Spoken Language through Feature
Selection and the Bag of Acoustic Words Model [0.0]
記憶障害の症状の早期発見は、集団の健康確保に重要な役割を担っている。
臨床環境における標準化された音声テストの欠如は、自然音声言語を解析するための自動機械学習技術の開発にますます重点を置いている。
この研究は特徴選択に関するアプローチを示し、ジュネーブの最小音響パラメータセットと相対音声停止から診断に必要な重要な特徴を自動的に選択することを可能にする。
論文 参考訳(メタデータ) (2024-02-02T17:06:03Z) - Understanding Spoken Language Development of Children with ASD Using
Pre-trained Speech Embeddings [26.703275678213135]
自然言語サンプル(NLS)分析は,従来の手法を補完する有望な手法として注目されている。
本稿では,子どもの音声言語発達の自動評価を支援するために,音声処理技術の応用を提案する。
論文 参考訳(メタデータ) (2023-05-23T14:39:49Z) - CIAO! A Contrastive Adaptation Mechanism for Non-Universal Facial
Expression Recognition [80.07590100872548]
本稿では、顔エンコーダの最後の層に異なるデータセットの特定の感情特性を適応させるメカニズムであるContrastive Inhibitory Adaptati On(CIAO)を提案する。
CIAOは、非常にユニークな感情表現を持つ6つの異なるデータセットに対して、表情認識性能が改善されている。
論文 参考訳(メタデータ) (2022-08-10T15:46:05Z) - Self-supervised models of audio effectively explain human cortical
responses to speech [71.57870452667369]
我々は、自己教師型音声表現学習の進歩に乗じて、人間の聴覚システムの最先端モデルを作成する。
これらの結果から,ヒト大脳皮質における音声処理の異なる段階に関連する情報の階層構造を,自己教師型モデルで効果的に把握できることが示唆された。
論文 参考訳(メタデータ) (2022-05-27T22:04:02Z) - Speech Detection For Child-Clinician Conversations In Danish For
Low-Resource In-The-Wild Conditions: A Case Study [6.4461798613033405]
デンマーク語における幼児・子どもの会話からなるデータセット上で,事前学習した音声モデルの性能について検討した。
その結果, 既定分類閾値のモデルでは, 患者集団の子どもに悪影響を及ぼすことが判明した。
本研究は,3分間のクリニック・チャイルド・会話が最適分類閾値を得るのに十分であることを示す。
論文 参考訳(メタデータ) (2022-04-25T10:51:54Z) - Perception Point: Identifying Critical Learning Periods in Speech for
Bilingual Networks [58.24134321728942]
ディープニューラルベース視覚唇読解モデルにおける認知的側面を比較し,識別する。
我々は、認知心理学におけるこれらの理論と独自のモデリングの間に強い相関関係を観察する。
論文 参考訳(メタデータ) (2021-10-13T05:30:50Z) - Automatic Analysis of the Emotional Content of Speech in Daylong
Child-Centered Recordings from a Neonatal Intensive Care Unit [3.7373314439051106]
フィンランドとエストニアの2つの病院から、幼児の音声環境から毎日何百時間もの録音が収集された。
本稿では、当初未発表の大規模実世界の音声データセットを導入し、フィンランドのサブセットを対象とした機能的SERシステムの開発について述べる。
最適性能モデルは73.4%の非重み付き平均リコールの分類性能を達成可能であることを示す。
論文 参考訳(メタデータ) (2021-06-14T11:17:52Z) - A Preliminary Study of a Two-Stage Paradigm for Preserving Speaker
Identity in Dysarthric Voice Conversion [50.040466658605524]
変形性音声変換(DVC)における話者同一性維持のための新しいパラダイムを提案する。
変形性音声の質は統計VCによって大幅に改善される。
しかし, 変形性関節症患者の通常の発話は, ほとんど収集できないため, 過去の研究は患者の個性を取り戻すことはできなかった。
論文 参考訳(メタデータ) (2021-06-02T18:41:03Z) - Pose-based Body Language Recognition for Emotion and Psychiatric Symptom
Interpretation [75.3147962600095]
通常のRGBビデオから始まるボディーランゲージに基づく感情認識のための自動フレームワークを提案する。
心理学者との連携により,精神症状予測の枠組みを拡張した。
提案されたフレームワークの特定のアプリケーションドメインは限られた量のデータしか供給しないため、フレームワークは小さなトレーニングセットで動作するように設計されている。
論文 参考訳(メタデータ) (2020-10-30T18:45:16Z) - Alzheimer's Dementia Recognition through Spontaneous Speech: The ADReSS
Challenge [10.497861245133086]
InterSPEECH 2020のADReSS Challengeでは、アルツハイマー認知症の自動認識に対する異なるアプローチを比較可能な共有タスクを定義している。
ADReSSは、年齢と性別の面で音響的に前処理されバランスが取れた、ベンチマーク音声データセットを研究者に提供する。
論文 参考訳(メタデータ) (2020-04-14T23:25:09Z) - 1-D Convlutional Neural Networks for the Analysis of Pupil Size
Variations in Scotopic Conditions [79.71065005161566]
1次元畳み込みニューラルネットワークモデルは、短距離配列の分類のために訓練されている。
モデルは、ホールドアウトテストセット上で、高い平均精度で予測を提供する。
論文 参考訳(メタデータ) (2020-02-06T17:25:37Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。