論文の概要: Paediatric-HGNN: A Hybrid Heterogeneous Graph Neural Network for Detecting Disfluency in Children's Speech via Multiscale Acoustic Fusion
- arxiv url: http://arxiv.org/abs/2606.08210v1
- Date: Sat, 06 Jun 2026 14:54:44 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-06-09 14:42:05.973634
- Title: Paediatric-HGNN: A Hybrid Heterogeneous Graph Neural Network for Detecting Disfluency in Children's Speech via Multiscale Acoustic Fusion
- Title(参考訳): Paediatric-HGNN:マルチスケール音響融合による幼児音声の拡散検出のためのハイブリッド不均一グラフニューラルネットワーク
- Authors: Rashini Liyanarachchi, Rachael Mackay, Alison Short, Aditya Joshi, Erik Meijering,
- Abstract要約: 小児科データに適したコンテキスト認識型パートホールインタラクションネットワーク(CaPIN)を用いたフレームワークであるPaediatric-HGNNを紹介する。
従来の1次元信号モデリングの代わりに、語彙単位(ワードノード)と細粒度音響セグメント(フレームノード)の階層的関係を解析する異種グラフを構築した。
Paediatric-HGNNでは82.4%の重み付け精度と0.386の典型的拡散F1スコアを達成している。
- 参考スコア(独自算出の注目度): 11.858767102945668
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Automated stuttering detection (ASD) systems struggle with paediatric speech due to high acoustic variability in developing voices and the subtle distinction between pathological stuttering and typical developmental disfluencies. We introduce Paediatric-HGNN, a framework using a Context-aware Part-whole Interaction Network (CaPIN) tailored for paediatric data. Instead of conventional 1D signal modelling, our approach builds a heterogeneous graph capturing hierarchical relationships between lexical units (word nodes) and fine-grained acoustic segments (frame nodes). Trained on curated paediatric corpora (UCLASS and FluencyBank), Paediatric-HGNN achieves 82.4% weighted accuracy and a Typical Disfluency F1-score of 0.386. Modelling hierarchical lexical-acoustic interactions captures developmental "searching" behaviour, offering a more robust and interpretable tool for early clinical intervention.
- Abstract(参考訳): 発声音声の音響的変動や,病的発声と典型的な発達障害の微妙な区別が原因で,ASDシステムは小児音声に苦しむ。
小児科データに適したコンテキスト認識型パートホールインタラクションネットワーク(CaPIN)を用いたフレームワークであるPaediatric-HGNNを紹介する。
従来の1次元信号モデリングの代わりに、語彙単位(ワードノード)と細粒度音響セグメント(フレームノード)の階層的関係を解析する異種グラフを構築した。
キュレートされた小児コーパス(UCLASSとFluencyBank)で訓練されたPediatric-HGNNの重み付け精度は82.4%、典型的拡散F1スコアは0.386である。
階層的語彙-音響相互作用のモデル化は、発達的「調査」の振る舞いを捉え、早期臨床介入のためのより堅牢で解釈可能なツールを提供する。
関連論文リスト
- Multi-View Speech Representation Learning for Parkinson's Disease Detection Using Context-guided Cross-modal Attention [9.395262542018235]
本稿では,パーキンソン病の自動検出のためのマルチブランチ深層学習フレームワークを提案する。
提案したアーキテクチャは91.51%の精度、F1スコアは91.24%、AUCは95.97%である。
論文 参考訳(メタデータ) (2026-06-08T09:39:33Z) - A Semantically Enhanced Generative Foundation Model Improves Pathological Image Synthesis [82.01597026329158]
本稿では,組織合成のための相関調整フレームワーク(CRAFTS)について紹介する。
CRAFTSは、生物学的精度を確保するためにセマンティックドリフトを抑制する新しいアライメント機構を組み込んでいる。
本モデルは,30種類の癌にまたがる多彩な病理像を生成する。
論文 参考訳(メタデータ) (2025-12-15T10:22:43Z) - NeuroXVocal: Detection and Explanation of Alzheimer's Disease through Non-invasive Analysis of Picture-prompted Speech [4.815952991777717]
NeuroXVocalは、音声分析によってアルツハイマー病(AD)の可能性を分類し、説明する新しい二重成分システムである。
分類コンポーネント(Neuro)は、音声パターンと音声特徴をキャプチャする音響特徴、音声書き起こしから抽出したテキスト特徴、言語パターンを表す事前計算された埋め込みの3つの異なるデータストリームを処理する。
説明可能性コンポーネント(XVocal)は、大規模言語モデルとAD研究文献のドメイン固有の知識ベースを組み合わせた、検索・拡張生成(RAG)アプローチを実装している。
論文 参考訳(メタデータ) (2025-02-14T12:09:49Z) - Modality-Order Matters! A Novel Hierarchical Feature Fusion Method for CoSAm: A Code-Switched Autism Corpus [3.06952918690254]
本研究は,小児における早期ASD検出の促進を目的とした,新しい階層的特徴融合法を提案する。
この手法は、コードスイッチされた音声コーパスであるCoSAmを、ASDと一致した制御グループと診断された子供から収集する。
このデータセットは、ASDと診断された30人の子供から61人の音声記録と、神経型児から31人の音声記録を含んでおり、3歳から13歳の間である。
論文 参考訳(メタデータ) (2024-07-19T14:06:01Z) - Reliable Joint Segmentation of Retinal Edema Lesions in OCT Images [55.83984261827332]
本稿では,信頼性の高いマルチスケールウェーブレットエンハンストランスネットワークを提案する。
本研究では,ウェーブレット型特徴抽出器ネットワークとマルチスケール変圧器モジュールを統合したセグメンテーションバックボーンを開発した。
提案手法は,他の最先端セグメンテーション手法と比較して信頼性の高いセグメンテーション精度を実現する。
論文 参考訳(メタデータ) (2022-12-01T07:32:56Z) - Factored Attention and Embedding for Unstructured-view Topic-related
Ultrasound Report Generation [70.7778938191405]
本研究では,非構造的トピック関連超音波レポート生成のための新しい因子的注意・埋め込みモデル(FAE-Gen)を提案する。
提案したFAE-Genは主に2つのモジュール、すなわちビュー誘導因子の注意とトピック指向因子の埋め込みから構成されており、異なるビューで均質および不均一な形態的特徴を捉えている。
論文 参考訳(メタデータ) (2022-03-12T15:24:03Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。