論文の概要: Detecting Children with Autism Spectrum Disorder based on Script-Centric Behavior Understanding with Emotional Enhancement
- arxiv url: http://arxiv.org/abs/2411.09413v2
- Date: Tue, 29 Apr 2025 07:46:18 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-04-30 20:17:25.590437
- Title: Detecting Children with Autism Spectrum Disorder based on Script-Centric Behavior Understanding with Emotional Enhancement
- Title(参考訳): 感情強調によるスクリプト中心行動理解に基づく自閉症スペクトラム障害児の検出
- Authors: Wenxing Liu, Yueran Pan, Dong Zhang, Hongzhu Deng, Xiaobing Zou, Ming Li,
- Abstract要約: 本稿では,ゼロショット自閉症スペクトラム(ASD)検出フレームワークを提案する。
提案したパイプラインは、コンピュータビジョン技術を用いて、音声・視覚データを構造化された行動テキストスクリプトに自動的に変換する。
平均年齢2歳児のASD診断におけるF1スコアは95.24%であり,解釈可能な検出基準が得られた。
- 参考スコア(独自算出の注目度): 9.55864687646197
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: The early diagnosis of autism spectrum disorder (ASD) is critically dependent on systematic observation and analysis of children's social behaviors. While current methodologies predominantly utilize supervised learning approaches, their clinical adoption faces two principal limitations: insufficient ASD diagnostic samples and inadequate interpretability of the detection outcomes. This paper presents a novel zero-shot ASD detection framework based on script-centric behavioral understanding with emotional enhancement, which is designed to overcome the aforementioned clinical constraints. The proposed pipeline automatically converts audio-visual data into structured behavioral text scripts through computer vision techniques, subsequently capitalizing on the generalization capabilities of large language models (LLMs) for zero-shot/few-shot ASD detection. Three core technical contributions are introduced: (1) A multimodal script transcription module transforming behavioral cues into structured textual representations. (2) An emotion textualization module encoding emotional dynamics as the contextual features to augment behavioral understanding. (3) A domain-specific prompt engineering strategy enables the injection of clinical knowledge into LLMs. Our method achieves an F1-score of 95.24\% in diagnosing ASD in children with an average age of two years while generating interpretable detection rationales. This work opens up new avenues for leveraging the power of LLMs in analyzing and understanding ASD-related human behavior, thereby enhancing the accuracy of assisted autism diagnosis.
- Abstract(参考訳): 自閉症スペクトラム障害(ASD)の早期診断は、子どもの社会的行動の体系的な観察と分析に極めて依存している。
現在の手法は、主に教師付き学習アプローチを使用しているが、その臨床応用には、ASD診断サンプルの不十分さと、検出結果の不十分さの2つの主要な制限がある。
本稿では、上記の臨床上の制約を克服するために、スクリプト中心の行動理解と感情の強化に基づくゼロショット型ASD検出フレームワークを提案する。
提案したパイプラインは,音声-視覚データをコンピュータビジョン技術により構造化された行動テキストスクリプトに自動的に変換し,その後,ゼロショット/フェーショットのASD検出のための大規模言語モデル(LLM)の一般化機能を活用する。
1) 動作キューを構造化されたテキスト表現に変換するマルチモーダルスクリプト転写モジュール。
2)行動理解を増強する文脈的特徴として感情動態を符号化した感情テキスト化モジュール。
(3) 臨床知識のLLMへの注入を可能にするドメイン特異的プロンプトエンジニアリング戦略。
平均年齢2歳児のASD診断におけるF1スコアは95.24\%であり,解釈可能な検出基準が得られた。
本研究は、ALD関連人間の行動を分析し、理解する上で、LSMの力を利用するための新たな道を開くことで、自閉症診断の精度を高める。
関連論文リスト
- AGIR: Assessing 3D Gait Impairment with Reasoning based on LLMs [0.0]
歩行障害は、神経変性疾患の早期診断、疾患モニタリング、治療評価において重要な役割を果たす。
近年のディープラーニングベースのアプローチは、分類精度を一貫して改善しているが、解釈可能性に欠けることが多い。
本稿では、事前訓練されたVQ-VAEモーショントークンライザと、一対のモーショントークン上で微調整されたLarge Language Model(LLM)からなる新しいパイプラインであるAGIRを紹介する。
論文 参考訳(メタデータ) (2025-03-23T17:12:16Z) - Detecting Neurocognitive Disorders through Analyses of Topic Evolution and Cross-modal Consistency in Visual-Stimulated Narratives [84.03001845263]
神経認知障害(NCD)の早期発見は、時間的介入と疾患管理に不可欠である。
伝統的な物語分析は、しばしば単語の使用法や構文など、ミクロ構造における局所的な指標に焦点を当てる。
本稿では,話題の変化,時間的ダイナミクス,物語の時間的コヒーレンスを分析することによって,特定の認知的・言語的課題を解明することを提案する。
論文 参考訳(メタデータ) (2025-01-07T12:16:26Z) - Explainable AI for Autism Diagnosis: Identifying Critical Brain Regions Using fMRI Data [0.29687381456163997]
自閉症スペクトラム障害(ASD)の早期診断と介入は、自閉症者の生活の質を著しく向上させることが示されている。
ASDの客観的バイオマーカーは診断精度の向上に役立つ。
深層学習(DL)は,医療画像データから疾患や病態を診断する上で,優れた成果を上げている。
本研究の目的は, ASD の精度と解釈性を向上させることであり, ASD を正確に分類できるだけでなく,その動作に関する説明可能な洞察を提供する DL モデルを作成することである。
論文 参考訳(メタデータ) (2024-09-19T23:08:09Z) - Diagnostic Reasoning in Natural Language: Computational Model and Application [68.47402386668846]
言語基底タスク(NL-DAR)の文脈における診断誘導推論(DAR)について検討する。
パール構造因果モデルに基づくNL-DARの新しいモデリングフレームワークを提案する。
得られたデータセットを用いて,NL-DARにおける人間の意思決定過程を解析する。
論文 参考訳(メタデータ) (2024-09-09T06:55:37Z) - Enhancing Autism Spectrum Disorder Early Detection with the Parent-Child Dyads Block-Play Protocol and an Attention-enhanced GCN-xLSTM Hybrid Deep Learning Framework [6.785167067600156]
本研究は,ASDと発達幼児を区別する行動パターンを識別するための,親子ダイズブロックプレイ(PCB)プロトコルを提案する。
40人のASDと89人のTD幼児が親とのブロックプレイに従事している。
このデータセットは、参加者の規模と個々のセッションの長さの両方に関する以前の取り組みを上回る。
論文 参考訳(メタデータ) (2024-08-29T21:53:01Z) - Modality-Order Matters! A Novel Hierarchical Feature Fusion Method for CoSAm: A Code-Switched Autism Corpus [3.06952918690254]
本研究は,小児における早期ASD検出の促進を目的とした,新しい階層的特徴融合法を提案する。
この手法は、コードスイッチされた音声コーパスであるCoSAmを、ASDと一致した制御グループと診断された子供から収集する。
このデータセットは、ASDと診断された30人の子供から61人の音声記録と、神経型児から31人の音声記録を含んでおり、3歳から13歳の間である。
論文 参考訳(メタデータ) (2024-07-19T14:06:01Z) - Localizing Moments of Actions in Untrimmed Videos of Infants with Autism Spectrum Disorder [5.2289135066938375]
乳児ビデオにおけるASD関連行動の同定を目的とした自己注意型TALモデルを提案する。
本研究は, 乳児の非トリミングビデオにおいて, エンド・ツー・エンドの時間的行動の局所化を初めて実施した症例である。
顔の70%の精度、顔の79%の精度、笑顔の72%、発声の65%を実現した。
論文 参考訳(メタデータ) (2024-04-08T20:31:27Z) - Enhancing ASD detection accuracy: a combined approach of machine
learning and deep learning models with natural language processing [0.0]
自閉症スペクトラム障害(ASD)の診断における人工知能(AI)の利用について検討した。
ソーシャルメディア上のテキスト入力からASDを検出する機械学習(ML)とディープラーニング(DL)に焦点を当てた。
我々のAIモデルは精度が高く、88%の成功率でASDの個人からテキストを識別できた。
論文 参考訳(メタデータ) (2024-03-06T09:57:42Z) - Introducing SSBD+ Dataset with a Convolutional Pipeline for detecting
Self-Stimulatory Behaviours in Children using raw videos [1.1874952582465603]
著者らは,自閉症スペクトラム障害(ASD)の診断に役立つ,ある種の自己刺激行動を検出するための,パイプライン型ディープラーニングアーキテクチャを提案する。
リアルタイムおよびハンズフリーの自動診断を目的としたパイプラインモデルにより,全体の81%の精度が達成された。
論文 参考訳(メタデータ) (2023-11-25T16:57:24Z) - Leveraging Pretrained Representations with Task-related Keywords for
Alzheimer's Disease Detection [69.53626024091076]
アルツハイマー病(AD)は高齢者に特に顕著である。
事前学習モデルの最近の進歩は、AD検出モデリングを低レベル特徴から高レベル表現にシフトさせる動機付けとなっている。
本稿では,高レベルの音響・言語的特徴から,より優れたAD関連手がかりを抽出する,いくつかの効率的な手法を提案する。
論文 参考訳(メタデータ) (2023-03-14T16:03:28Z) - Comparison of Probabilistic Deep Learning Methods for Autism Detection [0.0]
自閉症スペクトラム障害(Autism Spectrum disorder、ASD)は、現在世界中で普及している神経発達障害の一つ。
この疾患の早期発見は、発症治療に役立ち、正常な生活を導くのに役立つ。
論文 参考訳(メタデータ) (2023-03-09T17:49:37Z) - NeuroExplainer: Fine-Grained Attention Decoding to Uncover Cortical
Development Patterns of Preterm Infants [73.85768093666582]
我々はNeuroExplainerと呼ばれる説明可能な幾何学的深層ネットワークを提案する。
NeuroExplainerは、早産に伴う幼児の皮質発達パターンの解明に使用される。
論文 参考訳(メタデータ) (2023-01-01T12:48:12Z) - Exploiting prompt learning with pre-trained language models for
Alzheimer's Disease detection [70.86672569101536]
アルツハイマー病(AD)の早期診断は予防ケアの促進とさらなる進行の遅らせに不可欠である。
本稿では,AD分類誤差をトレーニング対象関数として一貫して用いたPLMの高速微調整法について検討する。
論文 参考訳(メタデータ) (2022-10-29T09:18:41Z) - Vision-Based Activity Recognition in Children with Autism-Related
Behaviors [15.915410623440874]
臨床医や親が子どもの行動を分析するのに役立つ地域型コンピュータビジョンシステムの効果を実証する。
データは、ビデオ中の対象の子供を検出し、背景雑音の影響を低減することで前処理される。
時間的畳み込みモデルの有効性から,ビデオフレームから動作特徴を抽出できる軽量モデルと従来モデルの両方を提案する。
論文 参考訳(メタデータ) (2022-08-08T15:12:27Z) - "My nose is running.""Are you also coughing?": Building A Medical
Diagnosis Agent with Interpretable Inquiry Logics [80.55587329326046]
本稿では,DSMDの対話マネージャを実装するための,より解釈可能な意思決定プロセスを提案する。
推論を行うために、非常に透明なコンポーネントを持つモデルを考案する。
実験の結果,診断精度は7.7%,10.0%,3.0%向上した。
論文 参考訳(メタデータ) (2022-04-29T09:02:23Z) - MIMO: Mutual Integration of Patient Journey and Medical Ontology for
Healthcare Representation Learning [49.57261599776167]
本稿では、医療表現学習と予測分析のための、エンドツーエンドの堅牢なトランスフォーマーベースのソリューション、患者旅行の相互統合、医療オントロジー(MIMO)を提案する。
論文 参考訳(メタデータ) (2021-07-20T07:04:52Z) - Inheritance-guided Hierarchical Assignment for Clinical Automatic
Diagnosis [50.15205065710629]
臨床診断は、臨床ノートに基づいて患者に診断符号を割り当てることを目的としており、臨床意思決定において重要な役割を担っている。
本稿では,臨床自動診断のための継承誘導階層と共起グラフの伝播を組み合わせた新しい枠組みを提案する。
論文 参考訳(メタデータ) (2021-01-27T13:16:51Z) - Early Autism Spectrum Disorders Diagnosis Using Eye-Tracking Technology [62.997667081978825]
資金不足、資格のある専門家の欠如、そして修正方法に対する信頼度の低いことが、AMDのリアルタイム診断に影響を及ぼす主要な問題である。
我々のチームは、子どもの視線活動の情報に基づいて、ALDの確率を予測するアルゴリズムを開発した。
論文 参考訳(メタデータ) (2020-08-21T20:22:55Z) - Detecting Parkinsonian Tremor from IMU Data Collected In-The-Wild using
Deep Multiple-Instance Learning [59.74684475991192]
パーキンソン病(英: Parkinson's Disease、PD)は、60歳以上の人口の約1%に影響を与える徐々に進化する神経学的疾患である。
PD症状には、震動、剛性、ブレイキネジアがある。
本稿では,スマートフォン端末から受信したIMU信号に基づいて,PDに関連するトレモラスなエピソードを自動的に識別する手法を提案する。
論文 参考訳(メタデータ) (2020-05-06T09:02:30Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。