論文の概要: Deep learning for autism detection using clinical notes: A comparison of transfer learning for a transparent and black-box approach
- arxiv url: http://arxiv.org/abs/2512.06161v1
- Date: Fri, 05 Dec 2025 21:14:59 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-12-09 22:03:54.212043
- Title: Deep learning for autism detection using clinical notes: A comparison of transfer learning for a transparent and black-box approach
- Title(参考訳): 臨床ノートを用いた自閉症検出のための深層学習:透明・ブラックボックスアプローチにおける伝達学習の比較
- Authors: Gondy Leroy, Prakash Bisht, Sai Madhuri Kandula, Nell Maltman, Sydney Rice,
- Abstract要約: 自閉症スペクトラム障害(Autism spectrum disorder、ASD)は、慢性神経発達障害の一種で、長い診断過程における要求が増加する傾向にある。
既存の機械学習モデルはブラックボックスとして動作し、通常は単一のデータセットでトレーニングされる。
本稿では,最先端の言語モデルであるBioBERTを利用した透明かつ解釈可能なMLアプローチを導入し,非構造化臨床テキストの分析を行う。
- 参考スコア(独自算出の注目度): 2.319280862402541
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Autism spectrum disorder (ASD) is a complex neurodevelopmental condition whose rising prevalence places increasing demands on a lengthy diagnostic process. Machine learning (ML) has shown promise in automating ASD diagnosis, but most existing models operate as black boxes and are typically trained on a single dataset, limiting their generalizability. In this study, we introduce a transparent and interpretable ML approach that leverages BioBERT, a state-of-the-art language model, to analyze unstructured clinical text. The model is trained to label descriptions of behaviors and map them to diagnostic criteria, which are then used to assign a final label (ASD or not). We evaluate transfer learning, the ability to transfer knowledge to new data, using two distinct real-world datasets. We trained on datasets sequentially and mixed together and compared the performance of the best models and their ability to transfer to new data. We also created a black-box approach and repeated this transfer process for comparison. Our transparent model demonstrated robust performance, with the mixed-data training strategy yielding the best results (97 % sensitivity, 98 % specificity). Sequential training across datasets led to a slight drop in performance, highlighting the importance of training data order. The black-box model performed worse (90 % sensitivity, 96 % specificity) when trained sequentially or with mixed data. Overall, our transparent approach outperformed the black-box approach. Mixing datasets during training resulted in slightly better performance and should be the preferred approach when practically possible. This work paves the way for more trustworthy, generalizable, and clinically actionable AI tools in neurodevelopmental diagnostics.
- Abstract(参考訳): 自閉症スペクトラム障害(Autism spectrum disorder、ASD)は、慢性神経発達障害の一種で、長い診断過程における要求が増加する傾向にある。
機械学習(ML)は、ASD診断を自動化することを約束しているが、既存のモデルのほとんどはブラックボックスとして動作し、通常は単一のデータセットでトレーニングされ、一般化性を制限する。
本研究では,最先端の言語モデルであるBioBERTを応用した,透明かつ解釈可能なML手法を提案する。
このモデルは、行動の記述をラベル付けし、それらを診断基準にマッピングするように訓練され、最終ラベル(ASDかそうでないか)を割り当てるために使用される。
我々は、2つの異なる実世界のデータセットを用いて、新しいデータに知識を伝達するトランスファーラーニングを評価する。
データセットを逐次かつ混合してトレーニングし、最高のモデルのパフォーマンスと、新しいデータへの転送能力を比較しました。
また、ブラックボックスアプローチを作成し、この転送プロセスを比較のために繰り返します。
我々の透明なモデルでは、データ混合トレーニング戦略により、最良の結果(感度97 %、特異度98 %)が得られた。
データセット間のシーケンシャルなトレーニングはパフォーマンスをわずかに低下させ、データ順序のトレーニングの重要性を強調した。
ブラックボックスモデルでは, 連続的あるいは混合データを用いた場合, 感度90 %, 特異度96 %) が低下した。
全体として、我々の透明なアプローチはブラックボックスアプローチよりも優れていた。
トレーニング中にデータセットを混合することで、パフォーマンスがわずかに向上し、現実的に可能な場合には、望ましいアプローチになるはずだ。
この研究は、神経発達診断において、より信頼性が高く、一般化可能で、臨床的に実行可能なAIツールの道を開く。
関連論文リスト
- Enhancing Contrastive Learning-based Electrocardiogram Pretrained Model with Patient Memory Queue [3.7515781255643885]
ラベルのないデータに基づいて、堅牢なECG事前トレーニングモデルを構築する方法は、研究者にとって重要な分野である。
対照的な学習に基づく心電図事前訓練モデルの最近の進歩は、心電図固有の患者レベルの自己監督信号を活用する可能性を強調している。
患者記憶キュー(PMQ)により強化されたコントラスト学習型ECG事前学習モデルを提案する。
論文 参考訳(メタデータ) (2025-05-26T05:04:03Z) - MVKTrans: Multi-View Knowledge Transfer for Robust Multiomics Classification [14.533025681231294]
そこで本研究では,生物内および生物間知識を適応的に伝達する多視点知識伝達学習フレームワークを提案する。
具体的には、未ラベルデータに基づいて訓練されたグラフコントラストモジュールを設計し、基礎となるオミクス内パターンを教師付きタスクに効果的に学習し、転送する。
異なる疾患および/またはサンプルにおけるモダリティの識別能力の変化を考慮して, 適応型および双方向のクロスオミクス蒸留モジュールを導入する。
論文 参考訳(メタデータ) (2024-11-13T15:45:46Z) - What Do Learning Dynamics Reveal About Generalization in LLM Reasoning? [83.83230167222852]
モデルの一般化動作は,事前記憶列車の精度と呼ばれるトレーニング指標によって効果的に特徴づけられることがわかった。
モデルの学習行動と一般化を結びつけることで、トレーニング戦略に目標とする改善を導くことができる。
論文 参考訳(メタデータ) (2024-11-12T09:52:40Z) - An Evaluation of Machine Learning Approaches for Early Diagnosis of
Autism Spectrum Disorder [0.0]
自閉症スペクトラム障害(Autistic Spectrum disorder、ASD)は、社会的相互作用、コミュニケーション、反復活動の困難を特徴とする神経疾患である。
本研究は,診断プロセスの強化と自動化を目的として,多様な機械学習手法を用いて重要なASD特性を同定する。
論文 参考訳(メタデータ) (2023-09-20T21:23:37Z) - The effect of data augmentation and 3D-CNN depth on Alzheimer's Disease
detection [51.697248252191265]
この研究は、データハンドリング、実験設計、モデル評価に関するベストプラクティスを要約し、厳密に観察する。
我々は、アルツハイマー病(AD)の検出に焦点を当て、医療における課題のパラダイム的な例として機能する。
このフレームワークでは,3つの異なるデータ拡張戦略と5つの異なる3D CNNアーキテクチャを考慮し,予測15モデルを訓練する。
論文 参考訳(メタデータ) (2023-09-13T10:40:41Z) - BERT WEAVER: Using WEight AVERaging to enable lifelong learning for
transformer-based models in biomedical semantic search engines [49.75878234192369]
We present WEAVER, a simple, yet efficient post-processing method that infuse old knowledge into the new model。
WEAVERを逐次的に適用すると、同じ単語の埋め込み分布が、一度にすべてのデータに対する総合的なトレーニングとして得られることを示す。
論文 参考訳(メタデータ) (2022-02-21T10:34:41Z) - Transfer Learning without Knowing: Reprogramming Black-box Machine
Learning Models with Scarce Data and Limited Resources [78.72922528736011]
そこで我々は,ブラックボックス・アタベラル・リプログラミング (BAR) という新しい手法を提案する。
ゼロオーダー最適化とマルチラベルマッピング技術を用いて、BARは入力出力応答のみに基づいてブラックボックスMLモデルをプログラムする。
BARは最先端の手法より優れ、バニラ対逆プログラミング法に匹敵する性能を得る。
論文 参考訳(メタデータ) (2020-07-17T01:52:34Z) - Omni-supervised Facial Expression Recognition via Distilled Data [120.11782405714234]
ネットワークトレーニングにおいて,信頼度の高いサンプルを多量のラベルのないデータで活用するためのオムニ教師付き学習を提案する。
我々は,新しいデータセットが学習したFERモデルの能力を大幅に向上させることができることを実験的に検証した。
そこで本研究では,生成したデータセットを複数のクラスワイド画像に圧縮するために,データセット蒸留戦略を適用することを提案する。
論文 参考訳(メタデータ) (2020-05-18T09:36:51Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。