論文の概要: Unsupervised Clustering Approaches for Autism Screening: Achieving 95.31% Accuracy with a Gaussian Mixture Model
- arxiv url: http://arxiv.org/abs/2503.05746v1
- Date: Thu, 20 Feb 2025 18:12:59 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-03-16 09:47:37.179683
- Title: Unsupervised Clustering Approaches for Autism Screening: Achieving 95.31% Accuracy with a Gaussian Mixture Model
- Title(参考訳): 自閉症スクリーニングのための教師なしクラスタリングアプローチ:ガウス混合モデルによる95.31%の精度の実現
- Authors: Nora Fink,
- Abstract要約: 自閉症スペクトラム障害(ASD)は、効果的かつ迅速に診断する上で困難な状態である。
従来の診断方法はラベル付きデータの可用性を前提としています。
本稿では、4つの異なるクラスタリングアルゴリズムを用いて、ASDをスクリーニングした704人の成人の公開データセットを解析する。
- 参考スコア(独自算出の注目度): 0.0
- License:
- Abstract: Autism spectrum disorder (ASD) remains a challenging condition to diagnose effectively and promptly, despite global efforts in public health, clinical screening, and scientific research. Traditional diagnostic methods, primarily reliant on supervised learning approaches, presuppose the availability of labeled data, which can be both time-consuming and resource-intensive to obtain. Unsupervised learning, in contrast, offers a means of gaining insights from unlabeled datasets in a manner that can expedite or support the diagnostic process. This paper explores the use of four distinct unsupervised clustering algorithms K-Means, Gaussian Mixture Model (GMM), Agglomerative Clustering, and DBSCAN to analyze a publicly available dataset of 704 adult individuals screened for ASD. After extensive hyperparameter tuning via cross-validation, the study documents how the Gaussian Mixture Model achieved the highest clustering-to-label accuracy (95.31%) when mapped to the original ASD/NO classification (4). Other key performance metrics included the Adjusted Rand Index (ARI) and silhouette scores, which further illustrated the internal coherence of each cluster. The dataset underwent preprocessing procedures including data cleaning, label encoding of categorical features, and standard scaling, followed by a thorough cross-validation approach to assess and compare the four clustering methods (5). These results highlight the significant potential of unsupervised methods in assisting ASD screening, especially in contexts where labeled data may be sparse, uncertain, or prohibitively expensive to obtain. With continued methodological refinements, unsupervised approaches hold promise for augmenting early detection initiatives and guiding resource allocation to individuals at high risk.
- Abstract(参考訳): 自閉症スペクトラム障害(ASD)は、公衆衛生、臨床検診、科学研究における世界的な取り組みにもかかわらず、効果的かつ迅速に診断することが困難な状態である。
従来の診断方法は、主に教師付き学習アプローチに依存しており、ラベル付きデータの可用性を前提としている。
対照的に教師なし学習は、ラベルのないデータセットから、診断プロセスの迅速化や支援が可能な方法で洞察を得る手段を提供する。
本稿では、4つの異なる教師なしクラスタリングアルゴリズムK-Means、Gaussian Mixture Model(GMM)、Agglomerative Clustering、DBSCANを用いて、ASDでスクリーニングされた704人の成人のデータセットを解析する。
クロスバリデーションによる大規模なハイパーパラメータチューニングの後、この研究はガウス混合モデルが元のASD/NO分類にマッピングされたとき、最も高いクラスタリングとラベルの精度(95.31%)を達成したことを報告した。
その他の重要なパフォーマンス指標としては、調整されたRand Index(ARI)とシルエットスコアがあり、各クラスタの内部コヒーレンスをさらに説明している。
データクリーニング、分類的特徴のラベルエンコーディング、標準スケーリングを含む事前処理を行い、続いて4つのクラスタリング手法を評価し比較するための徹底的なクロスバリデーションアプローチ(5)。
これらの結果は、特にラベル付きデータが希少、不確実、あるいは違法に高価である状況において、ASDスクリーニングを支援するための教師なし手法の有意義な可能性を浮き彫りにしている。
方法論的改善の継続に伴い、教師なしのアプローチは早期発見の取り組みを増強し、リスクの高い個人への資源配分を導くという約束を掲げている。
関連論文リスト
- Multi-Class Segmentation of Aortic Branches and Zones in Computed Tomography Angiography: The AortaSeg24 Challenge [55.252714550918824]
AortaSeg24 MICCAI Challengeは、23の臨床的に関連する大動脈枝と領域に注釈付き100 CTA巻の最初のデータセットを導入した。
本稿では,トップパフォーマンスアルゴリズムの課題設計,データセットの詳細,評価指標,詳細な分析について述べる。
論文 参考訳(メタデータ) (2025-02-07T21:09:05Z) - Federated Anomaly Detection for Early-Stage Diagnosis of Autism Spectrum Disorders using Serious Game Data [0.0]
本研究では,AutoEncoder-based Machine Learning (ML) 手法を用いて,ASD検出のための新しい半教師付きアプローチを提案する。
この目的に特化して設計された真剣なゲームを通じて手作業で収集したデータを利用する。
ゲーミフィケーションされたアプリケーションによって収集されたセンシティブなデータは、プライバシー漏洩の影響を受けやすいため、フェデレートラーニングフレームワークを開発した。
論文 参考訳(メタデータ) (2024-10-25T23:00:12Z) - An Evaluation of Machine Learning Approaches for Early Diagnosis of
Autism Spectrum Disorder [0.0]
自閉症スペクトラム障害(Autistic Spectrum disorder、ASD)は、社会的相互作用、コミュニケーション、反復活動の困難を特徴とする神経疾患である。
本研究は,診断プロセスの強化と自動化を目的として,多様な機械学習手法を用いて重要なASD特性を同定する。
論文 参考訳(メタデータ) (2023-09-20T21:23:37Z) - Improving Multiple Sclerosis Lesion Segmentation Across Clinical Sites:
A Federated Learning Approach with Noise-Resilient Training [75.40980802817349]
深層学習モデルは、自動的にMS病変を分節する約束を示しているが、正確な注釈付きデータの不足は、この分野の進歩を妨げている。
我々は,MS病変の不均衡分布とファジィ境界を考慮したDecoupled Hard Label Correction(DHLC)戦略を導入する。
また,集約型中央モデルを利用したCELC(Centrally Enhanced Label Correction)戦略も導入した。
論文 参考訳(メタデータ) (2023-08-31T00:36:10Z) - Simple and Scalable Algorithms for Cluster-Aware Precision Medicine [0.0]
共同クラスタリングと埋め込みに対するシンプルでスケーラブルなアプローチを提案する。
この新しいクラスタ対応の埋め込みアプローチは、現在の共同埋め込みとクラスタリング法の複雑さと限界を克服する。
当社のアプローチでは,ユーザが希望するクラスタ数を選択する必要はなく,階層的にクラスタ化された埋め込みの解釈可能なデンドログラムを生成する。
論文 参考訳(メタデータ) (2022-11-29T19:27:26Z) - Hierarchical Semi-Supervised Contrastive Learning for
Contamination-Resistant Anomaly Detection [81.07346419422605]
異常検出は、通常のデータ分布から逸脱したサンプルを特定することを目的としている。
コントラスト学習は、異常の効果的な識別を可能にする表現のサンプル化に成功している。
汚染耐性異常検出のための新しい階層型半教師付きコントラスト学習フレームワークを提案する。
論文 参考訳(メタデータ) (2022-07-24T18:49:26Z) - Hybrid Dynamic Contrast and Probability Distillation for Unsupervised
Person Re-Id [109.1730454118532]
非監督的人物再識別(Re-Id)は、リードワールドビデオ監視システムにおける実践的応用により注目されている。
本稿では,ハイブリッド動的クラスタコントラストと確率蒸留アルゴリズムを提案する。
教師なしRe-Id問題を局所-言語的ダイナミックコントラスト学習と自己教師付き確率蒸留の枠組みに統合する。
論文 参考訳(メタデータ) (2021-09-29T02:56:45Z) - A multi-stage semi-supervised improved deep embedded clustering
(MS-SSIDEC) method for bearing fault diagnosis under the situation of
insufficient labeled samples [20.952315351460527]
実際の産業プロセスでデータにラベルをつけるのに多くの労力と時間を要するため、インテリジェントな故障診断手法の適用が困難になる。
この問題を解決するために,多段階半教師付き改良深層クラスタリング法(MS-SSIDEC)を提案する。
本手法は,事前学習,深層クラスタリング,教師付き学習の3段階を含む。
論文 参考訳(メタデータ) (2021-09-28T06:49:40Z) - Deep Semi-Supervised Embedded Clustering (DSEC) for Stratification of
Heart Failure Patients [50.48904066814385]
本研究では、深層半教師付き組込みクラスタリングを用いて、心不全のデータ駆動型患者サブグループを決定する。
ヘテロジニアスデータから得られた組込み空間から臨床関連クラスタを見出した。
提案アルゴリズムは、異なる結果を持つ患者の新たな未診断サブグループを見つけることができる。
論文 参考訳(メタデータ) (2020-12-24T12:56:46Z) - Semi-supervised and Unsupervised Methods for Heart Sounds Classification
in Restricted Data Environments [4.712158833534046]
本研究は、PhyloNet/CinC 2016 Challengeデータセット上で、様々な教師付き、半教師付き、教師なしのアプローチを用いる。
GANをベースとした半教師付き手法が提案され,非ラベルデータサンプルを用いてデータ分散の学習を促進できる。
特に、1D CNN Autoencoderと1クラスSVMを併用した教師なし特徴抽出は、データラベル付けなしで優れた性能が得られる。
論文 参考訳(メタデータ) (2020-06-04T02:07:35Z) - Semi-supervised Medical Image Classification with Relation-driven
Self-ensembling Model [71.80319052891817]
医用画像分類のための関係駆動型半教師付きフレームワークを提案する。
これは、摂動下で与えられた入力の予測一貫性を促進することでラベルのないデータを利用する。
本手法は,シングルラベルおよびマルチラベル画像分類のシナリオにおいて,最先端の半教師付き学習手法よりも優れる。
論文 参考訳(メタデータ) (2020-05-15T06:57:54Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。