論文の概要: Comparative Performance of Machine Learning Algorithms for Early Genetic Disorder and Subclass Classification
- arxiv url: http://arxiv.org/abs/2412.02189v1
- Date: Tue, 03 Dec 2024 06:02:47 GMT
- ステータス: 翻訳完了
- システム内更新日: 2024-12-04 15:46:17.775264
- Title: Comparative Performance of Machine Learning Algorithms for Early Genetic Disorder and Subclass Classification
- Title(参考訳): 早期遺伝障害とサブクラス分類のための機械学習アルゴリズムの比較性能
- Authors: Abu Bakar Siddik, Faisal R. Badal, Afroza Islam,
- Abstract要約: 遺伝子疾患の早期診断は、タイムリーな介入を可能にし、結果を改善する。
本研究は、出生時または出生時に測定可能な基礎的臨床指標を用いた機械学習モデルを実装した。
MLに基本的な臨床指標を適用することで、大規模なデータセットで検証されたタイムリーな介入が可能になる。
- 参考スコア(独自算出の注目度): 0.0
- License:
- Abstract: A great deal of effort has been devoted to discovering a particular genetic disorder, but its classification across a broad spectrum of disorder classes and types remains elusive. Early diagnosis of genetic disorders enables timely interventions and improves outcomes. This study implements machine learning models using basic clinical indicators measurable at birth or infancy to enable diagnosis in preliminary life stages. Supervised learning algorithms were implemented on a dataset of 22083 instances with 42 features like family history, newborn metrics, and basic lab tests. Extensive hyperparameter tuning, feature engineering, and selection were undertaken. Two multi-class classifiers were developed: one for predicting disorder classes (mitochondrial, multifactorial, and single-gene) and one for subtypes (9 disorders). Performance was evaluated using accuracy, precision, recall, and the F1-score. The CatBoost classifier achieved the highest accuracy of 77% for predicting genetic disorder classes. For subtypes, SVM attained a maximum accuracy of 80%. The study demonstrates the feasibility of using basic clinical data in machine learning models for early categorization and diagnosis across various genetic disorders. Applying ML with basic clinical indicators can enable timely interventions once validated on larger datasets. It is necessary to conduct further studies to improve model performance on this dataset.
- Abstract(参考訳): 特定の遺伝性疾患の発見に多くの努力が注がれているが、その分類は幅広い障害のクラスやタイプにまたがっている。
遺伝子疾患の早期診断は、タイムリーな介入を可能にし、結果を改善する。
本研究は、出生時に測定可能な基礎的臨床指標を用いて機械学習モデルを実装し、予備的生活段階における診断を可能にする。
教師付き学習アルゴリズムは、22083インスタンスのデータセット上に実装され、家族履歴、新生児メトリクス、基礎実験など42の機能を提供する。
広範囲なハイパーパラメータチューニング、特徴工学、選択が実施された。
2つのクラス分類器が開発された。1つは障害クラス(ミトコンドリア,多因子,単遺伝子)を予測し,もう1つはサブタイプ(9つの障害)を予測した。
評価は精度,精度,リコール,F1スコアを用いて行った。
CatBoost分類器は遺伝性障害のクラスを予測する上で77%の精度を達成した。
サブタイプでは、SVMの最大精度は80%に達した。
本研究は、様々な遺伝疾患の早期分類と診断のために、機械学習モデルに基本的な臨床データを使用することの可能性を示した。
MLに基本的な臨床指標を適用することで、大規模なデータセットで検証されたタイムリーな介入が可能になる。
このデータセットのモデル性能を改善するためには、さらなる研究が必要である。
関連論文リスト
- Survey and Improvement Strategies for Gene Prioritization with Large Language Models [61.24568051916653]
大規模言語モデル (LLM) は, 医学検査において良好に機能しているが, 希少な遺伝疾患の診断における有効性は評価されていない。
表現型と可溶性レベルに基づいて, マルチエージェントとヒトフェノタイプオントロジー(HPO)を分類した。
ベースラインでは、GPT-4は他のLLMよりも優れており、因果遺伝子を正しくランク付けする際の精度は30%近く向上した。
論文 参考訳(メタデータ) (2025-01-30T23:03:03Z) - Using Pre-training and Interaction Modeling for ancestry-specific disease prediction in UK Biobank [69.90493129893112]
近年のゲノムワイド・アソシエーション(GWAS)研究は、複雑な形質の遺伝的基盤を明らかにしているが、非ヨーロッパ系個体の低発現を示している。
そこで本研究では,マルチオミクスデータを用いて,多様な祖先間での疾患予測を改善することができるかを評価する。
論文 参考訳(メタデータ) (2024-04-26T16:39:50Z) - Predictive Modeling for Breast Cancer Classification in the Context of Bangladeshi Patients: A Supervised Machine Learning Approach with Explainable AI [0.0]
5種類の機械学習手法の分類精度,精度,リコール,F-1スコアを評価し,比較した。
XGBoostは97%という最高のモデル精度を達成した。
論文 参考訳(メタデータ) (2024-04-06T17:23:21Z) - Comparative Analysis of Data Preprocessing Methods, Feature Selection
Techniques and Machine Learning Models for Improved Classification and
Regression Performance on Imbalanced Genetic Data [0.0]
本研究では,データ前処理,特徴選択,モデル選択が遺伝的データセット上で訓練されたモデルの性能に及ぼす影響について検討した。
予測変数や対象変数のアウトラヤ/スキューが回帰モデルに挑戦しないことがわかった。
また,クラス不均衡なターゲット変数とスキュード予測器が分類性能にほとんど影響を与えていないことも見出した。
論文 参考訳(メタデータ) (2024-02-22T21:41:27Z) - An Evaluation of Machine Learning Approaches for Early Diagnosis of
Autism Spectrum Disorder [0.0]
自閉症スペクトラム障害(Autistic Spectrum disorder、ASD)は、社会的相互作用、コミュニケーション、反復活動の困難を特徴とする神経疾患である。
本研究は,診断プロセスの強化と自動化を目的として,多様な機械学習手法を用いて重要なASD特性を同定する。
論文 参考訳(メタデータ) (2023-09-20T21:23:37Z) - Few-Shot Meta Learning for Recognizing Facial Phenotypes of Genetic
Disorders [55.41644538483948]
分類の自動化と類似性検索は、医師が可能な限り早期に遺伝状態の診断を行うための意思決定を支援する。
従来の研究は分類問題としてこの問題に対処し、深層学習法を用いてきた。
本研究では,健常人の大規模なコーパスで訓練した顔認識モデルを用いて,顔の表情認識に移行した。
論文 参考訳(メタデータ) (2022-10-23T11:52:57Z) - Explainable Multi-class Classification of Medical Data [0.9137554315375922]
大規模医療データセットの多クラス分類について解説する。
この研究では、SVM(Support Vector Machine)、Na"ive Bayes、Gradient Boosting、Decision Trees、Random Forest、Logistic Regressionの6つのアルゴリズムが使用されている。
本研究では,23の薬物機能を用いて6つの応用学習アルゴリズムのうち5つのリコールを改善することを示した。
論文 参考訳(メタデータ) (2020-12-26T18:56:07Z) - Theoretical Insights Into Multiclass Classification: A High-dimensional
Asymptotic View [82.80085730891126]
線形多クラス分類の最初の現代的精度解析を行う。
分析の結果,分類精度は分布に依存していることがわかった。
得られた洞察は、他の分類アルゴリズムの正確な理解の道を開くかもしれない。
論文 参考訳(メタデータ) (2020-11-16T05:17:29Z) - Detecting Autism Spectrum Disorder using Machine Learning [3.2861753207533937]
逐次最小最適化(SMO)ベースのサポートベクトルマシン(SVM)分類器は、他のすべてのベンチマーク機械学習アルゴリズムより優れている。
Relief Attributesアルゴリズムは、ASDデータセットで最も重要な属性を特定するのに最適である。
論文 参考訳(メタデータ) (2020-09-30T08:33:12Z) - Select-ProtoNet: Learning to Select for Few-Shot Disease Subtype
Prediction [55.94378672172967]
本研究は, 類似患者のサブグループを同定し, 数発の疾患のサブタイプ予測問題に焦点を当てた。
新しいモデルを開発するためにメタラーニング技術を導入し、関連する臨床課題から共通の経験や知識を抽出する。
我々の新しいモデルは、単純だが効果的なメタ学習マシンであるPrototypeal Networkと呼ばれる、慎重に設計されたメタラーナーに基づいて構築されている。
論文 参考訳(メタデータ) (2020-09-02T02:50:30Z) - Self-Training with Improved Regularization for Sample-Efficient Chest
X-Ray Classification [80.00316465793702]
挑戦的なシナリオで堅牢なモデリングを可能にするディープラーニングフレームワークを提案する。
その結果,85%のラベル付きデータを用いて,大規模データ設定で学習した分類器の性能に適合する予測モデルを構築することができた。
論文 参考訳(メタデータ) (2020-05-03T02:36:00Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。