論文の概要: Machine Learning Driven Biomarker Selection for Medical Diagnosis
- arxiv url: http://arxiv.org/abs/2405.10345v1
- Date: Thu, 16 May 2024 01:30:47 GMT
- ステータス: 処理完了
- システム内更新日: 2024-05-20 17:52:48.487192
- Title: Machine Learning Driven Biomarker Selection for Medical Diagnosis
- Title(参考訳): 医療診断のための機械学習駆動バイオマーカーの選択
- Authors: Divyagna Bavikadi, Ayushi Agarwal, Shashank Ganta, Yunro Chung, Lusheng Song, Ji Qiu, Paulo Shakarian,
- Abstract要約: 実験手法の最近の進歩により、研究者は何千もの分析物のデータを同時に収集できるようになった。
これは、アルツハイマー病、肝臓がん、胃癌などの疾患と分子測定を関連付ける相関研究につながった。
分析物から選択された何千ものバイオマーカーの使用は、現実の診断には実用的ではなく、潜在的に形成される急激な相関のために望ましくない可能性がある。
- 参考スコア(独自算出の注目度): 1.10252115875756
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Recent advances in experimental methods have enabled researchers to collect data on thousands of analytes simultaneously. This has led to correlational studies that associated molecular measurements with diseases such as Alzheimer's, Liver, and Gastric Cancer. However, the use of thousands of biomarkers selected from the analytes is not practical for real-world medical diagnosis and is likely undesirable due to potentially formed spurious correlations. In this study, we evaluate 4 different methods for biomarker selection and 4 different machine learning (ML) classifiers for identifying correlations, evaluating 16 approaches in all. We found that contemporary methods outperform previously reported logistic regression in cases where 3 and 10 biomarkers are permitted. When specificity is fixed at 0.9, ML approaches produced a sensitivity of 0.240 (3 biomarkers) and 0.520 (10 biomarkers), while standard logistic regression provided a sensitivity of 0.000 (3 biomarkers) and 0.040 (10 biomarkers). We also noted that causal-based methods for biomarker selection proved to be the most performant when fewer biomarkers were permitted, while univariate feature selection was the most performant when a greater number of biomarkers were permitted.
- Abstract(参考訳): 実験手法の最近の進歩により、研究者は何千もの分析物のデータを同時に収集できるようになった。
これは、アルツハイマー病、肝臓がん、胃癌などの疾患と分子測定を関連付ける相関研究につながった。
しかし、分析物から選択された何千ものバイオマーカーの使用は、現実の診断には実用的ではなく、潜在的に形成される急激な相関のために望ましくない可能性がある。
本研究では,バイオマーカー選択のための4つの異なる手法と相関関係を識別するための4つの異なる機械学習分類器を評価し,それぞれ16のアプローチを評価した。
その結果,3,10個のバイオマーカーが許可された場合に,従来報告したロジスティック回帰よりも優れた手法が得られた。
特異性を0.9で固定すると、MLアプローチでは0.0240(バイオマーカー)と0.520(10バイオマーカー)の感度が得られ、標準ロジスティック回帰では0.0000(バイオマーカー)と0.040(バイオマーカー)の感度が得られた。
また, バイオマーカー選択の因果的手法は, バイオマーカーがより少ない場合に最も有効であることが判明し, 単変量の特徴選択はより多くのバイオマーカーが許容された時に最も有効であることが確認された。
関連論文リスト
- Screen Them All: High-Throughput Pan-Cancer Genetic and Phenotypic Biomarker Screening from H&E Whole Slide Images [3.119559770601732]
通常のH&EスライドでのAIの使用は、複数の分子バイオマーカーのスクリーニングに迅速かつ経済的アプローチを提供する。
我々は,300万スライドで事前学習した基礎モデルであるVirchow2を利用した高スループットAIベースシステムを提案する。
バイオマーカーや癌の種類ごとに個別のモデルを訓練する従来の手法とは異なり、我々のシステムは、幅広い臨床関連分子バイオマーカーを同時に予測するために統一されたモデルを採用している。
論文 参考訳(メタデータ) (2024-08-18T17:44:00Z) - Biomarker based Cancer Classification using an Ensemble with Pre-trained Models [2.2436844508175224]
マルチクラス分類タスクに対して,事前学習したハイパーファストモデル,XGBoost,LightGBMを組み合わせた新しいアンサンブルモデルを提案する。
我々はメタトレーニングしたハイパーファストモデルを用いてがんの分類を行い、AUCは0.9929である。
また,事前学習したハイパーファストモデル,XGBoost,LightGBMを多クラス分類タスクに組み合わせた新しいアンサンブルモデルを提案し,精度を漸進的に向上させる(0.9464)。
論文 参考訳(メタデータ) (2024-06-14T14:43:59Z) - MMIL: A novel algorithm for disease associated cell type discovery [58.044870442206914]
単一細胞データセットは、しばしば個々の細胞ラベルを欠いているため、病気に関連する細胞を特定することは困難である。
セルレベルの分類器の訓練と校正を可能にする予測手法であるMixture Modeling for Multiple Learning Instance (MMIL)を導入する。
論文 参考訳(メタデータ) (2024-06-12T15:22:56Z) - BMRetriever: Tuning Large Language Models as Better Biomedical Text Retrievers [48.21255861863282]
BMRetrieverは、バイオメディカル検索を強化するための一連の密集したレトリバーである。
BMRetrieverは強力なパラメータ効率を示し、410Mの派生型はベースラインを最大11.7倍まで上回っている。
論文 参考訳(メタデータ) (2024-04-29T05:40:08Z) - A marker-less human motion analysis system for motion-based biomarker
discovery in knee disorders [60.99112047564336]
NHSは低リスクの全ての患者に会うのが難しくなっているが、これはOA患者に限らない。
膝関節疾患の診断と治療経過のモニタリングのためのバイオマーカー自動同定法を提案する。
論文 参考訳(メタデータ) (2023-04-26T16:47:42Z) - Regression-based Deep-Learning predicts molecular biomarkers from
pathology slides [40.24757332810004]
我々は,画像から直接バイオマーカーを予測する自己監督型弱教師付き回帰手法を開発し,評価した。
回帰を用いて、バイオマーカー予測の精度を著しく向上させ、また、分類よりも結果の解釈可能性を向上させる。
我々のオープンソースレグレッションアプローチは、計算病理学における連続バイオマーカー解析に有望な代替手段を提供する。
論文 参考訳(メタデータ) (2023-04-11T11:43:51Z) - Multi-class versus One-class classifier in spontaneous speech analysis
oriented to Alzheimer Disease diagnosis [58.720142291102135]
本研究の目的は,音声信号から抽出した新しいバイオマーカーを用いて自動解析を行うことにより,ADの早期診断と重症度評価の改善に寄与することである。
外付け器とフラクタル次元の機能に関する情報を使用することで、システムの性能が向上する。
論文 参考訳(メタデータ) (2022-03-21T09:57:20Z) - Preventing dataset shift from breaking machine-learning biomarkers [0.6138671548064355]
良いバイオマーカーは、対応する条件を確実に検出するものである。
バイオマーカーは、しばしば標的個体群とは異なるコホートから抽出される。
このようなミスマッチはデータセットシフトと呼ばれ、新しい個人へのバイオマーカーの適用を損なう可能性がある。
論文 参考訳(メタデータ) (2021-07-21T08:54:23Z) - The Future will be Different than Today: Model Evaluation Considerations
when Developing Translational Clinical Biomarker [4.549866091318765]
従来のクロスバリデーション(cv)方式の代わりに,LOSO(Left-one-Study-out)を用いた評価戦略を提案する。
バイオマーカーの効果を推定するためのK-fold vs. LOSO cvの性能を示すために,臨床実験およびシミュレーション研究のデータを活用した。
論文 参考訳(メタデータ) (2021-07-13T19:36:25Z) - Cancer Gene Profiling through Unsupervised Discovery [49.28556294619424]
低次元遺伝子バイオマーカーを発見するための,新しい,自動かつ教師なしのフレームワークを提案する。
本手法は,高次元中心型非監視クラスタリングアルゴリズムLP-Stabilityアルゴリズムに基づく。
私達の署名は免疫炎症および免疫砂漠の腫瘍の区別の有望な結果報告します。
論文 参考訳(メタデータ) (2021-02-11T09:04:45Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。