論文の概要: Metrics to guide development of machine learning algorithms for malaria
diagnosis
- arxiv url: http://arxiv.org/abs/2209.06947v2
- Date: Tue, 4 Jul 2023 01:23:29 GMT
- ステータス: 処理完了
- システム内更新日: 2023-07-07 00:04:01.152333
- Title: Metrics to guide development of machine learning algorithms for malaria
diagnosis
- Title(参考訳): マラリア診断のための機械学習アルゴリズムの開発を導く指標
- Authors: Charles B. Delahunt, Noni Gachuhi, Matthew P. Horning
- Abstract要約: 自動マラリア診断は、機械学習(ML)にとって難しいが高価値なターゲットである
現在のMLの取り組みは重要なユースケースの制約をほとんど無視しており、臨床的には有用ではない。
- 参考スコア(独自算出の注目度): 1.2891210250935143
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Automated malaria diagnosis is a difficult but high-value target for machine
learning (ML), and effective algorithms could save many thousands of children's
lives. However, current ML efforts largely neglect crucial use case constraints
and are thus not clinically useful. Two factors in particular are crucial to
developing algorithms translatable to clinical field settings: (i) Clear
understanding of the clinical needs that ML solutions must accommodate; and
(ii) task-relevant metrics for guiding and evaluating ML models. Neglect of
these factors has seriously hampered past ML work on malaria, because the
resulting algorithms do not align with clinical needs.
In this paper we address these two issues in the context of automated malaria
diagnosis via microscopy on Giemsa-stained blood films. First, we describe why
domain expertise is crucial to effectively apply ML to malaria, and list
technical documents and other resources that provide this domain knowledge.
Second, we detail performance metrics tailored to the clinical requirements of
malaria diagnosis, to guide development of ML models and evaluate model
performance through the lens of clinical needs (versus a generic ML lens). We
highlight the importance of a patient-level perspective, interpatient
variability, false positive rates, limit of detection, and different types of
error. We also discuss reasons why ROC curves, AUC, and F1, as commonly used in
ML work, are poorly suited to this context. These findings also apply to other
diseases involving parasite loads, including neglected tropical diseases (NTDs)
such as schistosomiasis.
- Abstract(参考訳): 自動マラリア診断は、機械学習(ML)にとって難しいが高価値なターゲットであり、効果的なアルゴリズムは何千人もの子供の命を救える。
しかし、現在のMLの取り組みは重要なユースケースの制約をほとんど無視しており、臨床的には有用ではない。
特に2つの要因が臨床現場設定に翻訳可能なアルゴリズムの開発に不可欠である。
(i)mlソリューションが対応しなければならない臨床ニーズを明確に理解すること。
(II)MLモデルの指導と評価のためのタスク関連メトリクス。
これらの要因の無視は、臨床ニーズと一致しないため、過去のMLのマラリア研究を著しく妨げている。
本稿では,この2つの問題点を,ジエマの血液膜を顕微鏡で観察することで診断する。
まず、なぜドメインの専門知識が、MLをマラリアに効果的に適用し、このドメインの知識を提供する技術文書やその他のリソースをリストアップすることが重要なのかを説明する。
第2に,マラリア診断の臨床的要件に合わせたパフォーマンス指標を詳述し,mlモデルの開発を指導し,臨床ニーズレンズ(汎用mlレンズではなく)を通してモデル性能を評価する。
患者レベルの視点,患者間の多様性,偽陽性率,検出限界,エラーの種類などの重要性を強調した。
ROC曲線、AUC、F1がMLの作業でよく使われるが、この文脈にはあまり適さない理由についても論じる。
これらの所見は、分裂病などの熱帯病(NTD)を無視するなど、寄生虫の負荷を伴う他の疾患にも当てはまる。
関連論文リスト
- Assessing and Enhancing Large Language Models in Rare Disease Question-answering [64.32570472692187]
本稿では,レアな疾患の診断におけるLarge Language Models (LLMs) の性能を評価するために,レアな疾患問合せデータセット(ReDis-QA)を導入する。
ReDis-QAデータセットでは1360の高品質な質問応答ペアを収集し,205の稀な疾患をカバーした。
その後、いくつかのオープンソースのLCMをベンチマークし、希少疾患の診断がこれらのモデルにとって重要な課題であることを示した。
実験の結果,ReCOPは,ReDis-QAデータセット上でのLCMの精度を平均8%向上できることがわかった。
論文 参考訳(メタデータ) (2024-08-15T21:09:09Z) - Large Language Model Distilling Medication Recommendation Model [61.89754499292561]
大規模言語モデル(LLM)の強力な意味理解と入力非依存特性を利用する。
本研究は, LLMを用いて既存の薬剤推奨手法を変換することを目的としている。
これを軽減するため,LLMの習熟度をよりコンパクトなモデルに伝達する機能レベルの知識蒸留技術を開発した。
論文 参考訳(メタデータ) (2024-02-05T08:25:22Z) - The Significance of Machine Learning in Clinical Disease Diagnosis: A
Review [0.0]
本研究では、時系列医療指標における心拍データの伝達を改善するための機械学習アルゴリズムの能力について検討する。
検討中の要因は、アルゴリズムの利用、対象とする疾患の種類、採用されるデータの種類、応用、評価指標などである。
論文 参考訳(メタデータ) (2023-10-25T20:28:22Z) - Mixed-Integer Projections for Automated Data Correction of EMRs Improve
Predictions of Sepsis among Hospitalized Patients [7.639610349097473]
本稿では,領域制約として臨床専門知識をシームレスに統合する革新的プロジェクションに基づく手法を提案する。
我々は、患者データの健全な範囲を規定する制約から補正されたデータの距離を測定する。
AUROCは0.865で、精度は0.922で、従来のMLモデルを上回る。
論文 参考訳(メタデータ) (2023-08-21T15:14:49Z) - Artificial Intelligence for Dementia Research Methods Optimization [0.49050354212898845]
本稿では,認知症研究において最も頻繁に使用される機械学習アルゴリズムの概要を紹介する。
本稿では, 再現性と解釈可能性の問題と, 認知症研究の臨床的応用性への影響について論じる。
本稿では, 伝達学習, マルチタスク学習, 強化学習といった最先端の手法が, これらの課題を克服するためにどのように応用されるかを示す。
論文 参考訳(メタデータ) (2023-03-02T08:50:25Z) - Detecting Shortcut Learning for Fair Medical AI using Shortcut Testing [62.9062883851246]
機械学習は医療の改善に大いに貢献するが、その利用が健康格差を広めたり増幅したりしないことを確実にすることは重要である。
アルゴリズムの不公平性の潜在的な要因の1つ、ショートカット学習は、トレーニングデータにおける不適切な相関に基づいてMLモデルが予測した時に発生する。
マルチタスク学習を用いて,臨床MLシステムの公平性評価の一環として,ショートカット学習の評価と緩和を行う手法を提案する。
論文 参考訳(メタデータ) (2022-07-21T09:35:38Z) - Benchmarking Machine Learning Robustness in Covid-19 Genome Sequence
Classification [109.81283748940696]
我々は、IlluminaやPacBioといった一般的なシークエンシングプラットフォームのエラープロファイルを模倣するために、SARS-CoV-2ゲノム配列を摂動する方法をいくつか紹介する。
シミュレーションに基づくいくつかのアプローチは、入力シーケンスに対する特定の敵攻撃に対する特定の埋め込み手法に対して、他の手法よりも堅牢(かつ正確)であることを示す。
論文 参考訳(メタデータ) (2022-07-18T19:16:56Z) - Benchmarking Heterogeneous Treatment Effect Models through the Lens of
Interpretability [82.29775890542967]
治療のパーソナライズされた効果を見積もるのは複雑だが、普及している問題である。
ヘテロジニアス処理効果推定に関する機械学習文献の最近の進歩は、洗練されたが不透明なツールの多くを生み出した。
我々は、ポストホックな特徴重要度法を用いて、モデルの予測に影響を及ぼす特徴を特定する。
論文 参考訳(メタデータ) (2022-06-16T17:59:05Z) - Rethinking Machine Learning Model Evaluation in Pathology [3.0575251867964153]
本稿では,病理学における機械学習評価のための実践的ガイドラインを提案する。
本報告では,評価フレームワークの設定,ラベルの多様性の効果的対応,および推奨テストスイートについて述べる。
提案されたフレームワークが、ML研究者とドメインエキスパートのギャップを埋め、病理学におけるMLテクニックの広範な採用につながることを期待しています。
論文 参考訳(メタデータ) (2022-04-11T15:49:12Z) - VBridge: Connecting the Dots Between Features, Explanations, and Data
for Healthcare Models [85.4333256782337]
VBridgeは、臨床医の意思決定ワークフローに機械学習の説明をシームレスに組み込むビジュアル分析ツールである。
我々は,臨床医がMLの特徴に慣れていないこと,文脈情報の欠如,コホートレベルの証拠の必要性など,3つの重要な課題を特定した。
症例スタディと専門医4名のインタビューを通じて, VBridgeの有効性を実証した。
論文 参考訳(メタデータ) (2021-08-04T17:34:13Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。