論文の概要: From Data to Diagnosis: A Large, Comprehensive Bone Marrow Dataset and AI Methods for Childhood Leukemia Prediction
- arxiv url: http://arxiv.org/abs/2509.15895v1
- Date: Fri, 19 Sep 2025 11:48:48 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-09-22 18:18:11.149732
- Title: From Data to Diagnosis: A Large, Comprehensive Bone Marrow Dataset and AI Methods for Childhood Leukemia Prediction
- Title(参考訳): データから診断へ:小児白血病予測のための大規模で総合的な骨髄データセットとAI手法
- Authors: Henning Höfener, Farina Kock, Martina Pontones, Tabita Ghete, David Pfrang, Nicholas Dickel, Meik Kunz, Daniela P. Schacherer, David A. Clunie, Andrey Fedorov, Max Westphal, Markus Metzler,
- Abstract要約: 診断過程全体にまたがる,大規模で高品質で一般公開された白血病骨髄データセットを提示する。
このデータセットは、診断、臨床、研究室情報を持つ246人の小児患者と、バウンディングボックスアノテーションを持つ40,000以上の細胞と、高品質なクラスラベルを持つ28,000以上の細胞から構成されている。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Leukemia diagnosis primarily relies on manual microscopic analysis of bone marrow morphology supported by additional laboratory parameters, making it complex and time consuming. While artificial intelligence (AI) solutions have been proposed, most utilize private datasets and only cover parts of the diagnostic pipeline. Therefore, we present a large, high-quality, publicly available leukemia bone marrow dataset spanning the entire diagnostic process, from cell detection to diagnosis. Using this dataset, we further propose methods for cell detection, cell classification, and diagnosis prediction. The dataset comprises 246 pediatric patients with diagnostic, clinical and laboratory information, over 40 000 cells with bounding box annotations and more than 28 000 of these with high-quality class labels, making it the most comprehensive dataset publicly available. Evaluation of the AI models yielded an average precision of 0.96 for the cell detection, an area under the curve of 0.98, and an F1-score of 0.61 for the 33-class cell classification, and a mean F1-score of 0.90 for the diagnosis prediction using predicted cell counts. While the proposed approaches demonstrate their usefulness for AI-assisted diagnostics, the dataset will foster further research and development in the field, ultimately contributing to more precise diagnoses and improved patient outcomes.
- Abstract(参考訳): 白血病の診断は主に、追加の検査パラメータで支えられた骨髄形態を手動で解析することに依存しており、複雑で時間を要する。
人工知能(AI)ソリューションが提案されているが、ほとんどの場合、プライベートデータセットを使用し、診断パイプラインの一部のみをカバーする。
そこで我々は, 細胞検出から診断に至るまで, 診断過程全体にわたる, 大規模で高品質で公開な白血病骨髄データセットを提示した。
このデータセットを用いて、細胞検出、細胞分類、診断予測の手法をさらに提案する。
このデータセットは、診断、臨床、研究室情報を持つ246人の小児患者と、バウンディングボックスアノテーションを持つ40000以上の細胞と、高品質なクラスラベルを持つ28000以上の細胞から構成されており、最も包括的なデータセットを公開している。
AIモデルの評価では、細胞検出の平均精度0.96、曲線0.98、33クラスの細胞分類の平均F1スコア0.61、予測された細胞数を用いた診断予測の平均F1スコア0.90が得られた。
提案したアプローチは、AIによる診断に有用であることを示しているが、このデータセットはこの分野におけるさらなる研究と開発を促進し、最終的にはより正確な診断と患者結果の改善に寄与する。
関連論文リスト
- A Disease-Centric Vision-Language Foundation Model for Precision Oncology in Kidney Cancer [54.58205672910646]
RenalCLIPは、腎腫瘤の特徴、診断、予後のための視覚言語基盤モデルである。
腎がんの完全な臨床ワークフローにまたがる10のコアタスクにおいて、優れたパフォーマンスと優れた一般化性を実現した。
論文 参考訳(メタデータ) (2025-08-22T17:48:19Z) - An Agentic System for Rare Disease Diagnosis with Traceable Reasoning [69.46279475491164]
大型言語モデル(LLM)を用いた最初のまれな疾患診断エージェントシステムであるDeepRareを紹介する。
DeepRareは、まれな疾患の診断仮説を分類し、それぞれに透明な推論の連鎖が伴う。
このシステムは2,919の疾患に対して異常な診断性能を示し、1013の疾患に対して100%の精度を達成している。
論文 参考訳(メタデータ) (2025-06-25T13:42:26Z) - Leveraging Sparse Annotations for Leukemia Diagnosis on the Large Leukemia Dataset [44.948939549346676]
白血病は世界で10番目に頻繁に診断されるがんであり、がん関連死亡の原因の1つとなっている。
医学画像の深層学習の進歩にもかかわらず、白血病解析には多種多様なマルチタスクデータセットが欠けている。
大規模WBCデータセットと,その属性を用いてWBCを検出する新しい手法を提案する。
論文 参考訳(メタデータ) (2025-04-03T14:04:02Z) - RURA-Net: A general disease diagnosis method based on Zero-Shot Learning [6.528066461340262]
本研究はゼロショット学習に基づく一般的な疾患診断手法を提案する。
シームズニューラルネットワークは、標的疾患に類似した疾患を見つけるために使用される。
U-Netセグメンテーションモデルは、疾患の重要な病変を正確にセグメンテーションするために使用される。
論文 参考訳(メタデータ) (2025-02-26T16:41:32Z) - Optimizing Mortality Prediction for ICU Heart Failure Patients: Leveraging XGBoost and Advanced Machine Learning with the MIMIC-III Database [1.5186937600119894]
心臓不全は世界中の何百万人もの人々に影響を与え、生活の質を著しく低下させ、高い死亡率をもたらす。
広範な研究にもかかわらず、ICU患者の心不全と死亡率の関係は、完全には理解されていない。
本研究は、ICD-9コードを用いて、MIMIC-IIIデータベースから18歳以上の1,177人のデータを解析した。
論文 参考訳(メタデータ) (2024-09-03T07:57:08Z) - Data-Driven Machine Learning Approaches for Predicting In-Hospital Sepsis Mortality [0.0]
セプシスはアメリカ合衆国と世界中で多くの死者を負う重篤な状態である。
機械学習を用いたこれまでの研究では、特徴選択とモデル解釈可能性に制限があった。
本研究は,院内敗血症死亡率を予測するための,解釈可能かつ正確な機械学習モデルを開発することを目的とした。
論文 参考訳(メタデータ) (2024-08-03T00:28:25Z) - Histogram of Cell Types: Deep Learning for Automated Bone Marrow
Cytology [3.8385120184415418]
細胞型ヒストグラム(HCT)は骨髄のクラス分布の新規な表現である。
HCTは、血液病理診断に革命をもたらす可能性があり、よりコスト効率が高く、正確な診断をもたらし、正確な医療を行うための扉を開く。
論文 参考訳(メタデータ) (2021-07-05T21:55:00Z) - Ensemble model for pre-discharge icd10 coding prediction [45.82374977939355]
正確なコード予測のための複数の臨床データソースを組み込んだアンサンブルモデルを提案する。
平均精度は0.73および0.58、F1スコアは0.56および0.35、患者および外来データセットの主診断予測では0.71および0.4のマルチラベル分類精度を得る。
論文 参考訳(メタデータ) (2020-12-16T07:02:56Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。