Fugu-MT 論文翻訳(概要): From Data to Diagnosis: A Large, Comprehensive Bone Marrow Dataset and AI Methods for Childhood Leukemia Prediction

論文の概要: From Data to Diagnosis: A Large, Comprehensive Bone Marrow Dataset and AI Methods for Childhood Leukemia Prediction

arxiv url: http://arxiv.org/abs/2509.15895v1
Date: Fri, 19 Sep 2025 11:48:48 GMT
ステータス: 翻訳完了
システム内更新日: 2025-09-22 18:18:11.149732
Title: From Data to Diagnosis: A Large, Comprehensive Bone Marrow Dataset and AI Methods for Childhood Leukemia Prediction
Title（参考訳）: データから診断へ:小児白血病予測のための大規模で総合的な骨髄データセットとAI手法
Authors: Henning Höfener, Farina Kock, Martina Pontones, Tabita Ghete, David Pfrang, Nicholas Dickel, Meik Kunz, Daniela P. Schacherer, David A. Clunie, Andrey Fedorov, Max Westphal, Markus Metzler,
Abstract要約: 診断過程全体にまたがる,大規模で高品質で一般公開された白血病骨髄データセットを提示する。このデータセットは、診断、臨床、研究室情報を持つ246人の小児患者と、バウンディングボックスアノテーションを持つ40,000以上の細胞と、高品質なクラスラベルを持つ28,000以上の細胞から構成されている。
参考スコア（独自算出の注目度）: 0.0
License: http://creativecommons.org/licenses/by/4.0/
Abstract: Leukemia diagnosis primarily relies on manual microscopic analysis of bone marrow morphology supported by additional laboratory parameters, making it complex and time consuming. While artificial intelligence (AI) solutions have been proposed, most utilize private datasets and only cover parts of the diagnostic pipeline. Therefore, we present a large, high-quality, publicly available leukemia bone marrow dataset spanning the entire diagnostic process, from cell detection to diagnosis. Using this dataset, we further propose methods for cell detection, cell classification, and diagnosis prediction. The dataset comprises 246 pediatric patients with diagnostic, clinical and laboratory information, over 40 000 cells with bounding box annotations and more than 28 000 of these with high-quality class labels, making it the most comprehensive dataset publicly available. Evaluation of the AI models yielded an average precision of 0.96 for the cell detection, an area under the curve of 0.98, and an F1-score of 0.61 for the 33-class cell classification, and a mean F1-score of 0.90 for the diagnosis prediction using predicted cell counts. While the proposed approaches demonstrate their usefulness for AI-assisted diagnostics, the dataset will foster further research and development in the field, ultimately contributing to more precise diagnoses and improved patient outcomes.
Abstract（参考訳）: 白血病の診断は主に、追加の検査パラメータで支えられた骨髄形態を手動で解析することに依存しており、複雑で時間を要する。人工知能(AI)ソリューションが提案されているが、ほとんどの場合、プライベートデータセットを使用し、診断パイプラインの一部のみをカバーする。そこで我々は, 細胞検出から診断に至るまで, 診断過程全体にわたる, 大規模で高品質で公開な白血病骨髄データセットを提示した。このデータセットを用いて、細胞検出、細胞分類、診断予測の手法をさらに提案する。このデータセットは、診断、臨床、研究室情報を持つ246人の小児患者と、バウンディングボックスアノテーションを持つ40000以上の細胞と、高品質なクラスラベルを持つ28000以上の細胞から構成されており、最も包括的なデータセットを公開している。 AIモデルの評価では、細胞検出の平均精度0.96、曲線0.98、33クラスの細胞分類の平均F1スコア0.61、予測された細胞数を用いた診断予測の平均F1スコア0.90が得られた。提案したアプローチは、AIによる診断に有用であることを示しているが、このデータセットはこの分野におけるさらなる研究と開発を促進し、最終的にはより正確な診断と患者結果の改善に寄与する。

関連論文リスト

Evolving Diagnostic Agents in a Virtual Clinical Environment [75.59389103511559]
本稿では,大規模言語モデル(LLM)を強化学習を用いた診断エージェントとして訓練するためのフレームワークを提案する。本手法は対話型探索と結果に基づくフィードバックによって診断戦略を取得する。 DiagAgentはDeepSeek-v3やGPT-4oなど、最先端の10のLLMを著しく上回っている。
論文参考訳（メタデータ） (2025-10-28T17:19:47Z)
Timely Clinical Diagnosis through Active Test Selection [49.091903570068155]
本稿では,現実の診断推論をよりうまくエミュレートするためのACTMED (Adaptive Clinical Test selection via Model-based Experimental Design)を提案する。 LLMは柔軟なシミュレータとして機能し、構造化されたタスク固有のトレーニングデータを必要とせずに、患者状態のもっともらしい分布を生成し、信念の更新をサポートする。我々は、実世界のデータセット上でACTMEDを評価し、診断精度、解釈可能性、リソース使用量を改善するためにテスト選択を最適化できることを示す。
論文参考訳（メタデータ） (2025-10-21T18:10:45Z)
An Explainable Hybrid AI Framework for Enhanced Tuberculosis and Symptom Detection [55.35661671061754]
結核は、特に資源に制限された遠隔地において、重要な世界的な健康問題である。本稿では, 胸部X線による疾患および症状の検出を, 2つの頭部と自己監督頭部を統合することで促進する枠組みを提案する。本モデルでは, 新型コロナウイルス, 結核, 正常症例の鑑別で98.85%の精度が得られ, マルチラベル症状検出では90.09%のマクロF1スコアが得られた。
論文参考訳（メタデータ） (2025-10-21T17:18:55Z)
A Disease-Centric Vision-Language Foundation Model for Precision Oncology in Kidney Cancer [54.58205672910646]
RenalCLIPは、腎腫瘤の特徴、診断、予後のための視覚言語基盤モデルである。腎がんの完全な臨床ワークフローにまたがる10のコアタスクにおいて、優れたパフォーマンスと優れた一般化性を実現した。
論文参考訳（メタデータ） (2025-08-22T17:48:19Z)
An Explainable AI-Enhanced Machine Learning Approach for Cardiovascular Disease Detection and Risk Assessment [0.0]
心臓病は依然として世界的な健康上の問題である。従来の診断方法では、心臓病のリスクを正確に特定し、管理することができない。機械学習は、心臓疾患の診断の正確性、効率、スピードを大幅に向上させる可能性がある。
論文参考訳（メタデータ） (2025-07-15T10:38:38Z)
An Agentic System for Rare Disease Diagnosis with Traceable Reasoning [69.46279475491164]
大型言語モデル(LLM)を用いた最初のまれな疾患診断エージェントシステムであるDeepRareを紹介する。 DeepRareは、まれな疾患の診断仮説を分類し、それぞれに透明な推論の連鎖が伴う。このシステムは2,919の疾患に対して異常な診断性能を示し、1013の疾患に対して100%の精度を達成している。
論文参考訳（メタデータ） (2025-06-25T13:42:26Z)
Leveraging Sparse Annotations for Leukemia Diagnosis on the Large Leukemia Dataset [44.948939549346676]
白血病は世界で10番目に頻繁に診断されるがんであり、がん関連死亡の原因の1つとなっている。医学画像の深層学習の進歩にもかかわらず、白血病解析には多種多様なマルチタスクデータセットが欠けている。大規模WBCデータセットと,その属性を用いてWBCを検出する新しい手法を提案する。
論文参考訳（メタデータ） (2025-04-03T14:04:02Z)
RURA-Net: A general disease diagnosis method based on Zero-Shot Learning [6.528066461340262]
本研究はゼロショット学習に基づく一般的な疾患診断手法を提案する。シームズニューラルネットワークは、標的疾患に類似した疾患を見つけるために使用される。 U-Netセグメンテーションモデルは、疾患の重要な病変を正確にセグメンテーションするために使用される。
論文参考訳（メタデータ） (2025-02-26T16:41:32Z)
Optimizing Mortality Prediction for ICU Heart Failure Patients: Leveraging XGBoost and Advanced Machine Learning with the MIMIC-III Database [1.5186937600119894]
心臓不全は世界中の何百万人もの人々に影響を与え、生活の質を著しく低下させ、高い死亡率をもたらす。広範な研究にもかかわらず、ICU患者の心不全と死亡率の関係は、完全には理解されていない。本研究は、ICD-9コードを用いて、MIMIC-IIIデータベースから18歳以上の1,177人のデータを解析した。
論文参考訳（メタデータ） (2024-09-03T07:57:08Z)
Data-Driven Machine Learning Approaches for Predicting In-Hospital Sepsis Mortality [0.0]
セプシスはアメリカ合衆国と世界中で多くの死者を負う重篤な状態である。機械学習を用いたこれまでの研究では、特徴選択とモデル解釈可能性に制限があった。本研究は,院内敗血症死亡率を予測するための,解釈可能かつ正確な機械学習モデルを開発することを目的とした。
論文参考訳（メタデータ） (2024-08-03T00:28:25Z)
Histogram of Cell Types: Deep Learning for Automated Bone Marrow Cytology [3.8385120184415418]
細胞型ヒストグラム(HCT)は骨髄のクラス分布の新規な表現である。 HCTは、血液病理診断に革命をもたらす可能性があり、よりコスト効率が高く、正確な診断をもたらし、正確な医療を行うための扉を開く。
論文参考訳（メタデータ） (2021-07-05T21:55:00Z)
Ensemble model for pre-discharge icd10 coding prediction [45.82374977939355]
正確なコード予測のための複数の臨床データソースを組み込んだアンサンブルモデルを提案する。平均精度は0.73および0.58、F1スコアは0.56および0.35、患者および外来データセットの主診断予測では0.71および0.4のマルチラベル分類精度を得る。
論文参考訳（メタデータ） (2020-12-16T07:02:56Z)
UNITE: Uncertainty-based Health Risk Prediction Leveraging Multi-sourced Data [81.00385374948125]
我々はUNcertaInTyベースのhEalth Risk Prediction(UNITE)モデルを提案する。 UNITEは、複数ソースの健康データを活用した正確な疾患リスク予測と不確実性推定を提供する。非アルコール性脂肪肝疾患(NASH)とアルツハイマー病(AD)の実態予測タスクにおけるUNITEの評価を行った。 UNITEはAD検出のF1スコアで最大0.841点、NASH検出のPR-AUCで最大0.609点を達成し、最高のベースラインで最大19%の高パフォーマンスを達成している。
論文参考訳（メタデータ） (2020-10-22T02:28:11Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。