論文の概要: How Far Has AI Come in Liver Fibrosis Staging? A Large-Scale Real-World Dataset and Benchmark
- arxiv url: http://arxiv.org/abs/2605.25595v1
- Date: Mon, 25 May 2026 08:47:16 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-05-26 19:50:19.528695
- Title: How Far Has AI Come in Liver Fibrosis Staging? A Large-Scale Real-World Dataset and Benchmark
- Title(参考訳): AIはいつまで肝臓線維化を停滞させるのか? - 大規模な実世界のデータセットとベンチマーク
- Authors: Yuanye Liu, Nannan Shi, Zhejia Zhang, Hanxiao Zhang, Boya Wang, Derong Yu, Nao Wang, Yuxin Jin, Yang Zhou, Kunhao Yuan, Siqi Wang, Lida Yang, Xu Qiao, Wentao Liu, Xuelei He, Xin Hong, Guoyan Zheng, Xin Chen, Guang-Zhong Yang, Le Zhang, Lei Li, Yuxin Shi, Xiahai Zhuang,
- Abstract要約: 我々はMICCAI 2025 CARE-Liverチャレンジから派生した大規模データセットとベンチマークであるLiFSを紹介する。
LiFSは、様々な現実世界のスキャナーから、組織学的に確認されたアノテーションで完全なガドキシー酸の配列を提供する最初のベンチマークである。
- 参考スコア(独自算出の注目度): 44.60966248233107
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Despite years of methodological progress, how far AI has come in liver fibrosis staging has never been systematically evaluated under the heterogeneous, multi-center conditions that define clinical practice. To address this gap, we introduce LiFS, a large-scale dataset and benchmark derived from the MICCAI 2025 CARE-Liver challenge, comprising 610 patients across multiple centers and scanners with multi-sequence MRI. To the best of our knowledge, LiFS is the first benchmark providing complete gadoxetic acid-enhanced sequences with histopathology-confirmed annotations from diverse real-world scanners. Through systematic evaluation of 9 independently developed methods selected from 96 registered teams against in-cohort radiologist reference results, our findings address how far current AI has progressed toward clinical-level liver fibrosis staging from three complementary perspectives. First, against radiologists, the best AI methods were broadly comparable to the senior radiologist and significantly exceeded the junior radiologist in selected settings, while median AI performance generally approached junior-radiologist levels. Second, from a data perspective, cross-center heterogeneity, label imbalance, and contrast-enhanced sequence variability emerge as the dominant challenges for AI methods. Third, from a technical perspective, methodological design choices, including spatial registration, input dimensionality, multi-modal fusion strategy, and backbone architecture, appear to modulate cross-center robustness, although no single choice alone closes the gap. Overall, LiFS provides a rigorous real-world benchmark for positioning the current state of AI in liver fibrosis staging and for enabling future research on the key challenges that limit clinically reliable deployment.
- Abstract(参考訳): 長年の方法論的な進歩にもかかわらず、臨床実践を定義する異種多施設条件下では、AIが肝線維症のステージングにどの程度の頻度で関わったかは、体系的に評価されていない。
このギャップに対処するために、MICCAI 2025 CARE-Liverチャレンジから派生した大規模データセットとベンチマークであるLiFSを導入し、複数のセンターにまたがる610人の患者と、マルチシーケンスMRIを備えたスキャナーを含む。
我々の知る限り、LiFSは、様々な現実世界のスキャナーから、病理組織学的に確認されたアノテーションを含む完全なガドキシー酸強調配列を提供する最初のベンチマークである。
本研究は,96名の登録チームから選抜された9つの方法の組織的評価を通じて,3つの相補的視点から,現在のAIが臨床レベルの肝線維症に向かってどこまで進展したかを示すものである。
第一に、放射線科医に対して、最高のAI手法は上級放射線科医に大きく匹敵し、選択した設定でジュニア放射線科医をはるかに上回ったのに対し、中央値のAIパフォーマンスは一般的に中級放射線科医に接近した。
第2に、データの観点から見れば、AIメソッドの主要な課題として、クロスセンタの不均一性、ラベルの不均衡、コントラスト強化シーケンスの多様性が登場します。
第三に、技術的な観点から言えば、空間的登録、入力次元、マルチモーダル融合戦略、バックボーンアーキテクチャといった方法論的な設計上の選択は、中心間の堅牢性を変調するように見えるが、唯一の選択がギャップを埋めるものではない。
全体として、LiFSは、肝線維症ステージングにおけるAIの現在の状態を位置決めするための厳格な実世界のベンチマークを提供し、臨床に信頼性のあるデプロイメントを制限する重要な課題について将来の研究を可能にする。
関連論文リスト
- Beyond Benchmarks of IUGC: Rethinking Requirements of Deep Learning Methods for Intrapartum Ultrasound Biometry from Fetal Ultrasound Videos [58.71502465551297]
MICCAI 2024と共同でIUGC(Intrapartum Ultrasound Grand Challenge)が打ち上げられた。
IUGCは、標準的な平面分類、胎児の頭頂部生理的セグメンテーション、バイオメトリーを統合した、臨床指向のマルチタスク自動測定フレームワークを導入している。
この課題は、これまでに3つの病院から収集された774のビデオ(68,106フレーム)を含む、最大規模のマルチセンターの超音波ビデオデータセットをリリースしている。
論文 参考訳(メタデータ) (2026-02-13T13:28:22Z) - Medical Imaging AI Competitions Lack Fairness [50.895929923643905]
課題データセットが現実の臨床的多様性を代表するものなのか、FAIR原則に従ってアクセス可能で法的に再利用可能なものなのか、という2つの相補的な側面に沿って公正性を評価する。
本研究の結果は, 地理的位置, モダリティ, 問題型関連バイアスなどのデータセット構成に有意な偏りがみられ, 現在のベンチマークは実世界の臨床多様性を十分に反映していないことが示唆された。
これらの欠点は、ベンチマークエコシステムの基本的な制限を明らかにし、リーダボードの成功と臨床関連性との間の断絶を浮き彫りにします。
論文 参考訳(メタデータ) (2025-12-19T13:48:10Z) - Advances in Automated Fetal Brain MRI Segmentation and Biometry: Insights from the FeTA 2024 Challenge [27.07002392996198]
FeTA Challenge 2024は胎児脳MRI解析を進歩させた。
組織セグメンテーションと並行して新しい課題としてバイオメトリ予測を導入した。
今回は、新しいローフィールド(0.55T)MRIデータセットからのデータを含む、多様なマルチ中心テストセットを初めて紹介しました。
論文 参考訳(メタデータ) (2025-05-05T16:54:04Z) - Multi-Class Segmentation of Aortic Branches and Zones in Computed Tomography Angiography: The AortaSeg24 Challenge [55.252714550918824]
AortaSeg24 MICCAI Challengeは、23の臨床的に関連する大動脈枝と領域に注釈付き100 CTA巻の最初のデータセットを導入した。
本稿では,トップパフォーマンスアルゴリズムの課題設計,データセットの詳細,評価指標,詳細な分析について述べる。
論文 参考訳(メタデータ) (2025-02-07T21:09:05Z) - A Retrospective Systematic Study on Hierarchical Sparse Query Transformer-assisted Ultrasound Screening for Early Hepatocellular Carcinoma [10.226976909997711]
HCCは世界で3番目に多いがん関連死亡原因である。
AI技術の最近の進歩は、このギャップを埋めるための有望なソリューションを提供する。
HSQformerは、CNNのローカル特徴抽出とVision Transformerのグローバルコンテキスト認識を相乗化する、新しいハイブリッドアーキテクチャである。
論文 参考訳(メタデータ) (2025-02-06T04:17:02Z) - A Robust Ensemble Algorithm for Ischemic Stroke Lesion Segmentation: Generalizability and Clinical Utility Beyond the ISLES Challenge [30.611482996378683]
画像と疾患の多様性は、臨床価値を持つ一般化可能なAIアルゴリズムの開発を妨げる。
2022 Ischemic Stroke Lesion (ISLES) から得られた新しいアンサンブルアルゴリズムを提案する。
トップパフォーマンスのアルゴリズムを、個々のソリューションの限界を克服するアンサンブルモデルに組み合わせました。
論文 参考訳(メタデータ) (2024-03-28T13:56:26Z) - An AI tool for automated analysis of large-scale unstructured clinical
cine CMR databases [0.0]
大規模臨床データベースにおけるSAX cine CMRからの心臓機能の自動定量化のための堅牢なAIツールの開発と評価を行った。
提案ツールは、画像前処理ステップと、大規模マルチドメインCMRデータセットと品質管理ステップに基づいてトレーニングされた、ドメイン汎用AIアルゴリズムを組み合わせる。
これにより、大規模なマルチセントレデータベースの完全自動処理に使用するためのツールの翻訳が可能となる。
論文 参考訳(メタデータ) (2022-06-15T11:54:51Z) - A Global Benchmark of Algorithms for Segmenting Late Gadolinium-Enhanced
Cardiac Magnetic Resonance Imaging [90.29017019187282]
現在世界最大の心臓LGE-MRIデータセットである154個の3D LGE-MRIを用いた「2018 left Atrium Challenge」。
技術および生物学的指標を用いた提案アルゴリズムの解析を行った。
その結果, 最上部法は93.2%, 平均表面は0.7mmであった。
論文 参考訳(メタデータ) (2020-04-26T08:49:17Z) - VerSe: A Vertebrae Labelling and Segmentation Benchmark for
Multi-detector CT Images [121.31355003451152]
大規模Vertebrae Challenge(VerSe)は、2019年と2020年に開催されたMICCAI(International Conference on Medical Image Computing and Computer Assisted Intervention)と共同で設立された。
本評価の結果を報告するとともに,脊椎レベル,スキャンレベル,および異なる視野での性能変化について検討した。
論文 参考訳(メタデータ) (2020-01-24T21:09:18Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。