論文の概要: The LUMirage: An independent evaluation of zero-shot performance in the LUMIR challenge
- arxiv url: http://arxiv.org/abs/2512.15505v1
- Date: Wed, 17 Dec 2025 14:48:01 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-12-18 17:06:27.032878
- Title: The LUMirage: An independent evaluation of zero-shot performance in the LUMIR challenge
- Title(参考訳): LUMirage: LUMIRチャレンジにおけるゼロショット性能の独立評価
- Authors: Rohit Jena, Pratik Chaudhari, James C. Gee,
- Abstract要約: LUMIRチャレンジは、大規模なニューロイメージングデータ上での変形可能な画像登録方法を評価するための重要なベンチマークである。
この課題は、現代のディープラーニング手法が、T1強調MRI上での競合精度を実現することを実証する一方で、目に見えないコントラストや解像度に対する例外的なゼロショットの一般化も主張している。
我々は、厳密な評価プロトコルを用いて、これらのゼロショットクレームを独立に再評価し、インスツルメンテーションバイアスの潜在的な原因に対処する。
- 参考スコア(独自算出の注目度): 20.35907245543535
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: The LUMIR challenge represents an important benchmark for evaluating deformable image registration methods on large-scale neuroimaging data. While the challenge demonstrates that modern deep learning methods achieve competitive accuracy on T1-weighted MRI, it also claims exceptional zero-shot generalization to unseen contrasts and resolutions, assertions that contradict established understanding of domain shift in deep learning. In this paper, we perform an independent re-evaluation of these zero-shot claims using rigorous evaluation protocols while addressing potential sources of instrumentation bias. Our findings reveal a more nuanced picture: (1) deep learning methods perform comparably to iterative optimization on in-distribution T1w images and even on human-adjacent species (macaque), demonstrating improved task understanding; (2) however, performance degrades significantly on out-of-distribution contrasts (T2, T2*, FLAIR), with Cohen's d scores ranging from 0.7-1.5, indicating substantial practical impact on downstream clinical workflows; (3) deep learning methods face scalability limitations on high-resolution data, failing to run on 0.6 mm isotropic images, while iterative methods benefit from increased resolution; and (4) deep methods exhibit high sensitivity to preprocessing choices. These results align with the well-established literature on domain shift and suggest that claims of universal zero-shot superiority require careful scrutiny. We advocate for evaluation protocols that reflect practical clinical and research workflows rather than conditions that may inadvertently favor particular method classes.
- Abstract(参考訳): LUMIRチャレンジは、大規模なニューロイメージングデータ上での変形可能な画像登録方法を評価するための重要なベンチマークである。
この課題は、現代のディープラーニング手法が、T1強調MRI上での競合精度を実現することを実証する一方で、非表示のコントラストや解像度への例外的なゼロショット一般化を主張する。
本稿では、厳密な評価プロトコルを用いて、これらのゼロショットクレームを独立に再評価し、インスツルメンテーションバイアスの潜在的な原因に対処する。
その結果,(1) 深層学習手法は, 分布内T1w画像の反復的最適化や, タスク理解の向上を実証する,(2) 分布外コントラスト(T2, T2*, FLAIR) に顕著に低下する, (3) 深層学習法は, 下流の医療ワークフローに実質的な影響を示す, Cohen の d スコアが 0.7-1.5 の範囲にある, 深層学習法は, 0.6 mm の等方的画像上では拡張性に限界があり, 反復的手法は分解能の向上に寄与する, (4) 深層学習法は前処理選択に対して高い感度を示す, という結果が得られた。
これらの結果は、ドメインシフトに関する確立された文献と一致し、普遍的なゼロショット優位性の主張には慎重な精査が必要であることを示唆している。
我々は,特定の方法の授業を不注意に好むような条件ではなく,実践的な臨床・研究のワークフローを反映した評価プロトコルを提唱する。
関連論文リスト
- Beyond the LUMIR challenge: The pathway to foundational registration models [25.05315856123745]
LUMIR(Large-scale Unsupervised Brain MRI Image Registration)は、非教師なし脳MRI登録の評価と進歩を目的とした次世代ベンチマークである。
LUMIRは、ラベルマップなしでトレーニングするための4000以上の前処理されたT1強調脳MRIを提供し、生物学的に妥当な変形モデリングを促進する。
被験者は1,158名、画像ペアは4,000名以上であった。
論文 参考訳(メタデータ) (2025-05-30T03:07:58Z) - T2I-Eval-R1: Reinforcement Learning-Driven Reasoning for Interpretable Text-to-Image Evaluation [60.620408007636016]
T2I-Eval-R1は,大まかな品質スコアのみを用いて,オープンソースのMLLMを訓練する新しい強化学習フレームワークである。
提案手法では,グループ相対政策最適化を命令調整プロセスに統合し,スカラースコアと解釈可能な推論チェーンの両方を生成する。
論文 参考訳(メタデータ) (2025-05-23T13:44:59Z) - PathVLM-R1: A Reinforcement Learning-Driven Reasoning Model for Pathology Visual-Language Tasks [15.497221591506625]
病理画像に特化して設計された視覚言語モデルPathVLM-R1を提案する。
我々は,Qwen2.5-VL-7B-インストラクタをベースとして,厳密に設計したポストトレーニング戦略により,病理的タスクのパフォーマンスを向上させた。
論文 参考訳(メタデータ) (2025-04-12T15:32:16Z) - Less is More: Selective Reduction of CT Data for Self-Supervised Pre-Training of Deep Learning Models with Contrastive Learning Improves Downstream Classification Performance [7.945551345449388]
現在の知見は、医用画像における対照的な事前トレーニングの可能性を示している。
医用画像の類似性は、医用画像領域における対照的な学習の成功を妨げていると仮定する。
医療用事前学習データセットの冗長性を同定・低減するために, 深層埋め込み, 情報理論, ハッシュに基づく様々な戦略を検討する。
論文 参考訳(メタデータ) (2024-10-18T15:08:05Z) - Efficient Diffusion as Low Light Enhancer [63.789138528062225]
RATR(Reflectance-Aware Trajectory Refinement)は、イメージの反射成分を用いて教師の軌跡を洗練するための、シンプルで効果的なモジュールである。
textbfReDDiT (textbfDistilled textbfTrajectory) は低照度画像強調(LLIE)に適した効率的で柔軟な蒸留フレームワークである。
論文 参考訳(メタデータ) (2024-10-16T08:07:18Z) - Rethinking Semi-Supervised Medical Image Segmentation: A
Variance-Reduction Perspective [51.70661197256033]
医用画像セグメンテーションのための階層化グループ理論を用いた半教師付きコントラスト学習フレームワークARCOを提案する。
まず、分散還元推定の概念を用いてARCOを構築することを提案し、特定の分散還元技術が画素/ボクセルレベルのセグメンテーションタスクにおいて特に有用であることを示す。
5つの2D/3D医療データセットと3つのセマンティックセグメンテーションデータセットのラベル設定が異なる8つのベンチマークで、我々のアプローチを実験的に検証する。
論文 参考訳(メタデータ) (2023-02-03T13:50:25Z) - A Knowledge-based Learning Framework for Self-supervised Pre-training
Towards Enhanced Recognition of Medical Images [14.304996977665212]
本研究では,医用画像の認識向上に向けた知識ベース学習フレームワークを提案する。
コントラスト学習と生成学習モデルを相乗化することで、3つのフェーズで機能する。
提案したフレームワークは、AUC/DiceのSimCLRよりも2.08, 1.23, 1.12, 0.76, 1.38ポイント改善された自己教師型ベンチマークで統計的に優れている。
論文 参考訳(メタデータ) (2022-11-27T03:58:58Z) - Real-World Image Super-Resolution by Exclusionary Dual-Learning [98.36096041099906]
実世界の画像超解像は,高品質な画像を得るための実用的な画像復元問題である。
深層学習に基づく手法は、現実世界の超解像データセットの復元に期待できる品質を実現している。
本稿では,RWSR-EDL(Real-World Image Super-Resolution by Exclusionary Dual-Learning)を提案する。
論文 参考訳(メタデータ) (2022-06-06T13:28:15Z) - Low-resolution Human Pose Estimation [49.531572116079026]
低分解能ポーズ推定のための信頼意識学習(CAL)手法を提案する。
CALは、既存のオフセット学習手法の2つの基本的な制限に対処する: 一貫性のないトレーニングとテスト、分離されたヒートマップとオフセット学習。
提案手法は,低分解能人間のポーズ推定における最先端の手法よりも優れていた。
論文 参考訳(メタデータ) (2021-09-19T09:13:57Z) - On the Practicality of Deterministic Epistemic Uncertainty [106.06571981780591]
決定論的不確実性法(DUM)は,分布外データの検出において高い性能を達成する。
DUMが十分に校正されており、現実のアプリケーションにシームレスにスケールできるかどうかは不明だ。
論文 参考訳(メタデータ) (2021-07-01T17:59:07Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。