論文の概要: EvalBlocks: A Modular Pipeline for Rapidly Evaluating Foundation Models in Medical Imaging
- arxiv url: http://arxiv.org/abs/2601.03811v1
- Date: Wed, 07 Jan 2026 11:16:49 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-01-08 18:12:46.187607
- Title: EvalBlocks: A Modular Pipeline for Rapidly Evaluating Foundation Models in Medical Imaging
- Title(参考訳): EvalBlocks: 医療画像の基礎モデルを迅速に評価するためのモジュールパイプライン
- Authors: Jan Tagscherer, Sarah de Boer, Lena Philipp, Fennie van der Graaf, Dré Peeters, Joeran Bosma, Lars Leijten, Bogdan Obreja, Ewoud Smit, Alessa Hering,
- Abstract要約: EvalBlocksは、開発中の基礎モデルの効率的な評価のためのプラグイン・アンド・プレイフレームワークである。
Snakemake上に構築されたEvalBlocksは、新しいデータセット、ファンデーションモデル、アグリゲーションメソッド、評価戦略のシームレスな統合をサポートする。
すべての実験と結果は中央で追跡され、単一のコマンドで再現可能である。
- 参考スコア(独自算出の注目度): 0.413952919695324
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Developing foundation models in medical imaging requires continuous monitoring of downstream performance. Researchers are burdened with tracking numerous experiments, design choices, and their effects on performance, often relying on ad-hoc, manual workflows that are inherently slow and error-prone. We introduce EvalBlocks, a modular, plug-and-play framework for efficient evaluation of foundation models during development. Built on Snakemake, EvalBlocks supports seamless integration of new datasets, foundation models, aggregation methods, and evaluation strategies. All experiments and results are tracked centrally and are reproducible with a single command, while efficient caching and parallel execution enable scalable use on shared compute infrastructure. Demonstrated on five state-of-the-art foundation models and three medical imaging classification tasks, EvalBlocks streamlines model evaluation, enabling researchers to iterate faster and focus on model innovation rather than evaluation logistics. The framework is released as open source software at https://github.com/DIAGNijmegen/eval-blocks.
- Abstract(参考訳): 医用画像の基礎モデルの開発には、下流のパフォーマンスを継続的に監視する必要がある。
研究者は、多くの実験、設計上の選択、そしてパフォーマンスに対するその影響の追跡に悩まされており、しばしばアドホックで手動のワークフローに頼っている。
EvalBlocksは,開発時に基礎モデルの効率的な評価を行うためのモジュール式プラグイン・アンド・プレイフレームワークである。
Snakemake上に構築されたEvalBlocksは、新しいデータセット、ファンデーションモデル、アグリゲーションメソッド、評価戦略のシームレスな統合をサポートする。
すべての実験と結果は中央で追跡され、単一のコマンドで再現可能であり、効率的なキャッシングと並列実行により、共有コンピューティングインフラストラクチャ上でスケーラブルな使用が可能になる。
EvalBlocksは最先端の5つの基礎モデルと3つの医用画像分類タスクを実証し、モデル評価を合理化し、研究者はロジスティクスの評価よりもモデル革新に重点を置くことができる。
このフレームワークはhttps://github.com/DIAGNijmegen/eval-blocks.comでオープンソースとしてリリースされている。
関連論文リスト
- Nonparametric Data Attribution for Diffusion Models [57.820618036556084]
生成モデルのデータ属性は、個々のトレーニング例がモデル出力に与える影響を定量化する。
生成画像とトレーニング画像のパッチレベルの類似性によって影響を測定する非パラメトリック属性法を提案する。
論文 参考訳(メタデータ) (2025-10-16T03:37:16Z) - Data-Juicer Sandbox: A Feedback-Driven Suite for Multimodal Data-Model Co-development [67.55944651679864]
統合データモデル共同開発に適した新しいサンドボックススイートを提案する。
このサンドボックスは、フィードバック駆動の実験プラットフォームを提供し、コスト効率とデータとモデルの両方のガイド付き洗練を可能にする。
論文 参考訳(メタデータ) (2024-07-16T14:40:07Z) - Adv-KD: Adversarial Knowledge Distillation for Faster Diffusion Sampling [2.91204440475204]
拡散確率モデル(DPM)は、深層生成モデルの強力なクラスとして登場した。
それらは、サンプル生成中にシーケンシャルなデノイングステップに依存している。
モデルアーキテクチャに直接位相を分解する新しい手法を提案する。
論文 参考訳(メタデータ) (2024-05-31T08:19:44Z) - CoSense3D: an Agent-based Efficient Learning Framework for Collective Perception [0.552480439325792]
本稿では,よりクリーンなデータフロー構造を実現するために,ディープラーニングモジュールとエージェントデータを個別に扱うエージェントベースのトレーニングフレームワークを提案する。
このフレームワークは、データ処理パイプラインをプロトタイピングし、各エージェントの勾配計算を定義するAPIを提供するだけでなく、インタラクティブなトレーニング、テスト、データ視覚化のためのユーザインターフェースも提供する。
論文 参考訳(メタデータ) (2024-04-29T11:40:27Z) - Rethinking model prototyping through the MedMNIST+ dataset collection [0.11999555634662634]
この作業では、MedMNIST+データセットコレクションの包括的なベンチマークを導入する。
我々は、一般的なCNN(Convolutional Neural Networks)とViT(Vision Transformer)アーキテクチャを、異なる医療データセットにわたって再評価する。
この結果から,計算効率のよいトレーニングスキームと最新の基礎モデルが,エンドツーエンドのトレーニングに有効な代替手段を提供する可能性が示唆された。
論文 参考訳(メタデータ) (2024-04-24T10:19:25Z) - Low-resource finetuning of foundation models beats state-of-the-art in
histopathology [3.4577420145036375]
病理組織学データの特徴抽出器として最も人気のある視覚基盤モデルをベンチマークする。
データセットに応じて、単一のGPU上のファンデーションモデルをわずか2時間から3日で微調整することで、最先端の機能抽出器にマッチまたは性能を向上することができる。
これは、大量のリソースとデータセットを持つ機関だけが特徴抽出器を訓練できる、現在の状態からかなり変化している。
論文 参考訳(メタデータ) (2024-01-09T18:46:59Z) - Guided Flows for Generative Modeling and Decision Making [55.42634941614435]
その結果,ガイドフローは条件付き画像生成やゼロショット音声合成におけるサンプル品質を著しく向上させることがわかった。
特に、我々は、拡散モデルと比較して、オフライン強化学習設定axスピードアップにおいて、まず、計画生成にフローモデルを適用する。
論文 参考訳(メタデータ) (2023-11-22T15:07:59Z) - Concept-based model explanations for Electronic Health Records [1.6837409766909865]
概念活性化ベクトル(TCAV)を用いたテストは、人間に理解可能な説明を提供する手段として最近導入された。
本手法を時系列データに拡張し,TCAVの適用をEHRの逐次予測に適用する。
論文 参考訳(メタデータ) (2020-12-03T22:18:24Z) - Image Matching across Wide Baselines: From Paper to Practice [80.9424750998559]
局所的な特徴とロバストな推定アルゴリズムの包括的なベンチマークを導入する。
パイプラインのモジュール構造は、さまざまなメソッドの容易な統合、構成、組み合わせを可能にします。
適切な設定で、古典的な解決策は依然として芸術の知覚された状態を上回る可能性があることを示す。
論文 参考訳(メタデータ) (2020-03-03T15:20:57Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。