Fugu-MT 論文翻訳(概要): Rethinking Model Prototyping through the MedMNIST+ Dataset Collection

論文の概要: Rethinking Model Prototyping through the MedMNIST+ Dataset Collection

arxiv url: http://arxiv.org/abs/2404.15786v2
Date: Tue, 7 May 2024 20:49:46 GMT
ステータス: 翻訳完了
システム内更新日: 2024-05-09 18:50:56.576135
Title: Rethinking Model Prototyping through the MedMNIST+ Dataset Collection
Title（参考訳）: MedMNIST+データセットコレクションによるモデルプロトタイピングの再考
Authors: Sebastian Doerrich, Francesco Di Salvo, Julius Brockmann, Christian Ledig,
Abstract要約: 本研究は,MedMNIST+データベースに対する評価環境の多様化のためのベンチマークを示す。我々は、医用画像分類のための共通畳み込みニューラルネットワーク(CNN)とトランスフォーマーベースのアーキテクチャを徹底的に分析する。この結果から,計算効率のよいトレーニングスキームと最新の基礎モデルは,高額なエンドツーエンドトレーニングとリソース強化アプローチのギャップを埋める上で有望であることが示唆された。
参考スコア（独自算出の注目度）: 0.11999555634662634
License: http://creativecommons.org/licenses/by/4.0/
Abstract: The integration of deep learning based systems in clinical practice is often impeded by challenges rooted in limited and heterogeneous medical datasets. In addition, prioritization of marginal performance improvements on a few, narrowly scoped benchmarks over clinical applicability has slowed down meaningful algorithmic progress. This trend often results in excessive fine-tuning of existing methods to achieve state-of-the-art performance on selected datasets rather than fostering clinically relevant innovations. In response, this work presents a comprehensive benchmark for the MedMNIST+ database to diversify the evaluation landscape and conduct a thorough analysis of common convolutional neural networks (CNNs) and Transformer-based architectures, for medical image classification. Our evaluation encompasses various medical datasets, training methodologies, and input resolutions, aiming to reassess the strengths and limitations of widely used model variants. Our findings suggest that computationally efficient training schemes and modern foundation models hold promise in bridging the gap between expensive end-to-end training and more resource-refined approaches. Additionally, contrary to prevailing assumptions, we observe that higher resolutions may not consistently improve performance beyond a certain threshold, advocating for the use of lower resolutions, particularly in prototyping stages, to expedite processing. Notably, our analysis reaffirms the competitiveness of convolutional models compared to ViT-based architectures emphasizing the importance of comprehending the intrinsic capabilities of different model architectures. Moreover, we hope that our standardized evaluation framework will help enhance transparency, reproducibility, and comparability on the MedMNIST+ dataset collection as well as future research within the field. Code is available at https://github.com/sdoerrich97 .
Abstract（参考訳）: 臨床実践におけるディープラーニングベースのシステムの統合は、制限された異種医学データセットに根ざした課題によってしばしば妨げられる。さらに、臨床応用性よりも狭い範囲のベンチマークでの限界性能改善の優先順位付けは、有意義なアルゴリズムの進歩を遅らせている。この傾向は、臨床に関係のある革新を育むのではなく、選択したデータセット上で最先端のパフォーマンスを達成するために既存の手法を過度に微調整する結果をもたらすことが多い。本研究は、MedMNIST+データベースの総合的なベンチマークを提示し、評価環境の多様化と、医用画像分類のための共通畳み込みニューラルネットワーク(CNN)とトランスフォーマーベースのアーキテクチャの徹底的な分析を行う。本評価は, 様々な医療データセット, トレーニング手法, 入力解像度を包含し, 広く使用されているモデル変異の強度と限界を再評価することを目的としている。この結果から,計算効率のよいトレーニングスキームと最新の基礎モデルは,高額なエンドツーエンドトレーニングとリソース強化アプローチのギャップを埋める上で有望であることが示唆された。さらに、一般的な仮定とは対照的に、高分解能は一定のしきい値を超えるパフォーマンスを一貫して改善することはなく、特にプロトタイピング段階における低分解能の使用を優先して処理を高速化する。特に,本研究では,異なるモデルアーキテクチャの本質的な能力を理解することの重要性を強調したViTベースのアーキテクチャと比較して,畳み込みモデルの競争性を再確認する。さらに、我々の標準化された評価フレームワークは、MedMNIST+データセットコレクションの透明性、再現性、コンパラビリティの向上と、この分野における今後の研究に役立つことを期待しています。コードはhttps://github.com/sdoerrich97で入手できる。

関連論文リスト

Adapting HFMCA to Graph Data: Self-Supervised Learning for Generalizable fMRI Representations [57.054499278843856]
機能的磁気共鳴画像(fMRI)解析は、データセットのサイズが限られ、研究間でのドメインの変動が原因で大きな課題に直面している。コンピュータビジョンにインスパイアされた従来の自己教師付き学習手法は、正と負のサンプルペアに依存することが多い。本稿では,最近開発された階層関数最大相関アルゴリズム(HFMCA)をグラフ構造fMRIデータに適用することを提案する。
論文参考訳（メタデータ） (2025-10-05T12:35:01Z)
Challenges in Deep Learning-Based Small Organ Segmentation: A Benchmarking Perspective for Medical Research with Limited Datasets [1.2648105980808475]
本研究では,最先端のディープラーニングセグメンテーションモデルの体系的評価について検討する。その結果, モデル性能はデータ分割に非常に敏感であり, 統計的ノイズによる差は, 真のアルゴリズム上の優越性よりも小さいことがわかった。
論文参考訳（メタデータ） (2025-09-07T01:54:20Z)
Iterative Misclassification Error Training (IMET): An Optimized Neural Network Training Technique for Image Classification [0.5115559623386964]
カリキュラム学習とコアセット選択に触発された新しいフレームワークであるIMET(Iterative Misclassification Error Training)を紹介する。 IMETは、トレーニングプロセスの合理化を図りつつ、エッジケースに対するモデルの注意を先入観的かつ稀な結果に優先順位付けしながら、誤分類されたサンプルを特定することを目的としている。本稿では,最新のResNetアーキテクチャに対するベンチマーク医用画像分類データセット上でのIMETの性能を評価する。
論文参考訳（メタデータ） (2025-07-01T04:14:16Z)
Efficient Medical VIE via Reinforcement Learning [10.713109515157475]
ビジュアル情報抽出(VIE)は、構造化されていない文書イメージを、レポート分析やオンラインコンサルティングといった医療応用に不可欠な構造化フォーマットのような構造化フォーマットに変換する。従来の手法はOCRと言語モデルに依存し、エンドツーエンドのマルチモーダルモデルは直接生成を提供する。我々は、100の注釈付きサンプルを使用してこれらの課題に対処するために、Reinforcement Learning with Verifiable Rewards(RLVR)フレームワークをベースとしています。
論文参考訳（メタデータ） (2025-06-16T11:10:25Z)
Multimodal Prescriptive Deep Learning [5.22980614912553]
マルチモーダルなディープラーニングフレームワークPrescriptive Neural Networks(PNN)を紹介する。 PNNは、埋め込みに基づいてトレーニングされたフィードフォワードニューラルネットワークで、結果最適化処方薬を出力する。 2つの実世界のマルチモーダルデータセットにおいて、PNNが推定結果を大幅に改善できる治療を処方することを実証する。
論文参考訳（メタデータ） (2025-01-24T00:37:28Z)
Re-Visible Dual-Domain Self-Supervised Deep Unfolding Network for MRI Reconstruction [48.30341580103962]
本稿では、これらの問題に対処するために、新しい再視覚的二重ドメイン自己教師型深層展開ネットワークを提案する。エンド・ツー・エンドの再構築を実現するために,シャンブルとポック・プロキシ・ポイント・アルゴリズム(DUN-CP-PPA)に基づく深層展開ネットワークを設計する。高速MRIおよびIXIデータセットを用いて行った実験により,本手法は再建性能において最先端の手法よりも有意に優れていることが示された。
論文参考訳（メタデータ） (2025-01-07T12:29:32Z)
LoRKD: Low-Rank Knowledge Decomposition for Medical Foundation Models [59.961172635689664]
知識分解」は、特定の医療課題のパフォーマンス向上を目的としている。我々はLow-Rank Knowledge Decomposition(LoRKD)という新しいフレームワークを提案する。 LoRKDは、低ランクのエキスパートモジュールと効率的な知識分離畳み込みを組み込むことで、グラデーションを異なるタスクから明確に分離する。
論文参考訳（メタデータ） (2024-09-29T03:56:21Z)
MedMNIST-C: Comprehensive benchmark and improved classifier robustness by simulating realistic image corruptions [0.13108652488669734]
神経ネットワークに基づくシステムの臨床実践への統合は、ドメインの一般化と堅牢性に関連する課題によって制限される。我々は、12のデータセットと9つの画像モダリティをカバーするMedMNIST+コレクションに基づくベンチマークデータセットであるMedMNIST-Cを作成し、オープンソース化した。
論文参考訳（メタデータ） (2024-06-25T13:20:39Z)
Benchmarking Retinal Blood Vessel Segmentation Models for Cross-Dataset and Cross-Disease Generalization [5.237321836999284]
公開されているFIVESファウンダスイメージデータセット上で,5つの公開モデルをトレーニングし,評価する。画像の品質がセグメンテーションの結果を決定する重要な要因であることがわかった。
論文参考訳（メタデータ） (2024-06-21T09:12:34Z)
Implantable Adaptive Cells: A Novel Enhancement for Pre-Trained U-Nets in Medical Image Segmentation [0.0]
本稿では,医用画像分割におけるトレーニング済みニューラルネットワークの性能向上のための新しいアプローチを提案する。本稿では, 部分連結DARTSをベースとした小型モジュールであるIAC(Indegable Adaptive Cell)のコンセプトを提案する。 MRIとCT画像を用いた4つの医学データセットの実験では、様々なU-Net構成に対して一貫した精度の向上が示されている。
論文参考訳（メタデータ） (2024-05-06T12:40:15Z)
Adaptive Affinity-Based Generalization For MRI Imaging Segmentation Across Resource-Limited Settings [1.5703963908242198]
本稿では,適応親和性に基づく蒸留とカーネルベースの蒸留をシームレスに組み合わせた,新しい関係に基づく知識フレームワークを提案する。革新的アプローチを検証するために,我々は公開されている複数ソースのMRIデータについて実験を行った。
論文参考訳（メタデータ） (2024-04-03T13:35:51Z)
Meta Transfer of Self-Supervised Knowledge: Foundation Model in Action for Post-Traumatic Epilepsy Prediction [0.6291443816903801]
基礎モデルに新たなトレーニング戦略を導入する。提案手法は,小規模臨床データセットのタスク性能を著しく向上することを示す。さらに, 基礎モデルの一般化性の向上を実証した。
論文参考訳（メタデータ） (2023-12-21T07:42:49Z)
On the Out of Distribution Robustness of Foundation Models in Medical Image Segmentation [47.95611203419802]
視覚と言語の基礎は、様々な自然画像とテキストデータに基づいて事前訓練されており、有望なアプローチとして現れている。一般化性能を,同じ分布データセット上で微調整した後,事前学習した各種モデルの未確認領域と比較した。さらに,凍結モデルに対する新しいベイズ不確実性推定法を開発し,分布外データに基づくモデルの性能評価指標として利用した。
論文参考訳（メタデータ） (2023-11-18T14:52:10Z)
Learnable Weight Initialization for Volumetric Medical Image Segmentation [66.3030435676252]
本稿では,学習可能な重みに基づくハイブリッド医療画像セグメンテーション手法を提案する。我々のアプローチはどんなハイブリッドモデルにも簡単に統合でき、外部のトレーニングデータを必要としない。多臓器・肺がんセグメンテーションタスクの実験は、我々のアプローチの有効性を実証している。
論文参考訳（メタデータ） (2023-06-15T17:55:05Z)
Vision-Language Modelling For Radiological Imaging and Reports In The Low Data Regime [70.04389979779195]
本稿では,視覚および言語入力を共通空間に埋め込んだ医用視覚言語モデル(VLM)について検討する。本稿では,新しい画像領域やテキスト領域への汎用事前学習モデルの適用など,低データ性能向上のためのいくつかの候補手法について検討する。テキスト・ツー・イメージ検索をベンチマークとして,2つの胸部X線および放射線学的報告を用いた可変サイズのトレーニングデータセットを用いて,これらの手法の性能評価を行った。
論文参考訳（メタデータ） (2023-03-30T18:20:00Z)
Learning Large-scale Neural Fields via Context Pruned Meta-Learning [60.93679437452872]
本稿では,大規模ニューラルネットワーク学習のための最適化に基づくメタラーニング手法を提案する。メタテスト時間における勾配再スケーリングは、非常に高品質なニューラルネットワークの学習を可能にすることを示す。我々のフレームワークは、モデルに依存しない、直感的で、実装が容易であり、幅広い信号に対する大幅な再構成改善を示す。
論文参考訳（メタデータ） (2023-02-01T17:32:16Z)
HyperImpute: Generalized Iterative Imputation with Automatic Model Selection [77.86861638371926]
カラムワイズモデルを適応的かつ自動的に構成するための一般化反復計算フレームワークを提案する。既製の学習者,シミュレータ,インターフェースを備えた具体的な実装を提供する。
論文参考訳（メタデータ） (2022-06-15T19:10:35Z)
About Explicit Variance Minimization: Training Neural Networks for Medical Imaging With Limited Data Annotations [2.3204178451683264]
VAT(Variance Aware Training)法は、モデル損失関数に分散誤差を導入することにより、この特性を利用する。多様な領域から得られた3つの医用画像データセットと様々な学習目標に対するVATの有効性を検証した。
論文参考訳（メタデータ） (2021-05-28T21:34:04Z)
Robustly Pre-trained Neural Model for Direct Temporal Relation Extraction [10.832917897850361]
BERT (Bidirectional Representation using Transformer) のいくつかの変種について検討した。 2012 i2b2 時間関係課題データセットのセマンティックな部分集合である直接時間関係データセットを用いて,これらの手法の評価を行った。結果: 10倍のコーパスを含む事前学習戦略を取り入れたRoBERTaは,F値の絶対スコア(1.00スケール)を0.0864改善し,SVMモデルで達成した従来の最先端性能と比較して誤差率を24%低減した。
論文参考訳（メタデータ） (2020-04-13T22:01:38Z)
Diversity inducing Information Bottleneck in Model Ensembles [73.80615604822435]
本稿では,予測の多様性を奨励することで,ニューラルネットワークの効果的なアンサンブルを生成する問題をターゲットにする。そこで本研究では,潜伏変数の学習における逆損失の多様性を明示的に最適化し,マルチモーダルデータのモデリングに必要な出力予測の多様性を得る。最も競争力のあるベースラインと比較して、データ分布の変化の下で、分類精度が大幅に向上した。
論文参考訳（メタデータ） (2020-03-10T03:10:41Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。