論文の概要: Complex Mixer for MedMNIST Classification Decathlon
- arxiv url: http://arxiv.org/abs/2304.10054v1
- Date: Thu, 20 Apr 2023 02:34:36 GMT
- ステータス: 処理完了
- システム内更新日: 2023-04-21 14:38:59.573546
- Title: Complex Mixer for MedMNIST Classification Decathlon
- Title(参考訳): MedMNIST分類用複合ミキサー
- Authors: Zhuoran Zheng and Xiuyi Jia
- Abstract要約: ラベル空間における情報不足と不確実性の問題を軽減するための事前学習フレームワークを備えた複合ミキサー(C-Mixer)を開発した。
提案手法は,標準的なMedMNIST(v2)データセットと,カスタマイズされた弱教師付きデータセットの両方に驚くべき可能性を示す。
- 参考スコア(独自算出の注目度): 12.402054374952485
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: With the development of the medical image field, researchers seek to develop
a class of datasets to block the need for medical knowledge, such as
\text{MedMNIST} (v2). MedMNIST (v2) includes a large number of small-sized (28
$\times$ 28 or 28 $\times$ 28 $\times$ 28) medical samples and the
corresponding expert annotations (class label). The existing baseline model
(Google AutoML Vision, ResNet-50+3D) can reach an average accuracy of over 70\%
on MedMNIST (v2) datasets, which is comparable to the performance of expert
decision-making. Nevertheless, we note that there are two insurmountable
obstacles to modeling on MedMNIST (v2): 1) the raw images are cropped to low
scales may cause effective recognition information to be dropped and the
classifier to have difficulty in tracing accurate decision boundaries; 2) the
labelers' subjective insight may cause many uncertainties in the label space.
To address these issues, we develop a Complex Mixer (C-Mixer) with a
pre-training framework to alleviate the problem of insufficient information and
uncertainty in the label space by introducing an incentive imaginary matrix and
a self-supervised scheme with random masking. Our method (incentive learning
and self-supervised learning with masking) shows surprising potential on both
the standard MedMNIST (v2) dataset, the customized weakly supervised datasets,
and other image enhancement tasks.
- Abstract(参考訳): 医学画像分野の発展に伴い、研究者は医学的知識の必要性をブロックするデータセットのクラス、例えば \text{medmnist} (v2) を開発しようとしている。
medmnist (v2) には、多数の小規模 (28 $\times$ 28 または 28 $\times$ 28 $\times$ 28) の医療サンプルと対応する専門家アノテーション (class label) が含まれている。
既存のベースラインモデル(Google AutoML Vision、ResNet-50+3D)は、専門家による意思決定のパフォーマンスに匹敵する、MedMNIST(v2)データセット上で平均70%以上の精度に達することができる。
それでも、MedMNIST (v2) のモデリングには2つの不可能な障害がある。
1) 原画像は,低スケールに収穫され,有効な認識情報が落とされ,分類器は,正確な決定境界の追跡が困難となる。
2) ラベル者の主観的洞察は,ラベル空間に多くの不確実性を引き起こす可能性がある。
これらの問題に対処するため,事前学習フレームワークを備えた複合ミキサー (C-Mixer) を開発し,ランダムマスキングを用いたインセンティブ仮想行列と自己教師型スキームを導入することにより,ラベル空間における情報不足と不確実性の問題を軽減する。
本手法は,標準的なMedMNIST(v2)データセット,カスタマイズされた弱教師付きデータセット,その他の画像強調タスクにおいて,驚くべき可能性を示す。
関連論文リスト
- SMILE-UHURA Challenge -- Small Vessel Segmentation at Mesoscopic Scale from Ultra-High Resolution 7T Magnetic Resonance Angiograms [60.35639972035727]
公開されている注釈付きデータセットの欠如は、堅牢で機械学習駆動のセグメンテーションアルゴリズムの開発を妨げている。
SMILE-UHURAチャレンジは、7T MRIで取得したTime-of-Flightアンジオグラフィーの注釈付きデータセットを提供することで、公開されている注釈付きデータセットのギャップに対処する。
Diceスコアは、それぞれのデータセットで0.838 $pm$0.066と0.716 $pm$ 0.125まで到達し、平均パフォーマンスは0.804 $pm$ 0.15までになった。
論文 参考訳(メタデータ) (2024-11-14T17:06:00Z) - FEDMEKI: A Benchmark for Scaling Medical Foundation Models via Federated Knowledge Injection [83.54960238236548]
FEDMEKIはデータのプライバシーを守るだけでなく、医療基盤モデルの能力を高める。
FEDMEKIは、医療ファンデーションモデルに対して、直接データを公開することなく、幅広い医療知識から学ぶことを可能にする。
論文 参考訳(メタデータ) (2024-08-17T15:18:56Z) - Fair Text to Medical Image Diffusion Model with Subgroup Distribution Aligned Tuning [12.064840522920251]
医用画像へのテキスト・トゥ・メディカル・イメージ (T2MedI) の潜伏拡散モデルは, 医用画像データの不足を緩和する大きな可能性を秘めている。
しかし、自然画像モデルへのテキストとして、T2MedIモデルは一部のサブグループにも偏りがあり、トレーニングセットの少数派を見渡すことができる。
そこで本研究では,まず,CLIPテキストエンコーダを固定した,事前学習型 Imagen モデルに基づく T2MedI モデルを構築した。
そのデコーダは、C.のRadiology Objectsの医療画像に微調整されている。
論文 参考訳(メタデータ) (2024-06-21T03:23:37Z) - Robust and Interpretable Medical Image Classifiers via Concept
Bottleneck Models [49.95603725998561]
本稿では,自然言語の概念を用いた堅牢で解釈可能な医用画像分類器を構築するための新しいパラダイムを提案する。
具体的には、まず臨床概念をGPT-4から検索し、次に視覚言語モデルを用いて潜在画像の特徴を明示的な概念に変換する。
論文 参考訳(メタデータ) (2023-10-04T21:57:09Z) - Semi-Supervised Medical Image Segmentation with Co-Distribution
Alignment [16.038016822861092]
本稿では,半教師型医用画像分割のためのCo-Distribution Alignment(Co-DA)を提案する。
Co-DAはラベル付きデータの辺縁予測とラベル付きデータの辺縁予測をクラスワイズで調整する。
提案手法は既存の半教師付き医用画像分割法よりも優れていることを示す。
論文 参考訳(メタデータ) (2023-07-24T09:08:30Z) - LVM-Med: Learning Large-Scale Self-Supervised Vision Models for Medical
Imaging via Second-order Graph Matching [59.01894976615714]
LVM-Medは、大規模医療データセットに基づいてトレーニングされた、最初のディープネットワークファミリーである。
55の公開データセットから約13万の医療画像を収集しました。
LVM-Medは、多くの最先端の教師付き、自己監督型、基礎モデルよりも経験的に優れている。
論文 参考訳(メタデータ) (2023-06-20T22:21:34Z) - Multi-Level Global Context Cross Consistency Model for Semi-Supervised
Ultrasound Image Segmentation with Diffusion Model [0.0]
本研究では,Latent Diffusion Model (LDM) によって生成された画像を,半教師付き学習のためのラベル付き画像として利用するフレームワークを提案する。
提案手法により,確率分布の知識をセグメント化ネットワークに効果的に伝達することが可能となり,セグメント化精度が向上する。
論文 参考訳(メタデータ) (2023-05-16T14:08:24Z) - Self-Supervised Learning as a Means To Reduce the Need for Labeled Data
in Medical Image Analysis [64.4093648042484]
胸部X線画像のデータセットとバウンディングボックスラベルを用いて,13種類の異常の分類を行った。
ラベル付きデータの平均精度と精度を60%に抑えることで,完全教師付きモデルと同等の性能が得られることを示す。
論文 参考訳(メタデータ) (2022-06-01T09:20:30Z) - DeepMCAT: Large-Scale Deep Clustering for Medical Image Categorization [24.100651548850895]
本稿では,大規模医用画像データセットの自動クラスタリングと分類のための教師なしアプローチを提案する。
本研究では,クラスバランスと非バランスな大規模データセットを用いたエンドツーエンドトレーニングについて検討した。
論文 参考訳(メタデータ) (2021-09-30T22:39:57Z) - G-MIND: An End-to-End Multimodal Imaging-Genetics Framework for
Biomarker Identification and Disease Classification [49.53651166356737]
診断によって誘導される画像データと遺伝データを統合し、解釈可能なバイオマーカーを提供する新しいディープニューラルネットワークアーキテクチャを提案する。
2つの機能的MRI(fMRI)パラダイムとSingle Nucleotide Polymorphism (SNP)データを含む統合失調症の集団研究で本モデルを評価した。
論文 参考訳(メタデータ) (2021-01-27T19:28:04Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。