論文の概要: Google-MedGemma Based Abnormality Detection in Musculoskeletal radiographs
- arxiv url: http://arxiv.org/abs/2511.05600v1
- Date: Thu, 06 Nov 2025 00:51:42 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-11-11 21:18:44.486479
- Title: Google-MedGemma Based Abnormality Detection in Musculoskeletal radiographs
- Title(参考訳): 筋骨格X線写真におけるGoogle-MedGemmaによる異常検出
- Authors: Soumyajit Maity, Pranjal Kamboj, Sneha Maity, Rajat Singh, Sankhadeep Chatterjee,
- Abstract要約: 本稿では,筋骨格X線写真における自動異常検出のためのMedGemmaベースのフレームワークを提案する。
前処理したX線画像をMedGemmaビジョンバックボーンを用いて高次元埋め込みに符号化する。
- 参考スコア(独自算出の注目度): 1.1254693939127909
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: This paper proposes a MedGemma-based framework for automatic abnormality detection in musculoskeletal radiographs. Departing from conventional autoencoder and neural network pipelines, the proposed method leverages the MedGemma foundation model, incorporating a SigLIP-derived vision encoder pretrained on diverse medical imaging modalities. Preprocessed X-ray images are encoded into high-dimensional embeddings using the MedGemma vision backbone, which are subsequently passed through a lightweight multilayer perceptron for binary classification. Experimental assessment reveals that the MedGemma-driven classifier exhibits strong performance, exceeding conventional convolutional and autoencoder-based metrics. Additionally, the model leverages MedGemma's transfer learning capabilities, enhancing generalization and optimizing feature engineering. The integration of a modern medical foundation model not only enhances representation learning but also facilitates modular training strategies such as selective encoder block unfreezing for efficient domain adaptation. The findings suggest that MedGemma-powered classification systems can advance clinical radiograph triage by providing scalable and accurate abnormality detection, with potential for broader applications in automated medical image analysis. Keywords: Google MedGemma, MURA, Medical Image, Classification.
- Abstract(参考訳): 本稿では,筋骨格X線写真における自動異常検出のためのMedGemmaベースのフレームワークを提案する。
提案手法は、従来のオートエンコーダとニューラルネットワークパイプラインとは別に、様々な医用画像モダリティに基づいて事前訓練されたSigLIP由来の視覚エンコーダを組み込んで、MedGemma基盤モデルを活用する。
プリプロセスされたX線画像は、MedGemmaビジョンバックボーンを用いて高次元埋め込みに符号化され、その後、バイナリ分類のための軽量多層パーセプトロンに渡される。
実験により、MedGemma駆動の分類器は従来の畳み込みとオートエンコーダに基づくメトリクスよりも高い性能を示すことが明らかとなった。
さらに、このモデルは、MedGemmaの転送学習機能を活用し、一般化を強化し、機能エンジニアリングを最適化する。
現代医療基盤モデルの統合は、表現学習を強化するだけでなく、効率的なドメイン適応のために選択エンコーダブロックアンフリーズのようなモジュラートレーニング戦略を促進する。
その結果,MedGemmaを用いた分類システムは,スケーラブルで正確な異常検出を提供することで,臨床用X線写真トリアージを推し進めることができることが示唆された。
キーワード: Google MedGemma, mura, Medical Image, Classification。
関連論文リスト
- Post-Processing Methods for Improving Accuracy in MRI Inpainting [4.574257127551285]
塗布技術は、腫瘍領域の正常な脳組織を局所的に合成することを目的としている。
本研究では,最先端のインパインティングモデルを評価し,スタンドアローン性能の飽和を観察する。
本稿では,中央値フィルタリング,ヒストグラムマッチング,ピクセル平均化といった効率的な後処理戦略とモデルアンサンブルを組み合わせる手法を提案する。
論文 参考訳(メタデータ) (2025-10-17T03:42:23Z) - Few-Shot Deployment of Pretrained MRI Transformers in Brain Imaging Tasks [2.982793366290863]
種々の脳画像タスクにおいて,事前訓練したMRIトランスフォーマーを数発配置するためのフレームワークを提案する。
Masked Autoencoder (MAE) 事前学習戦略を利用することで,タスクやデータセット間でよく一般化された,高度に伝達可能な潜在表現が得られる。
論文 参考訳(メタデータ) (2025-08-07T18:53:28Z) - MedGemma Technical Report [75.88152277443179]
MedGemmaは、Gemma 3 4Bと27Bをベースとした医療ビジョン言語基盤モデルの集合体である。
MedGemmaは、画像とテキストの高度な医学的理解と推論を実証する。
また、SigLIPから派生した医用目視エンコーダであるMedSigLIPを紹介する。
論文 参考訳(メタデータ) (2025-07-07T17:01:44Z) - MIAFEx: An Attention-based Feature Extraction Method for Medical Image Classification [5.184076521834149]
医療用イメージアテンションベース機能エクストラクタ (MIAFEx) を提案する。
Transformerエンコーダアーキテクチャ内の分類トークンを強化するために、学習可能な改良機構を採用している。
MIAFExの出力特性は従来の分類器とハイブリッド分類器を用いて古典的特徴抽出器と比較される。
論文 参考訳(メタデータ) (2025-01-15T04:07:06Z) - Applying Conditional Generative Adversarial Networks for Imaging Diagnosis [3.881664394416534]
本研究は、スタックド・ホアーグラス・ネットワーク(SHGN)と統合されたコンディショナル・ジェネレーション・アドバイザリアル・ネットワーク(C-GAN)の革新的な応用を紹介する。
我々は、複雑な画像データセットに適用されるディープラーニングモデルに共通するオーバーフィッティングの問題に、回転とスケーリングを通じてデータを増大させることで対処する。
血管内超音波(IVUS)画像において,L1とL2再構成損失を併用したハイブリッド損失関数を導入する。
論文 参考訳(メタデータ) (2024-07-17T23:23:09Z) - Adapting Visual-Language Models for Generalizable Anomaly Detection in Medical Images [68.42215385041114]
本稿では,CLIPモデルを用いた医用異常検出のための軽量な多レベル適応と比較フレームワークを提案する。
提案手法では,複数の残像アダプタを事前学習した視覚エンコーダに統合し,視覚的特徴の段階的向上を実現する。
医学的異常検出ベンチマーク実験により,本手法が現在の最先端モデルを大幅に上回っていることが示された。
論文 参考訳(メタデータ) (2024-03-19T09:28:19Z) - LVM-Med: Learning Large-Scale Self-Supervised Vision Models for Medical
Imaging via Second-order Graph Matching [59.01894976615714]
LVM-Medは、大規模医療データセットに基づいてトレーニングされた、最初のディープネットワークファミリーである。
55の公開データセットから約13万の医療画像を収集しました。
LVM-Medは、多くの最先端の教師付き、自己監督型、基礎モデルよりも経験的に優れている。
論文 参考訳(メタデータ) (2023-06-20T22:21:34Z) - Preservation of High Frequency Content for Deep Learning-Based Medical
Image Classification [74.84221280249876]
大量の胸部ラジオグラフィーの効率的な分析は、医師や放射線技師を助けることができる。
本稿では,視覚情報の効率的な識別と符号化のための離散ウェーブレット変換(DWT)を提案する。
論文 参考訳(メタデータ) (2022-05-08T15:29:54Z) - SAG-GAN: Semi-Supervised Attention-Guided GANs for Data Augmentation on
Medical Images [47.35184075381965]
本稿では,GAN(Cycle-Consistency Generative Adversarial Networks)を用いた医用画像生成のためのデータ拡張手法を提案する。
提案モデルでは,正常画像から腫瘍画像を生成することができ,腫瘍画像から正常画像を生成することもできる。
本研究では,従来のデータ拡張手法と合成画像を用いた分類モデルを用いて,実画像を用いた分類モデルを訓練する。
論文 参考訳(メタデータ) (2020-11-15T14:01:24Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。