論文の概要: PhyDCM: A Reproducible Open-Source Framework for AI-Assisted Brain Tumor Classification from Multi-Sequence MRI
- arxiv url: http://arxiv.org/abs/2603.26794v1
- Date: Wed, 25 Mar 2026 20:58:22 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-03-31 23:18:44.61785
- Title: PhyDCM: A Reproducible Open-Source Framework for AI-Assisted Brain Tumor Classification from Multi-Sequence MRI
- Title(参考訳): PhyDCM:マルチシーケンスMRIによるAI支援脳腫瘍分類のための再現可能なオープンソースフレームワーク
- Authors: Hayder Saad Abdulbaqi, Mohammed Hadi Rahim, Mohammed Hassan Hadi, Haider Ali Aboud, Ali Hussein Allawi,
- Abstract要約: MRIベースの医用画像は現代の臨床診断に欠かせないものとなっている。
データボリュームの急激な増加は、従来の診断手法に課題をもたらす。
PhyDCMは、MedViTをベースにしたハイブリッド分類アーキテクチャを統合する、オープンソースのソフトウェアフレームワークとして紹介されている。
システムはグラフィカルインタフェースから計算ロジックを分離するモジュラーデジタルライブラリとして設計されている。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: MRI-based medical imaging has become indispensable in modern clinical diagnosis, particularly for brain tumor detection. However, the rapid growth in data volume poses challenges for conventional diagnostic approaches. Although deep learning has shown strong performance in automated classification, many existing solutions are confined to closed technical architectures, limiting reproducibility and further academic development. PhyDCM is introduced as an open-source software framework that integrates a hybrid classification architecture based on MedViT with standardized DICOM processing and an interactive desktop visualization interface. The system is designed as a modular digital library that separates computational logic from the graphical interface, allowing independent modification and extension of components. Standardized preprocessing, including intensity rescaling and limited data augmentation, ensures consistency across varying MRI acquisition settings. Experimental evaluation on MRI datasets from BRISC2025 and curated Kaggle collections (FigShare, SARTAJ, and Br35H) demonstrates stable diagnostic performance, achieving over 93% classification accuracy across categories. The framework supports structured, exportable outputs and multi-planar reconstruction of volumetric data. By emphasizing transparency, modularity, and accessibility, PhyDCM provides a practical foundation for reproducible AI-driven medical image analysis, with flexibility for future integration of additional imaging modalities.
- Abstract(参考訳): MRIベースの医用画像は、現代の臨床診断、特に脳腫瘍の診断に欠かせないものとなっている。
しかし,データボリュームの急激な増加は,従来の診断手法の課題となっている。
ディープラーニングは、自動化された分類において強力な性能を示しているが、既存のソリューションの多くは、再現性やさらなる学術的発展を制限する、クローズドな技術アーキテクチャに限られている。
PhyDCMは、MedViTをベースとしたハイブリッド分類アーキテクチャと、標準化されたDICOM処理とインタラクティブなデスクトップ視覚化インターフェースを統合した、オープンソースのソフトウェアフレームワークとして紹介されている。
このシステムは、グラフィカルインタフェースから計算ロジックを分離するモジュール式デジタルライブラリとして設計されており、コンポーネントの独立した変更と拡張を可能にする。
強度再スケーリングやデータ拡張の制限を含む標準化された前処理は、さまざまなMRI取得設定間で一貫性を保証する。
BRISC2025およびキュレートされたKaggleコレクション(FigShare、SARTAJ、Br35H)からのMRIデータセットに対する実験的評価は、安定した診断性能を示し、カテゴリ毎に93%以上の分類精度を達成する。
このフレームワークは構造化され、エクスポート可能な出力をサポートし、ボリュームデータの多平面再構成をサポートする。
透明性、モジュラリティ、アクセシビリティを強調したPhyDCMは、再現可能なAI駆動型医療画像分析の実践的基盤を提供する。
関連論文リスト
- Enabling Ultra-Fast Cardiovascular Imaging Across Heterogeneous Clinical Environments with a Generalist Foundation Model and Multimodal Database [64.65360708629485]
MMCMR-427Kは、最大かつ最も包括的なマルチモーダル心血管共鳴k空間データベースである。
CardioMMは、異種高速CMRイメージングシナリオに適応可能な再構成基盤モデルである。
CardioMMは、物理インフォームドデータ一貫性と意味的文脈理解を統合して、堅牢な再構築を実現する。
論文 参考訳(メタデータ) (2025-12-25T12:47:50Z) - Transformers for Multimodal Brain State Decoding: Integrating Functional Magnetic Resonance Imaging Data and Medical Metadata [0.0]
本稿では,fMRIデータやDICOMメタデータを含むマルチモーダル入力とトランスフォーマーアーキテクチャを統合した新しいフレームワークを提案する。
注意機構を用いることで、複雑な空間的・時間的パターンと文脈的関係を捕捉し、モデルの精度、解釈可能性、堅牢性を向上する。
この枠組みの潜在的堅牢性は、臨床診断、認知神経科学、パーソナライズド医療の応用にまたがる。
論文 参考訳(メタデータ) (2025-12-09T10:35:23Z) - Intelligent Healthcare Imaging Platform: A VLM-Based Framework for Automated Medical Image Analysis and Clinical Report Generation [0.0]
本稿では,視覚言語モデル(VLM)を活用した医用画像解析のためのインテリジェントマルチモーダルフレームワークを提案する。
このフレームワークはGoogle Gemini 2.5 Flashを統合し、腫瘍を自動的に検出し、CT、MRI、X線、超音波などの複数の画像モダリティで臨床報告を生成する。
論文 参考訳(メタデータ) (2025-09-16T23:15:44Z) - MedVQA-TREE: A Multimodal Reasoning and Retrieval Framework for Sarcopenia Prediction [1.7775777785480917]
MedVQA-TREEは階層的な画像解釈モジュール、ゲート機能レベルの融合機構、新しいマルチホップ・マルチクエリ検索戦略を統合したフレームワークである。
ゲート融合機構は、視覚的特徴をテキストクエリと選択的に統合し、臨床知識は、PubMedにアクセスするUMLS誘導パイプラインとサルコピア固有の外部知識ベースを介して検索する。
診断精度は99%まで向上し、従来の最先端の手法を10%以上上回った。
論文 参考訳(メタデータ) (2025-08-26T13:31:01Z) - NeuroMoE: A Transformer-Based Mixture-of-Experts Framework for Multi-Modal Neurological Disorder Classification [3.5313393560458826]
Deep Learningは最近、診断を助けるために医療データから意味のあるパターンを抽出する強力なツールとして登場した。
神経疾患を分類するための新しいトランスフォーマーベースのMixture-of-Experts(MoE)フレームワークを提案する。
我々のフレームワークは82.47%の検証精度を達成し、ベースライン法を10%以上上回っている。
論文 参考訳(メタデータ) (2025-06-17T20:40:06Z) - RadFabric: Agentic AI System with Reasoning Capability for Radiology [61.25593938175618]
RadFabricは、総合的なCXR解釈のための視覚的およびテキスト分析を統合するマルチエージェント、マルチモーダル推論フレームワークである。
システムは、病理診断に特殊なCXRエージェント、正確な解剖学的構造に視覚所見をマッピングする解剖学的解釈エージェント、および視覚的、解剖学的、臨床データを透明かつ証拠に基づく診断に合成する大規模なマルチモーダル推論モデルを利用した推論エージェントを使用する。
論文 参考訳(メタデータ) (2025-06-17T03:10:33Z) - Interactive Gadolinium-Free MRI Synthesis: A Transformer with Localization Prompt Learning [6.716077690014641]
本研究では,非コントラストMR画像からCE-MRIを合成するトランスフォーマとローカライゼーション・プロンプツのフレームワークを提案する。
本アーキテクチャでは,マルチスケール機能を処理するために効率的なトランスフォーマーを使用する階層的バックボーン,空間的注意操作と相互注意機構を通じて相互補完情報を階層的に統合する多段階融合システム,という3つの重要なイノベーションを導入している。
このフレームワークは、放射線科医が推論中に診断プロンプトを入力し、人工知能と医療の専門知識を相乗化することによって、インタラクティブな臨床統合を可能にする。
論文 参考訳(メタデータ) (2025-03-03T07:44:28Z) - A Unified Model for Compressed Sensing MRI Across Undersampling Patterns [69.19631302047569]
様々な計測アンサンプパターンと画像解像度に頑健な統合MRI再構成モデルを提案する。
我々のモデルは、拡散法よりも600$times$高速な推論で、最先端CNN(End-to-End VarNet)の4dBでSSIMを11%改善し、PSNRを4dB改善する。
論文 参考訳(メタデータ) (2024-10-05T20:03:57Z) - MindFormer: Semantic Alignment of Multi-Subject fMRI for Brain Decoding [50.55024115943266]
本稿では,MindFormer を用いたマルチオブジェクト fMRI 信号のセマンティックアライメント手法を提案する。
このモデルは、fMRIから画像生成のための安定拡散モデルや、fMRIからテキスト生成のための大規模言語モデル(LLM)の条件付けに使用できるfMRI条件付き特徴ベクトルを生成するように設計されている。
実験の結果,MindFormerは意味的に一貫した画像とテキストを異なる主題にわたって生成することがわかった。
論文 参考訳(メタデータ) (2024-05-28T00:36:25Z) - fMRI-PTE: A Large-scale fMRI Pretrained Transformer Encoder for
Multi-Subject Brain Activity Decoding [54.17776744076334]
本稿では,fMRI事前学習のための革新的オートエンコーダであるfMRI-PTEを提案する。
我々のアプローチでは、fMRI信号を統合された2次元表現に変換し、次元の整合性を確保し、脳の活動パターンを保存する。
コントリビューションには、fMRI-PTEの導入、革新的なデータ変換、効率的なトレーニング、新しい学習戦略、そして我々のアプローチの普遍的な適用性が含まれる。
論文 参考訳(メタデータ) (2023-11-01T07:24:22Z) - Cross-Modality Deep Feature Learning for Brain Tumor Segmentation [158.8192041981564]
本稿では, マルチモーダルMRIデータから脳腫瘍を抽出するクロスモーダルディープ・フィーチャーラーニング・フレームワークを提案する。
中心となる考え方は、不十分なデータスケールを補うために、マルチモダリティデータにまたがる豊富なパターンをマイニングすることだ。
on the BraTS benchmarks, this proposed cross-modality deep feature learning framework could effective improve the brain tumor segmentation performance。
論文 参考訳(メタデータ) (2022-01-07T07:46:01Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。