論文の概要: Flemme: A Flexible and Modular Learning Platform for Medical Images
- arxiv url: http://arxiv.org/abs/2408.09369v1
- Date: Sun, 18 Aug 2024 05:47:33 GMT
- ステータス: 処理完了
- システム内更新日: 2024-08-20 20:59:59.084844
- Title: Flemme: A Flexible and Modular Learning Platform for Medical Images
- Title(参考訳): Flemme:医療画像のためのフレキシブルでモジュラーな学習プラットフォーム
- Authors: Guoqing Zhang, Jingyun Yang, Yang Li,
- Abstract要約: Flemmeは、MedicalイメージのためのFLExible and Modular Learningプラットフォームである。
コンボリューション,トランスフォーマー,状態空間モデル(SSM)に基づくビルディングブロックを用いてエンコーダを構築し,2次元画像パッチと3次元画像パッチの両処理を行う。
- 参考スコア(独自算出の注目度): 5.086862917025204
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: As the rapid development of computer vision and the emergence of powerful network backbones and architectures, the application of deep learning in medical imaging has become increasingly significant. Unlike natural images, medical images lack huge volumes of data but feature more modalities, making it difficult to train a general model that has satisfactory performance across various datasets. In practice, practitioners often suffer from manually creating and testing models combining independent backbones and architectures, which is a laborious and time-consuming process. We propose Flemme, a FLExible and Modular learning platform for MEdical images. Our platform separates encoders from the model architectures so that different models can be constructed via various combinations of supported encoders and architectures. We construct encoders using building blocks based on convolution, transformer, and state-space model (SSM) to process both 2D and 3D image patches. A base architecture is implemented following an encoder-decoder style, with several derived architectures for image segmentation, reconstruction, and generation tasks. In addition, we propose a general hierarchical architecture incorporating a pyramid loss to optimize and fuse vertical features. Experiments demonstrate that this simple design leads to an average improvement of 5.60% in Dice score and 7.81% in mean interaction of units (mIoU) for segmentation models, as well as an enhancement of 5.57% in peak signal-to-noise ratio (PSNR) and 8.22% in structural similarity (SSIM) for reconstruction models. We further utilize Flemme as an analytical tool to assess the effectiveness and efficiency of various encoders across different tasks. Code is available at https://github.com/wlsdzyzl/flemme.
- Abstract(参考訳): コンピュータビジョンの急速な発展と強力なネットワークバックボーンやアーキテクチャの出現に伴い、深層学習の医療画像への応用はますます重要になっている。
自然画像とは異なり、医用画像には大量のデータがないが、よりモダリティが特徴であり、様々なデータセットで十分なパフォーマンスを持つ一般的なモデルを訓練することは困難である。
実際には、実践者は独立したバックボーンとアーキテクチャを組み合わせたモデルの作成とテストに苦しむことが多い。
本稿では,メディア画像のためのFLExible and Modular LearningプラットフォームであるFlemmeを提案する。
我々のプラットフォームは、サポートするエンコーダとアーキテクチャの様々な組み合わせを通じて、異なるモデルを構築できるように、エンコーダをモデルアーキテクチャから分離する。
コンボリューション,トランスフォーマー,状態空間モデル(SSM)に基づくビルディングブロックを用いてエンコーダを構築し,2次元画像パッチと3次元画像パッチの両処理を行う。
ベースアーキテクチャはエンコーダ-デコーダスタイルに従って実装され、画像分割、再構成、生成タスクのための派生アーキテクチャがいくつかある。
さらに,ピラミッド損失を取り入れた一般的な階層型アーキテクチャを提案し,垂直特性の最適化と融合を行う。
実験の結果、この単純な設計はディススコアの5.60%、セグメンテーションモデルのユニットの平均相互作用(mIoU)が7.81%向上し、再建モデルのピーク信号-雑音比(PSNR)が5.57%、構造類似度(SSIM)が8.22%向上した。
さらにFlemmeを解析ツールとして利用し、様々なタスクにおける様々なエンコーダの有効性と効率を評価する。
コードはhttps://github.com/wlsdzyzl/flemme.comで入手できる。
関連論文リスト
- Computer Vision Model Compression Techniques for Embedded Systems: A Survey [75.38606213726906]
本稿では,コンピュータビジョンタスクに適用される主モデル圧縮技術について述べる。
本稿では,圧縮サブ領域の特性について述べるとともに,異なるアプローチを比較し,最適な手法を選択する方法について論じる。
初期の実装課題を克服する上で、研究者や新しい実践者を支援するためのコードも共有しています。
論文 参考訳(メタデータ) (2024-08-15T16:41:55Z) - Parameter-Inverted Image Pyramid Networks [49.35689698870247]
Inverted Image Pyramid Networks (PIIP) と呼ばれる新しいネットワークアーキテクチャを提案する。
私たちの中核となる考え方は、パラメータサイズの異なるモデルを使用して、画像ピラミッドの解像度の異なるレベルを処理することです。
PIIPは、オブジェクト検出、セグメンテーション、画像分類などのタスクにおいて優れたパフォーマンスを達成する。
論文 参考訳(メタデータ) (2024-06-06T17:59:10Z) - UNetFormer: A Unified Vision Transformer Model and Pre-Training
Framework for 3D Medical Image Segmentation [14.873473285148853]
UNetFormerと呼ばれる2つのアーキテクチャで構成され,3D Swin TransformerベースのエンコーダとConal Neural Network(CNN)とTransformerベースのデコーダを備えている。
提案モデルでは, 5つの異なる解像度でのスキップ接続により, エンコーダをデコーダにリンクする。
本稿では,ランダムにマスクされたトークンを予測する学習を通じて,エンコーダバックボーンの自己教師付き事前学習手法を提案する。
論文 参考訳(メタデータ) (2022-04-01T17:38:39Z) - A unified software/hardware scalable architecture for brain-inspired
computing based on self-organizing neural models [6.072718806755325]
我々は、Reentrant SOM(ReSOM)モデルにおいて、自己組織化マップ(SOM)とHebbian学習を関連付ける脳誘発ニューラルモデルを開発した。
この研究は、FPGAベースの専用プラットフォーム上でのシミュレーション結果とハードウェア実行の両方を通じて、モデルの分散性とスケーラブル性を実証する。
論文 参考訳(メタデータ) (2022-01-06T22:02:19Z) - Medical Transformer: Gated Axial-Attention for Medical Image
Segmentation [73.98974074534497]
医用画像分割タスクにおけるトランスフォーマティブネットワークアーキテクチャの利用可能性について検討する。
セルフアテンションモジュールに追加の制御機構を導入することで,既存のアーキテクチャを拡張するGated Axial-Attentionモデルを提案する。
医療画像上で効果的にモデルを訓練するために,さらにパフォーマンスを向上させる局所的グローバルトレーニング戦略 (logo) を提案する。
論文 参考訳(メタデータ) (2021-02-21T18:35:14Z) - Multi-Stage Progressive Image Restoration [167.6852235432918]
本稿では、これらの競合する目標を最適にバランスできる新しい相乗的設計を提案する。
本提案では, 劣化した入力の復元関数を段階的に学習する多段階アーキテクチャを提案する。
MPRNetという名前の密接な相互接続型マルチステージアーキテクチャは、10のデータセットに対して強力なパフォーマンス向上を実現している。
論文 参考訳(メタデータ) (2021-02-04T18:57:07Z) - Fed-Sim: Federated Simulation for Medical Imaging [131.56325440976207]
本稿では、2つの学習可能なニューラルモジュールからなる物理駆動型生成手法を提案する。
データ合成フレームワークは、複数のデータセットの下流セグメンテーション性能を改善する。
論文 参考訳(メタデータ) (2020-09-01T19:17:46Z) - Parkinson's Disease Detection with Ensemble Architectures based on
ILSVRC Models [1.8884278918443564]
磁気共鳴(MR)T1画像を用いたパーキンソン病の同定のためのニューラルネットワークアーキテクチャの検討
提案手法はすべてMR画像からPDを検出する既存の手法より優れており、最大95%の精度で検出できる。
我々の発見は、トレーニングデータがない、あるいは不十分な場合には、有望な方向を示唆している。
論文 参考訳(メタデータ) (2020-07-23T05:40:47Z) - Learning Deformable Image Registration from Optimization: Perspective,
Modules, Bilevel Training and Beyond [62.730497582218284]
マルチスケールの伝搬により微分同相モデルを最適化する,新しいディープラーニングベースのフレームワークを開発した。
我々は,脳MRIデータにおける画像-アトラス登録,肝CTデータにおける画像-画像登録を含む,3次元ボリュームデータセットにおける画像登録実験の2つのグループを実行する。
論文 参考訳(メタデータ) (2020-04-30T03:23:45Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。