論文の概要: Med-DANet V2: A Flexible Dynamic Architecture for Efficient Medical
Volumetric Segmentation
- arxiv url: http://arxiv.org/abs/2310.18656v1
- Date: Sat, 28 Oct 2023 09:57:28 GMT
- ステータス: 処理完了
- システム内更新日: 2023-10-31 17:20:30.558668
- Title: Med-DANet V2: A Flexible Dynamic Architecture for Efficient Medical
Volumetric Segmentation
- Title(参考訳): Med-DANet V2: 効率的な医用ボリュームセグメンテーションのための柔軟な動的アーキテクチャ
- Authors: Haoran Shen, Yifu Zhang, Wenxuan Wang, Chen Chen, Jing Liu, Shanshan
Song, Jiangyun Li
- Abstract要約: 医用セグメンテーションのための動的アーキテクチャネットワーク(Med-DANet)は、良好な精度と効率のトレードオフを実現している。
本稿では、データ自体とモデル構造の両方の観点から、動的推論フレームワークの統一的な定式化について検討する。
当社のフレームワークでは,BraTS 2019のセグメンテーション結果と同等で,モデル効率を4.1倍と17.3倍に向上しています。
- 参考スコア(独自算出の注目度): 29.082411035685773
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Recent works have shown that the computational efficiency of 3D medical image
(e.g. CT and MRI) segmentation can be impressively improved by dynamic
inference based on slice-wise complexity. As a pioneering work, a dynamic
architecture network for medical volumetric segmentation (i.e. Med-DANet) has
achieved a favorable accuracy and efficiency trade-off by dynamically selecting
a suitable 2D candidate model from the pre-defined model bank for different
slices. However, the issues of incomplete data analysis, high training costs,
and the two-stage pipeline in Med-DANet require further improvement. To this
end, this paper further explores a unified formulation of the dynamic inference
framework from the perspective of both the data itself and the model structure.
For each slice of the input volume, our proposed method dynamically selects an
important foreground region for segmentation based on the policy generated by
our Decision Network and Crop Position Network. Besides, we propose to insert a
stage-wise quantization selector to the employed segmentation model (e.g.
U-Net) for dynamic architecture adapting. Extensive experiments on BraTS 2019
and 2020 show that our method achieves comparable or better performance than
previous state-of-the-art methods with much less model complexity. Compared
with previous methods Med-DANet and TransBTS with dynamic and static
architecture respectively, our framework improves the model efficiency by up to
nearly 4.1 and 17.3 times with comparable segmentation results on BraTS 2019.
- Abstract(参考訳): 近年の研究では、3次元医用画像(例えばCTやMRI)のセグメンテーションの計算効率がスライスワイズ複雑性に基づく動的推論によって著しく向上できることが示されている。
先駆的な研究として,前定義したモデルバンクから適切な2d候補モデルを動的に選択することで,医療用ボリュームセグメンテーションのための動的アーキテクチャネットワーク(すなわちmed-danet)が良好な精度と効率のトレードオフを達成している。
しかし、不完全なデータ分析、高いトレーニングコスト、Med-DANetの2段階パイプラインの問題はさらに改善する必要がある。
そこで本研究では,データ自体とモデル構造の両方の観点から,動的推論フレームワークの統一的な定式化について検討する。
提案手法は,入力ボリュームの各スライスに対して,決定ネットワークと作物位置ネットワークが生成するポリシーに基づいて,セグメント化のための重要な前景領域を動的に選択する。
さらに,動的アーキテクチャ適応のためのセグメンテーションモデル(U-Netなど)に段階的量子化セレクタを挿入することを提案する。
brats 2019 と 2020 の広範な実験により,従来の最先端手法と同等あるいは優れた性能を,モデル複雑性をはるかに少なく達成できることが示されている。
従来のMed-DANetとTransBTSの動的および静的アーキテクチャと比較すると,BraTS 2019では,モデル効率が最大4.1倍,17.3倍向上し,セグメンテーション結果に匹敵する結果が得られた。
関連論文リスト
- VICON: A Foundation Model for Multi-Physics Fluid Dynamics via Vision In-Context Operator Networks [21.061630022134203]
In-Context Operator Networks (ICON) は、数ショットのインコンテキストアプローチを使用して、異なるタイプのPDEをまたいだ演算子を学習する。
我々は,パッチワイズ操作により2次元関数を効率的に処理するビジョントランスフォーマーアーキテクチャを組み込んだITS(Vision In-Context Operator Networks)を提案する。
論文 参考訳(メタデータ) (2024-11-25T03:25:17Z) - AMAES: Augmented Masked Autoencoder Pretraining on Public Brain MRI Data for 3D-Native Segmentation [2.0749231618270803]
本研究では,3次元セマンティックセグメンテーションモデルの自己教師付き事前学習が大規模・ドメイン固有データセットに与える影響について検討した。
我々は、公開ソースから44,756個の脳MRIボリュームのデータセットであるBRAINS-45Kを紹介した。
論文 参考訳(メタデータ) (2024-08-01T15:27:48Z) - Multi-body SE(3) Equivariance for Unsupervised Rigid Segmentation and
Motion Estimation [49.56131393810713]
本稿では、SE(3)同変アーキテクチャと、この課題に教師なしで取り組むためのトレーニング戦略を提案する。
本手法は,0.25Mパラメータと0.92G FLOPを用いて,モデル性能と計算効率を両立させる。
論文 参考訳(メタデータ) (2023-06-08T22:55:32Z) - Prompt Tuning for Parameter-efficient Medical Image Segmentation [79.09285179181225]
2つの医用画像データセットのセマンティックセグメンテーションにパラメータ効率が良いが効果的な適応を実現するために,いくつかのコントリビューションを提案し,検討する。
我々はこのアーキテクチャを、オンライン生成プロトタイプへの割り当てに基づく専用密集型セルフスーパービジョンスキームで事前訓練する。
得られたニューラルネットワークモデルにより、完全に微調整されたモデルとパラメータに適応したモデルとのギャップを緩和できることを実証する。
論文 参考訳(メタデータ) (2022-11-16T21:55:05Z) - Entity-Graph Enhanced Cross-Modal Pretraining for Instance-level Product
Retrieval [152.3504607706575]
本研究の目的は, 細粒度製品カテゴリを対象とした, 弱制御型マルチモーダル・インスタンスレベルの製品検索である。
まず、Product1Mデータセットをコントリビュートし、2つの実際のインスタンスレベルの検索タスクを定義します。
我々は、マルチモーダルデータから重要な概念情報を組み込むことができるより効果的なクロスモーダルモデルを訓練するために活用する。
論文 参考訳(メタデータ) (2022-06-17T15:40:45Z) - Med-DANet: Dynamic Architecture Network for Efficient Medical Volumetric
Segmentation [13.158995287578316]
我々は,Med-DANetという動的アーキテクチャネットワークを提案し,効率的な精度と効率のトレードオフを実現する。
入力された3次元MRIボリュームのスライス毎に,提案手法は決定ネットワークによってスライス固有の決定を学習する。
提案手法は, 従来の3次元MRI脳腫瘍セグメント化法と比較して, 同等あるいは良好な結果が得られる。
論文 参考訳(メタデータ) (2022-06-14T03:25:58Z) - Learning Intermediate Representations using Graph Neural Networks for
NUMA and Prefetchers Optimization [1.3999481573773074]
本稿では,コード中の静的中間表現(IR)が,性能プロファイリングの禁止コストを伴わずにNUMA/prefetcher最適化を導出する方法を示す。
静的中間表現に基づくモデルでは,高コストな動的性能プロファイリングに基づく戦略によって得られる性能向上の80%を達成できることを示す。
論文 参考訳(メタデータ) (2022-03-01T16:51:30Z) - DANCE: DAta-Network Co-optimization for Efficient Segmentation Model
Training and Inference [85.02494022662505]
DANCEは、効率的なセグメンテーションモデルのトレーニングと推論のための自動データネットワーク協調最適化である。
入力イメージを適応的にダウンサンプル/ドロップする自動データスライミングを統合し、画像の空間的複雑さによって導かれるトレーニング損失に対するそれに対応するコントリビューションを制御する。
実験と非難研究により、DANCEは効率的なセグメンテーションに向けて「オールウィン」を達成できることを示した。
論文 参考訳(メタデータ) (2021-07-16T04:58:58Z) - A Progressive Sub-Network Searching Framework for Dynamic Inference [33.93841415140311]
本稿では、トレーニング可能なノイズランキング、チャネルグループ、微調整しきい値設定、サブネット再選択など、いくつかの効果的な手法を組み込んだプログレッシブサブネット探索フレームワークを提案する。
提案手法は,従来普及していたUniversally-Slimmable-Networkの4.4%と平均2.3%と,モデルサイズが同じであるImageNetデータセットと比較して,より優れた動的推論精度を実現する。
論文 参考訳(メタデータ) (2020-09-11T22:56:02Z) - Mix Dimension in Poincar\'{e} Geometry for 3D Skeleton-based Action
Recognition [57.98278794950759]
グラフ畳み込みネットワーク(GCN)はすでに、不規則なデータをモデル化する強力な能力を実証している。
本稿では,ポアンカー幾何学を用いて定義した空間時空間GCNアーキテクチャを提案する。
提案手法を,現在最大規模の2つの3次元データセット上で評価する。
論文 参考訳(メタデータ) (2020-07-30T18:23:18Z) - Dynamic Memory Induction Networks for Few-Shot Text Classification [84.88381813651971]
本稿では,テキスト分類のための動的メモリ誘導ネットワーク(DMIN)を提案する。
提案したモデルでは, miniRCV1 と ODIC データセット上での新たな最先端結果を実現し,最高の性能(精度)を24%向上させる。
論文 参考訳(メタデータ) (2020-05-12T12:41:14Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。