論文の概要: A Permutable Hybrid Network for Volumetric Medical Image Segmentation
- arxiv url: http://arxiv.org/abs/2303.13111v2
- Date: Fri, 24 Mar 2023 09:14:05 GMT
- ステータス: 処理完了
- システム内更新日: 2023-03-27 11:12:17.118535
- Title: A Permutable Hybrid Network for Volumetric Medical Image Segmentation
- Title(参考訳): 容積型医用画像分割のための可変ハイブリッドネットワーク
- Authors: Yi Lin, Xiao Fang, Dong Zhang, Kwang-Ting Cheng, Hao Chen
- Abstract要約: マルチ層パーセプトロン(MLP)ネットワークは、ViTに匹敵する結果により、研究者の間で人気を取り戻している。
本稿では医療画像セグメンテーションのための可変ハイブリッドネットワークPHNetを提案する。
- 参考スコア(独自算出の注目度): 29.04523206137096
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: The advent of Vision Transformer (ViT) has brought substantial advancements
in 3D volumetric benchmarks, particularly in 3D medical image segmentation.
Concurrently, Multi-Layer Perceptron (MLP) networks have regained popularity
among researchers due to their comparable results to ViT, albeit with the
exclusion of the heavy self-attention module. This paper introduces a
permutable hybrid network for volumetric medical image segmentation, named
PHNet, which exploits the advantages of convolution neural network (CNN) and
MLP. PHNet addresses the intrinsic isotropy problem of 3D volumetric data by
utilizing both 2D and 3D CNN to extract local information. Besides, we propose
an efficient Multi-Layer Permute Perceptron module, named MLPP, which enhances
the original MLP by obtaining long-range dependence while retaining positional
information. Extensive experimental results validate that PHNet outperforms the
state-of-the-art methods on two public datasets, namely, COVID-19-20 and
Synapse. Moreover, the ablation study demonstrates the effectiveness of PHNet
in harnessing the strengths of both CNN and MLP. The code will be accessible to
the public upon acceptance.
- Abstract(参考訳): 視覚トランスフォーマー(vit)の出現は、3dボリュームベンチマーク、特に3d医療画像セグメンテーションの大幅な進歩をもたらした。
同時に、Multi-Layer Perceptron(MLP)ネットワークは、重い自己保持モジュールを除外したにもかかわらず、ViTに匹敵する結果により、研究者の間で人気を取り戻している。
本稿では,畳み込みニューラルネットワーク (CNN) と MLP の利点を利用する,PHNet という医用画像分割のための可変ハイブリッドネットワークを提案する。
PHNetは2次元CNNと3次元CNNの両方を用いて3次元ボリュームデータの固有等方性問題に対処する。
また, 位置情報を保持しながら長距離依存を得ることにより, 元のmlpを増大させるmlppという, 効率的な多層透過型パーセプトロンモジュールを提案する。
大規模な実験結果によると、PHNetは2つのパブリックデータセット、すなわちCOVID-19-20とSynapseで最先端の手法より優れている。
さらに, PHNet が CNN および MLP の強度に有効であることを示す。
コードは受理後、一般に公開されます。
関連論文リスト
- SDR-Former: A Siamese Dual-Resolution Transformer for Liver Lesion
Classification Using 3D Multi-Phase Imaging [59.78761085714715]
本研究は肝病変分類のための新しいSDR-Formerフレームワークを提案する。
提案フレームワークは2つの臨床データセットに関する総合的な実験を通じて検証された。
科学コミュニティを支援するため,肝病変解析のための多段階MRデータセットを公開しています。
論文 参考訳(メタデータ) (2024-02-27T06:32:56Z) - E2ENet: Dynamic Sparse Feature Fusion for Accurate and Efficient 3D
Medical Image Segmentation [36.367368163120794]
E2ENet(Efficient to Efficient Network)と呼ばれる3次元医用画像分割モデルを提案する。
パラメトリックと計算効率の2つの設計が組み込まれている。
さまざまなリソース制約に対して、正確性と効率性のトレードオフを一貫して達成します。
論文 参考訳(メタデータ) (2023-12-07T22:13:37Z) - Dynamic Spectrum Mixer for Visual Recognition [17.180863898764194]
動的スペクトルミキサー (DSM) という,コンテンツ適応型だが計算効率のよい構造を提案する。
DSMはコサイン変換を用いて周波数領域におけるトークンの相互作用を表す。
ログ線形複雑性で長期空間依存を学習することができる。
論文 参考訳(メタデータ) (2023-09-13T04:51:15Z) - 3D Mitochondria Instance Segmentation with Spatio-Temporal Transformers [101.44668514239959]
本稿では,空間的および時間的注意を並列に効率的に計算するハイブリッドエンコーダデコーダフレームワークを提案する。
また,ミトコンドリアインスタンスの領域を背景から支援する訓練中に,意味的クラッタ・バックグラウンドの逆行性障害も導入した。
論文 参考訳(メタデータ) (2023-03-21T17:58:49Z) - Leveraging SO(3)-steerable convolutions for pose-robust semantic segmentation in 3D medical data [2.207533492015563]
球面調和に基づく同変ボクセル畳み込みを用いたセグメンテーションネットワークを新たに提案する。
これらのネットワークは、トレーニング中に見えないデータポーズに対して堅牢であり、トレーニング中にローテーションベースのデータ拡張を必要としない。
MRI脳腫瘍におけるセグメンテーション性能と健常な脳構造セグメンテーション課題について検討した。
論文 参考訳(メタデータ) (2023-03-01T09:27:08Z) - UNETR++: Delving into Efficient and Accurate 3D Medical Image Segmentation [93.88170217725805]
本稿では,高画質なセグメンテーションマスクと,パラメータ,計算コスト,推論速度の両面での効率性を提供するUNETR++という3次元医用画像セグメンテーション手法を提案する。
我々の設計の核となるのは、空間的およびチャネル的な識別的特徴を効率的に学習する、新しい効率的な対注意ブロック(EPA)の導入である。
Synapse, BTCV, ACDC, BRaTs, Decathlon-Lungの5つのベンチマークで評価した結果, 効率と精度の両面で, コントリビューションの有効性が示された。
論文 参考訳(メタデータ) (2022-12-08T18:59:57Z) - ToDD: Topological Compound Fingerprinting in Computer-Aided Drug
Discovery [8.620443111346523]
コンピュータ支援薬物発見(CADD)において、仮想スクリーニングは、化合物の大きなライブラリーにおいて分子標的に結合する可能性が最も高い薬物候補を特定するために用いられる。
この問題に対処するため,多次元ベクトルとして化合物のトポロジ的指紋を生成する多パラメータ持続性(MP)ホモロジーを用いた新しい手法を開発した。
プレトレーニングトトリプルトネットワークのマージン損失の微調整は, 組込み空間における化合物の相違や, 有効な薬物候補になる可能性のランク付けにおいて, 高い競争力を発揮することを示す。
論文 参考訳(メタデータ) (2022-11-07T19:00:05Z) - The Lazy Neuron Phenomenon: On Emergence of Activation Sparsity in
Transformers [59.87030906486969]
本稿では,Transformer アーキテクチャを用いた機械学習モデルにおいて,アクティベーションマップが疎いという興味深い現象について考察する。
本稿では, 自然言語処理と視覚処理の両方において, スパーシリティが顕著な現象であることを示す。
本稿では,変換器のFLOP数を大幅に削減し,効率を向上する手法について論じる。
論文 参考訳(メタデータ) (2022-10-12T15:25:19Z) - Multi-Slice Dense-Sparse Learning for Efficient Liver and Tumor
Segmentation [4.150096314396549]
ディープ畳み込みニューラルネットワーク(DCNN)は2次元および3次元の医用画像セグメンテーションにおいて大きな成功を収めている。
そこで我々は,DCNNを正規化するための入力として,密接な隣接スライスと疎隣接スライスを抽出するデータの観点から,新しい密集スプリストレーニングフローを提案する。
また、ネットワークの観点から2.5Dの軽量nnU-Netを設計し、その効率を向上させるために深度的に分離可能な畳み込みを採用する。
論文 参考訳(メタデータ) (2021-08-15T15:29:48Z) - Global Filter Networks for Image Classification [90.81352483076323]
本稿では,対数線形複雑度を持つ周波数領域における長期空間依存性を学習する,概念的に単純だが計算効率のよいアーキテクチャを提案する。
この結果から,GFNetはトランスフォーマー型モデルやCNNの効率,一般化能力,堅牢性において,非常に競争力のある代替手段となる可能性が示唆された。
論文 参考訳(メタデータ) (2021-07-01T17:58:16Z) - Fourier Features Let Networks Learn High Frequency Functions in Low
Dimensional Domains [69.62456877209304]
単純なフーリエ特徴写像を通して入力点を渡すことで、多層パーセプトロンが高周波関数を学習できることを示す。
結果は、最先端の結果を達成するコンピュータビジョンとグラフィックの進歩に光を当てた。
論文 参考訳(メタデータ) (2020-06-18T17:59:11Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。