論文の概要: UNesT: Local Spatial Representation Learning with Hierarchical
Transformer for Efficient Medical Segmentation
- arxiv url: http://arxiv.org/abs/2209.14378v2
- Date: Fri, 8 Sep 2023 01:57:45 GMT
- ステータス: 処理完了
- システム内更新日: 2023-09-11 18:47:34.840127
- Title: UNesT: Local Spatial Representation Learning with Hierarchical
Transformer for Efficient Medical Segmentation
- Title(参考訳): unest:階層型トランスフォーマによる局所空間表現学習による医療セグメンテーションの効率化
- Authors: Xin Yu, Qi Yang, Yinchi Zhou, Leon Y. Cai, Riqiang Gao, Ho Hin Lee,
Thomas Li, Shunxing Bao, Zhoubing Xu, Thomas A. Lasko, Richard G. Abramson,
Zizhao Zhang, Yuankai Huo, Bennett A. Landman, Yucheng Tang
- Abstract要約: 我々は、UNesTが常に最先端の性能を達成し、その一般化性とデータ効率を評価することを示す。
我々は、UNesTが常に最先端の性能を達成し、その一般化性とデータ効率を評価することを示す。
- 参考スコア(独自算出の注目度): 29.287521185541298
- License: http://creativecommons.org/licenses/by-nc-nd/4.0/
- Abstract: Transformer-based models, capable of learning better global dependencies,
have recently demonstrated exceptional representation learning capabilities in
computer vision and medical image analysis. Transformer reformats the image
into separate patches and realizes global communication via the self-attention
mechanism. However, positional information between patches is hard to preserve
in such 1D sequences, and loss of it can lead to sub-optimal performance when
dealing with large amounts of heterogeneous tissues of various sizes in 3D
medical image segmentation. Additionally, current methods are not robust and
efficient for heavy-duty medical segmentation tasks such as predicting a large
number of tissue classes or modeling globally inter-connected tissue
structures. To address such challenges and inspired by the nested hierarchical
structures in vision transformer, we proposed a novel 3D medical image
segmentation method (UNesT), employing a simplified and faster-converging
transformer encoder design that achieves local communication among spatially
adjacent patch sequences by aggregating them hierarchically. We extensively
validate our method on multiple challenging datasets, consisting of multiple
modalities, anatomies, and a wide range of tissue classes, including 133
structures in the brain, 14 organs in the abdomen, 4 hierarchical components in
the kidneys, inter-connected kidney tumors and brain tumors. We show that UNesT
consistently achieves state-of-the-art performance and evaluate its
generalizability and data efficiency. Particularly, the model achieves whole
brain segmentation task complete ROI with 133 tissue classes in a single
network, outperforming prior state-of-the-art method SLANT27 ensembled with 27
networks.
- Abstract(参考訳): グローバル依存性をよりよく学習できるトランスフォーマーベースのモデルは、コンピュータビジョンと医用画像解析において、例外的な表現学習能力を示している。
トランスフォーマーは画像を別々のパッチに再構成し、自己着脱機構を介してグローバル通信を実現する。
しかし, パッチ間の位置情報の保存は困難であり, 3次元医用画像セグメンテーションにおいて, 多量の異種組織を扱う際には, その損失が準最適性能をもたらす可能性がある。
さらに、現在の方法は、多くの組織クラスを予測したり、グローバルに接続された組織構造をモデリングするといった、重度な医療区分作業において堅牢で効率的ではない。
このような課題に対処し、視覚変換器のネストした階層構造から着想を得た新しい3次元医用画像分割法 (UNesT) を提案する。
われわれは,脳の133構造,腹部の14の臓器,腎臓の4つの階層的成分,腎臓間腫瘍,脳腫瘍を含む組織クラスからなる複数の課題データセットに対して,本手法を広範囲に検証した。
UNesTは最先端の性能を一貫して達成し,その一般化性とデータ効率を評価する。
特に、このモデルは1つのネットワークで133の組織クラスを持つ全脳セグメント化タスクROIを達成し、27のネットワークで組み合わされた最先端のSLANT27よりも優れています。
関連論文リスト
- From Tissue Plane to Organ World: A Benchmark Dataset for Multimodal Biomedical Image Registration using Deep Co-Attention Networks [17.718448707146017]
組織と臓器の登録は、特定の組織学的セクションがヒトの臓器のごく一部しか取得できないため、追加の課題となる。
私たちは、さまざまな機関からソースを得たATOMベンチマークデータセットを作成し、この課題を機械学習問題に変換することを目的としています。
RegisMCANモデルの性能は,臓器画像から抽出した部分領域が全体の3次元体積内からどこから抽出されたのかを正確に予測する深層学習の可能性を示している。
論文 参考訳(メタデータ) (2024-06-06T14:21:15Z) - Leveraging Frequency Domain Learning in 3D Vessel Segmentation [50.54833091336862]
本研究では,Fourier領域学習を3次元階層分割モデルにおけるマルチスケール畳み込みカーネルの代用として活用する。
管状血管分割作業において,新しいネットワークは顕著なサイス性能(ASACA500が84.37%,ImageCASが80.32%)を示した。
論文 参考訳(メタデータ) (2024-01-11T19:07:58Z) - BRAU-Net++: U-Shaped Hybrid CNN-Transformer Network for Medical Image Segmentation [11.986549780782724]
医用画像の正確な分割作業のために,BRAU-Net++ というハイブリッドで効果的な CNN-Transformer ネットワークを提案する。
具体的には、BRAU-Net++は、U字型エンコーダデコーダ構造を設計するために、コアビルディングブロックとしてバイレベルルーティングアテンションを使用する。
提案手法は,そのベースラインであるBRAU-Netを含む,最先端の手法を超越した手法である。
論文 参考訳(メタデータ) (2024-01-01T10:49:09Z) - Affine-Consistent Transformer for Multi-Class Cell Nuclei Detection [76.11864242047074]
本稿では, 原子核位置を直接生成する新しいアフィン一貫性変換器 (AC-Former) を提案する。
本稿では,AAT (Adaptive Affine Transformer) モジュールを導入し,ローカルネットワークトレーニングのためのオリジナル画像をワープするための重要な空間変換を自動学習する。
実験結果から,提案手法は様々なベンチマークにおいて既存の最先端アルゴリズムを著しく上回ることがわかった。
論文 参考訳(メタデータ) (2023-10-22T02:27:02Z) - SeUNet-Trans: A Simple yet Effective UNet-Transformer Model for Medical
Image Segmentation [0.0]
医用画像セグメンテーションのためのシンプルなUNet-Transformer(seUNet-Trans)モデルを提案する。
提案手法では,UNetモデルを特徴抽出器として設計し,入力画像から複数の特徴マップを生成する。
UNetアーキテクチャと自己認識機構を活用することで、我々のモデルはローカルとグローバルの両方のコンテキスト情報を保存するだけでなく、入力要素間の長距離依存関係をキャプチャできる。
論文 参考訳(メタデータ) (2023-10-16T01:13:38Z) - Learning from partially labeled data for multi-organ and tumor
segmentation [102.55303521877933]
本稿では,トランスフォーマーに基づく動的オンデマンドネットワーク(TransDoDNet)を提案する。
動的ヘッドにより、ネットワークは複数のセグメンテーションタスクを柔軟に達成することができる。
我々はMOTSと呼ばれる大規模にラベル付けされたMulti-Organ and tumorベンチマークを作成し、他の競合相手よりもTransDoDNetの方が優れた性能を示す。
論文 参考訳(メタデータ) (2022-11-13T13:03:09Z) - Two-Stream Graph Convolutional Network for Intra-oral Scanner Image
Segmentation [133.02190910009384]
本稿では,2ストリームグラフ畳み込みネットワーク(TSGCN)を提案する。
TSGCNは3次元歯(表面)セグメンテーションにおいて最先端の方法よりも優れています。
論文 参考訳(メタデータ) (2022-04-19T10:41:09Z) - Multi-organ Segmentation Network with Adversarial Performance Validator [10.775440368500416]
本稿では,2次元から3次元のセグメンテーションフレームワークに対向的な性能検証ネットワークを導入する。
提案したネットワークは, 2次元粗い結果から3次元高品質なセグメンテーションマスクへの変換を行い, 共同最適化によりセグメンテーション精度が向上する。
NIH膵分節データセットの実験では、提案したネットワークが小臓器分節の最先端の精度を達成し、過去の最高性能を上回った。
論文 参考訳(メタデータ) (2022-04-16T18:00:29Z) - Efficient Medical Image Segmentation Based on Knowledge Distillation [30.857487609003197]
医用画像セグメンテーションネットワークから知識を抽出し,別の軽量ネットワークを訓練することで,効率的なアーキテクチャを提案する。
また,教師から学生ネットワークへ意味領域情報を伝達するために,医用画像セグメンテーションに適した新しい蒸留モジュールを考案した。
本研究では,本手法で蒸留した軽量ネットワークが,比較的高い動作速度と低いストレージ使用量を必要とするシナリオにおいて,無視できない価値を持つことを示す。
論文 参考訳(メタデータ) (2021-08-23T07:41:10Z) - Automatic size and pose homogenization with spatial transformer network
to improve and accelerate pediatric segmentation [51.916106055115755]
空間変換器ネットワーク(STN)を利用することにより、ポーズとスケール不変の新たなCNNアーキテクチャを提案する。
私たちのアーキテクチャは、トレーニング中に一緒に見積もられる3つのシーケンシャルモジュールで構成されています。
腹部CTスキャナーを用いた腎および腎腫瘍の分節法について検討した。
論文 参考訳(メタデータ) (2021-07-06T14:50:03Z) - Medical Transformer: Gated Axial-Attention for Medical Image
Segmentation [73.98974074534497]
医用画像分割タスクにおけるトランスフォーマティブネットワークアーキテクチャの利用可能性について検討する。
セルフアテンションモジュールに追加の制御機構を導入することで,既存のアーキテクチャを拡張するGated Axial-Attentionモデルを提案する。
医療画像上で効果的にモデルを訓練するために,さらにパフォーマンスを向上させる局所的グローバルトレーニング戦略 (logo) を提案する。
論文 参考訳(メタデータ) (2021-02-21T18:35:14Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。