論文の概要: MEDUSA: Multi-scale Encoder-Decoder Self-Attention Deep Neural Network
Architecture for Medical Image Analysis
- arxiv url: http://arxiv.org/abs/2110.06063v1
- Date: Tue, 12 Oct 2021 15:05:15 GMT
- ステータス: 処理完了
- システム内更新日: 2021-10-13 14:38:42.958242
- Title: MEDUSA: Multi-scale Encoder-Decoder Self-Attention Deep Neural Network
Architecture for Medical Image Analysis
- Title(参考訳): medusa: 医用画像解析のためのマルチスケールエンコーダ・デコーダ自己アテンションディープニューラルネットワークアーキテクチャ
- Authors: Hossein Aboutalebi, Maya Pavlova, Hayden Gunraj, Mohammad Javad
Shafiee, Ali Sabri, Amer Alaref, Alexander Wong
- Abstract要約: 医用画像解析に適したマルチスケールエンコーダデコーダ自己保持機構であるMEDUSAを紹介する。
我々は、COVIDx、RSNA RICORD、RSNA Pneumonia Challengeなどの医療画像分析ベンチマークの最先端性能を得た。
- 参考スコア(独自算出の注目度): 71.2022403915147
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Medical image analysis continues to hold interesting challenges given the
subtle characteristics of certain diseases and the significant overlap in
appearance between diseases. In this work, we explore the concept of
self-attention for tackling such subtleties in and between diseases. To this
end, we introduce MEDUSA, a multi-scale encoder-decoder self-attention
mechanism tailored for medical image analysis. While self-attention deep
convolutional neural network architectures in existing literature center around
the notion of multiple isolated lightweight attention mechanisms with limited
individual capacities being incorporated at different points in the network
architecture, MEDUSA takes a significant departure from this notion by
possessing a single, unified self-attention mechanism with significantly higher
capacity with multiple attention heads feeding into different scales in the
network architecture. To the best of the authors' knowledge, this is the first
"single body, multi-scale heads" realization of self-attention and enables
explicit global context amongst selective attention at different levels of
representational abstractions while still enabling differing local attention
context at individual levels of abstractions. With MEDUSA, we obtain
state-of-the-art performance on multiple challenging medical image analysis
benchmarks including COVIDx, RSNA RICORD, and RSNA Pneumonia Challenge when
compared to previous work. Our MEDUSA model is publicly available.
- Abstract(参考訳): 医療画像分析は、特定の疾患の微妙な特徴と、疾患の出現の顕著な重複を考えると、興味深い課題が続いている。
本研究では,病気の微妙さに対処するための自己注意の概念を探求する。
この目的のために,医療画像解析に適したマルチスケールエンコーダデコーダ自己保持機構であるMEDUSAを紹介する。
While self-attention deep convolutional neural network architectures in existing literature center around the notion of multiple isolated lightweight attention mechanisms with limited individual capacities being incorporated at different points in the network architecture, MEDUSA takes a significant departure from this notion by possessing a single, unified self-attention mechanism with significantly higher capacity with multiple attention heads feeding into different scales in the network architecture.
著者の知る限りでは、これは最初の「シングルボディ、マルチスケールヘッド」による自己注意の実現であり、個々の抽象レベルで異なる局所的注意コンテキストを許容しながら、異なる表現的抽象化のレベルにおいて選択的に注意を向けることにより、明示的なグローバルコンテキストを実現する。
MEDUSAでは、これまでの研究と比較すると、COVIDx、RSNA RICORD、RSNA Pneumonia Challengeなど、複数の挑戦的な医療画像分析ベンチマークの最先端性能が得られた。
私たちのMEDUSAモデルは公開されています。
関連論文リスト
- Multi-modal Cross-domain Self-supervised Pre-training for fMRI and EEG Fusion [3.8153469790341084]
ドメイン間でのマルチモーダル情報の相乗化に自己教師付き学習を活用する新しい手法を提案する。
提案手法を利用した大規模事前学習データセットと事前学習MCSPモデルを構築した。
本研究は,fMRIと脳波の融合の著しい進展に寄与し,クロスドメイン機能の統合を図っている。
論文 参考訳(メタデータ) (2024-09-27T20:25:17Z) - Lagrange Duality and Compound Multi-Attention Transformer for Semi-Supervised Medical Image Segmentation [27.758157788769253]
半教師付き学習における総合的な学習目標として,境界認識型コントラスト損失と統合されたラグランジュ二重性損失(LDC)を提案する。
また、ResUNetとTransformerの強みを相乗化する新しいネットワークであるCMAformerを紹介する。
以上の結果から,CMAformerは機能融合フレームワークと新たな一貫性の喪失と相まって,半教師付き学習アンサンブルにおいて強い相補性を示すことが明らかとなった。
論文 参考訳(メタデータ) (2024-09-12T06:52:46Z) - MindFormer: Semantic Alignment of Multi-Subject fMRI for Brain Decoding [50.55024115943266]
本稿では,MindFormer を用いたマルチオブジェクト fMRI 信号のセマンティックアライメント手法を提案する。
このモデルは、fMRIから画像生成のための安定拡散モデルや、fMRIからテキスト生成のための大規模言語モデル(LLM)の条件付けに使用できるfMRI条件付き特徴ベクトルを生成するように設計されている。
実験の結果,MindFormerは意味的に一貫した画像とテキストを異なる主題にわたって生成することがわかった。
論文 参考訳(メタデータ) (2024-05-28T00:36:25Z) - Multi-modal Graph Neural Network for Early Diagnosis of Alzheimer's
Disease from sMRI and PET Scans [11.420077093805382]
我々は,非ユークリッド領域の問題に対処するためのグラフニューラルネットワーク(GNN)を提案する。
本研究では,sMRIやPET画像から脳ネットワークを生成可能であることを示す。
次に、各モーダルが独自のGNNの分岐を持つマルチモーダルGNNフレームワークを提案し、その多モーダルデータを組み合わせる手法を提案する。
論文 参考訳(メタデータ) (2023-07-31T02:04:05Z) - K-Space-Aware Cross-Modality Score for Synthesized Neuroimage Quality
Assessment [71.27193056354741]
クロスモダリティな医用画像合成をどう評価するかという問題は、ほとんど解明されていない。
本稿では,この課題の進展を促すため,新しい指標K-CROSSを提案する。
K-CROSSは、トレーニング済みのマルチモードセグメンテーションネットワークを使用して、病変の位置を予測する。
論文 参考訳(メタデータ) (2023-07-10T01:26:48Z) - LVM-Med: Learning Large-Scale Self-Supervised Vision Models for Medical
Imaging via Second-order Graph Matching [59.01894976615714]
LVM-Medは、大規模医療データセットに基づいてトレーニングされた、最初のディープネットワークファミリーである。
55の公開データセットから約13万の医療画像を収集しました。
LVM-Medは、多くの最先端の教師付き、自己監督型、基礎モデルよりも経験的に優れている。
論文 参考訳(メタデータ) (2023-06-20T22:21:34Z) - Multimodal Multi-Head Convolutional Attention with Various Kernel Sizes
for Medical Image Super-Resolution [56.622832383316215]
超解像CTおよびMRIスキャンのための新しいマルチヘッド畳み込みアテンションモジュールを提案する。
我々の注目モジュールは、畳み込み操作を用いて、複数の入力テンソルに対して共同的な空間チャネルアテンションを行う。
それぞれの頭部は空間的注意に対する特定の減少率に応じた受容野の大きさの異なる複数の注意ヘッドを導入している。
論文 参考訳(メタデータ) (2022-04-08T07:56:55Z) - MHATC: Autism Spectrum Disorder identification utilizing multi-head
attention encoder along with temporal consolidation modules [11.344829880346353]
静止状態fMRIは、ネットワークベースの機能接続を用いて自閉症スペクトラム障害(ASD)の診断に一般的に用いられる。
ASD患者として個人を分類するための多面的注意と時間的統合モジュールからなる新しいディープラーニングアーキテクチャ(MHATC)を提案する。
論文 参考訳(メタデータ) (2021-12-27T07:50:16Z) - Studying the Effects of Self-Attention for Medical Image Analysis [42.12044020360494]
複数の医用画像解析タスクにおける最先端の自己認識機構の比較を行った。
我々は,医療用コンピュータビジョンタスクにおける自己注意の効果について,より深く理解することを目的としている。
論文 参考訳(メタデータ) (2021-09-02T07:07:16Z) - Few-shot Medical Image Segmentation using a Global Correlation Network
with Discriminative Embedding [60.89561661441736]
医療画像分割のための新しい手法を提案する。
深層畳み込みネットワークを用いた数ショット画像セグメンタを構築します。
深層埋め込みの識別性を高め,同一クラスの特徴領域のクラスタリングを促進する。
論文 参考訳(メタデータ) (2020-12-10T04:01:07Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。