Fugu-MT 論文翻訳(概要): MedViT: A Robust Vision Transformer for Generalized Medical Image Classification

論文の概要: MedViT: A Robust Vision Transformer for Generalized Medical Image Classification

arxiv url: http://arxiv.org/abs/2302.09462v1
Date: Sun, 19 Feb 2023 02:55:45 GMT
ステータス: 翻訳完了
システム内更新日: 2023-02-21 18:28:49.673950
Title: MedViT: A Robust Vision Transformer for Generalized Medical Image Classification
Title（参考訳）: medvit: 一般医用画像分類のためのロバストな視覚トランスフォーマー
Authors: Omid Nejati Manzari, Hamid Ahmadabadi, Hossein Kashiani, Shahriar B. Shokouhi, Ahmad Ayatollahi
Abstract要約: 我々は,CNNの局所性と視覚変換器のグローバル接続性を備えた,頑健で効率的なCNN-Transformerハイブリッドモデルを提案する。提案したハイブリッドモデルは,MedMNIST-2Dデータセットの大規模コレクションに関する最先端の研究と比較して,高い堅牢性と一般化能力を示す。
参考スコア（独自算出の注目度）: 4.471084427623774
License: http://creativecommons.org/licenses/by-nc-nd/4.0/
Abstract: Convolutional Neural Networks (CNNs) have advanced existing medical systems for automatic disease diagnosis. However, there are still concerns about the reliability of deep medical diagnosis systems against the potential threats of adversarial attacks since inaccurate diagnosis could lead to disastrous consequences in the safety realm. In this study, we propose a highly robust yet efficient CNN-Transformer hybrid model which is equipped with the locality of CNNs as well as the global connectivity of vision Transformers. To mitigate the high quadratic complexity of the self-attention mechanism while jointly attending to information in various representation subspaces, we construct our attention mechanism by means of an efficient convolution operation. Moreover, to alleviate the fragility of our Transformer model against adversarial attacks, we attempt to learn smoother decision boundaries. To this end, we augment the shape information of an image in the high-level feature space by permuting the feature mean and variance within mini-batches. With less computational complexity, our proposed hybrid model demonstrates its high robustness and generalization ability compared to the state-of-the-art studies on a large-scale collection of standardized MedMNIST-2D datasets.
Abstract（参考訳）: 畳み込みニューラルネットワーク(CNN)は、自動疾患診断のための既存の医療システムである。しかし、不正確な診断が安全領域で悲惨な結果をもたらす可能性があるため、逆境攻撃の潜在的な脅威に対する深層医療診断システムの信頼性に関する懸念は依然として残っている。本研究では,CNNの局所性と視覚変換器のグローバル接続性を備えた,高堅牢で効率的なCNN-Transformerハイブリッドモデルを提案する。様々な表現部分空間の情報に協調して関与しながら,自己着脱機構の高次複雑性を軽減するため,効率的な畳み込み操作を用いて注意機構を構築する。さらに,攻撃に対するトランスフォーマーモデルの脆弱性を軽減するために,よりスムーズな意思決定境界の学習を試みる。この目的のために,ミニバッチ内の特徴平均と分散を置換することにより,高レベルの特徴空間における画像の形状情報を強化する。計算複雑性の少ないハイブリッドモデルは,MedMNIST-2Dデータセットの大規模コレクションに関する最先端の研究と比較して,その堅牢性と一般化能力を示す。

関連論文リスト

A Contrastive Variational AutoEncoder for NSCLC Survival Prediction with Missing Modalities [41.8469011437549]
非小細胞肺癌 (NSCLC) 患者の生存予測は, 個々の予後が異なるため困難である。最先端モデルは、患者レベルの表現を作成するために利用可能なデータや、欠落したモダリティを推測するために生成モデルを使用する。本稿では,MCVAE(Multimodal Contrastive Variational AutoEncoder)を提案する。
論文参考訳（メタデータ） (2026-02-19T14:29:34Z)
A Semantically Enhanced Generative Foundation Model Improves Pathological Image Synthesis [82.01597026329158]
本稿では,組織合成のための相関調整フレームワーク(CRAFTS)について紹介する。 CRAFTSは、生物学的精度を確保するためにセマンティックドリフトを抑制する新しいアライメント機構を組み込んでいる。本モデルは,30種類の癌にまたがる多彩な病理像を生成する。
論文参考訳（メタデータ） (2025-12-15T10:22:43Z)
BrainSegDMlF: A Dynamic Fusion-enhanced SAM for Brain Lesion Segmentation [39.74162517990082]
脳画像における実質的な脳病変は、病変領域と正常な脳組織の間に不明瞭な境界を持つ高い異種性を示す。単一スライスにおける小病変の同定は困難であり, 異常領域の正確な再現性セグメンテーション, 特徴記述は非常に複雑である。既存の手法には次のような制限がある: 1) 診断に一般的に使用されるマルチモーダル情報を無視し、学習に単一モーダル情報のみに依存する。
論文参考訳（メタデータ） (2025-05-09T15:40:09Z)
Vision Transformer for Intracranial Hemorrhage Classification in CT Scans Using an Entropy-Aware Fuzzy Integral Strategy for Adaptive Scan-Level Decision Fusion [5.486205584465161]
頭蓋内出血 (ICH) は、脳血管の破裂により頭蓋内出血を引き起こす重篤な疾患である。脳CTスキャンにおける局所的および大域的空間依存性を捉えるために,その階層的注意機構を利用した高度なピラミッド・ビジョン・トランスフォーマー(PVT)モデルを提案する。
論文参考訳（メタデータ） (2025-03-11T16:47:32Z)
GS-TransUNet: Integrated 2D Gaussian Splatting and Transformer UNet for Accurate Skin Lesion Analysis [44.99833362998488]
本稿では,2次元ガウススプラッティングとTransformer UNetアーキテクチャを組み合わせた皮膚癌自動診断手法を提案する。セグメンテーションと分類の精度は著しく向上した。この統合は、新しいベンチマークをこの分野に設定し、マルチタスク医療画像解析手法のさらなる研究の可能性を強調している。
論文参考訳（メタデータ） (2025-02-23T23:28:47Z)
Multi-Scale Transformer Architecture for Accurate Medical Image Classification [4.578375402082224]
本研究では,トランスフォーマーアーキテクチャを改良したAIによる皮膚病変分類アルゴリズムを提案する。マルチスケールな特徴融合機構の統合と自己認識プロセスの洗練により、このモデルはグローバルな特徴とローカルな特徴の両方を効果的に抽出する。 ISIC 2017データセットのパフォーマンス評価は、改良されたTransformerが既存のAIモデルを上回ることを示している。
論文参考訳（メタデータ） (2025-02-10T08:22:25Z)
TransUNext: towards a more advanced U-shaped framework for automatic vessel segmentation in the fundus image [19.16680702780529]
本稿では,ハイブリッドトランスフォーマーとCNN: TransUNextのための,より高度なU字型アーキテクチャを提案する。 Global Multi-Scale Fusion (GMSF)モジュールはさらに、スキップ接続のアップグレード、高レベルセマンティクスと低レベル詳細情報の融合、高レベルセマンティクスと低レベルセマンティクスの相違を取り除くために導入された。
論文参考訳（メタデータ） (2024-11-05T01:44:22Z)
A Unified Model for Compressed Sensing MRI Across Undersampling Patterns [69.19631302047569]
様々な計測アンサンプパターンと画像解像度に頑健な統合MRI再構成モデルを提案する。我々のモデルは、拡散法よりも600$times$高速な推論で、最先端CNN(End-to-End VarNet)の4dBでSSIMを11%改善し、PSNRを4dB改善する。
論文参考訳（メタデータ） (2024-10-05T20:03:57Z)
TBConvL-Net: A Hybrid Deep Learning Architecture for Robust Medical Image Segmentation [6.013821375459473]
医用画像セグメンテーションのための新しいディープラーニングアーキテクチャを提案する。提案モデルでは,10の公開データセット上でのテクニックの現状に対して,一貫した改善が示されている。
論文参考訳（メタデータ） (2024-09-05T09:14:03Z)
Prototype Learning Guided Hybrid Network for Breast Tumor Segmentation in DCE-MRI [58.809276442508256]
本稿では,畳み込みニューラルネットワーク(CNN)とトランスフォーマー層を組み合わせたハイブリッドネットワークを提案する。プライベートおよびパブリックなDCE-MRIデータセットの実験結果から,提案したハイブリッドネットワークは最先端の手法よりも優れた性能を示した。
論文参考訳（メタデータ） (2024-08-11T15:46:00Z)
CAF-YOLO: A Robust Framework for Multi-Scale Lesion Detection in Biomedical Imagery [0.0682074616451595]
CAF-YOLOは、畳み込みニューラルネットワーク(CNN)とトランスフォーマーの強みを活用する、医学的対象検出のための、巧妙で堅牢な方法である。 ACFMモジュールはグローバル機能とローカル機能の両方のモデリングを強化し、長期的な機能依存のキャプチャを可能にする。 MSNNは多様なスケールにまたがる特徴を抽出することで、マルチスケールの情報集約を改善する。
論文参考訳（メタデータ） (2024-08-04T01:44:44Z)
L-SFAN: Lightweight Spatially-focused Attention Network for Pain Behavior Detection [44.016805074560295]
慢性的な腰痛 (CLBP) は世界中の何百万もの患者を悩ませており、個人の健康や医療システムに対する経済的負担に大きな影響を及ぼす。人工知能(AI)とディープラーニングは、リハビリ戦略を改善するために痛みに関連する行動を分析するための有望な道を提供するが、畳み込みニューラルネットワーク(CNN)を含む現在のモデルには限界がある。我々は、モーションキャプチャーと表面筋電図センサからデータの空間的時間的相互作用をキャプチャする2Dフィルタを組み込んだ軽量CNNアーキテクチャであるhbox EmoL-SFANを紹介する。
論文参考訳（メタデータ） (2024-06-07T12:01:37Z)
Harnessing The Power of Attention For Patch-Based Biomedical Image Classification [0.0]
本稿では,従来のCNNの代替として,自己認識機構に基づく新しいアーキテクチャを提案する。可変画像サイズを高解像度に適応させるLancoz5手法を提案する。提案手法は、誘導バイアス、重み共有、受容場制限、効率的なデータハンドリングなど、注意に基づく視覚モデルが直面する重要な課題に対処する。
論文参考訳（メタデータ） (2024-04-01T06:22:28Z)
Affine-Consistent Transformer for Multi-Class Cell Nuclei Detection [76.11864242047074]
本稿では, 原子核位置を直接生成する新しいアフィン一貫性変換器 (AC-Former) を提案する。本稿では,AAT (Adaptive Affine Transformer) モジュールを導入し,ローカルネットワークトレーニングのためのオリジナル画像をワープするための重要な空間変換を自動学習する。実験結果から,提案手法は様々なベンチマークにおいて既存の最先端アルゴリズムを著しく上回ることがわかった。
論文参考訳（メタデータ） (2023-10-22T02:27:02Z)
Breast Ultrasound Tumor Classification Using a Hybrid Multitask CNN-Transformer Network [63.845552349914186]
胸部超音波(BUS)画像分類において,グローバルな文脈情報の収集が重要な役割を担っている。ビジョントランスフォーマーは、グローバルなコンテキスト情報をキャプチャする能力が改善されているが、トークン化操作によって局所的なイメージパターンを歪めてしまう可能性がある。本研究では,BUS腫瘍分類とセグメンテーションを行うハイブリッドマルチタスクディープニューラルネットワークであるHybrid-MT-ESTANを提案する。
論文参考訳（メタデータ） (2023-08-04T01:19:32Z)
Brain Imaging-to-Graph Generation using Adversarial Hierarchical Diffusion Models for MCI Causality Analysis [44.45598796591008]
機能的磁気共鳴画像(fMRI)を軽度認知障害解析のための効果的な接続性にマッピングするために,脳画像から画像へのBIGG(Brain Imaging-to-graph generation)フレームワークを提案する。発電機の階層変換器は、複数のスケールでノイズを推定するように設計されている。 ADNIデータセットの評価は,提案モデルの有効性と有効性を示す。
論文参考訳（メタデータ） (2023-05-18T06:54:56Z)
AMIGO: Sparse Multi-Modal Graph Transformer with Shared-Context Processing for Representation Learning of Giga-pixel Images [53.29794593104923]
本稿では,スライド病理像全体に対する共有コンテキスト処理の新たな概念を提案する。 AMIGOは、組織内のセルラーグラフを使用して、患者に単一の表現を提供する。我々のモデルは、データの20%以下で同じ性能を達成できる程度に、欠落した情報に対して強い堅牢性を示す。
論文参考訳（メタデータ） (2023-03-01T23:37:45Z)
Self-Supervised Masked Convolutional Transformer Block for Anomaly Detection [122.4894940892536]
本稿では, 自己監督型マスク型畳み込み変圧器ブロック (SSMCTB) について述べる。本研究では,従来の自己教師型予測畳み込み抑止ブロック(SSPCAB)を3次元マスク付き畳み込み層,チャンネルワイドアテンション用トランスフォーマー,およびハマーロスに基づく新たな自己教師型目標を用いて拡張する。
論文参考訳（メタデータ） (2022-09-25T04:56:10Z)
Differentiable Agent-based Epidemiology [71.81552021144589]
GradABM(GradABM)は、エージェントベースのモデリングのためのスケーラブルで微分可能な設計で、勾配に基づく学習と自動微分が可能である。 GradABMは、コモディティハードウェア上で数秒で数百万の人口をシミュレートし、ディープニューラルネットワークと統合し、異種データソースを取り込みます。
論文参考訳（メタデータ） (2022-07-20T07:32:02Z)
HUMUS-Net: Hybrid unrolled multi-scale network architecture for accelerated MRI reconstruction [38.0542877099235]
HUMUS-Netは、暗黙のバイアスと畳み込みの効率を、無ロールでマルチスケールのネットワークにおけるTransformerブロックのパワーと組み合わせたハイブリッドアーキテクチャである。我々のネットワークは、最も広く公開されているMRIデータセットである高速MRIデータセット上で、新しい最先端技術を確立する。
論文参考訳（メタデータ） (2022-03-15T19:26:29Z)
MSHT: Multi-stage Hybrid Transformer for the ROSE Image Analysis of Pancreatic Cancer [5.604939010661757]
膵癌は世界で最も悪性ながんの1つであり、非常に高い死亡率で急速に悪化する。自動ワークフローを実現するために,ハイブリッドな高性能ディープラーニングモデルを提案する。 4240個のROSE画像のデータセットを収集し、この未探索領域における手法を評価する。
論文参考訳（メタデータ） (2021-12-27T05:04:11Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。