論文の概要: PMP-Swin: Multi-Scale Patch Message Passing Swin Transformer for Retinal
Disease Classification
- arxiv url: http://arxiv.org/abs/2311.11669v1
- Date: Mon, 20 Nov 2023 11:09:09 GMT
- ステータス: 処理完了
- システム内更新日: 2023-11-21 19:19:32.553334
- Title: PMP-Swin: Multi-Scale Patch Message Passing Swin Transformer for Retinal
Disease Classification
- Title(参考訳): PMP-Swin:網膜疾患分類のためのマルチスケールパッチメッセージパッシングスウィントランス
- Authors: Zhihan Yang, Zhiming Cheng, Tengjin Weng, Shucheng He, Yaqi Wang, Xin
Ye, Shuai Wang
- Abstract要約: マルチスケール・パッチ・メッセージ・パッシング・スウィン・トランスフォーマ (Multi-Scale Patch Message Passing Swin Transformer) という新しいフレームワークを提案する。
具体的には,Patch Message Passing(PMP)モジュールをMessage Passing機構に基づいて設計し,病的意味的特徴のグローバルな相互作用を確立する。
- 参考スコア(独自算出の注目度): 9.651435376561741
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Retinal disease is one of the primary causes of visual impairment, and early
diagnosis is essential for preventing further deterioration. Nowadays, many
works have explored Transformers for diagnosing diseases due to their strong
visual representation capabilities. However, retinal diseases exhibit milder
forms and often present with overlapping signs, which pose great difficulties
for accurate multi-class classification. Therefore, we propose a new framework
named Multi-Scale Patch Message Passing Swin Transformer for multi-class
retinal disease classification. Specifically, we design a Patch Message Passing
(PMP) module based on the Message Passing mechanism to establish global
interaction for pathological semantic features and to exploit the subtle
differences further between different diseases. Moreover, considering the
various scale of pathological features we integrate multiple PMP modules for
different patch sizes. For evaluation, we have constructed a new dataset, named
OPTOS dataset, consisting of 1,033 high-resolution fundus images photographed
by Optos camera and conducted comprehensive experiments to validate the
efficacy of our proposed method. And the results on both the public dataset and
our dataset demonstrate that our method achieves remarkable performance
compared to state-of-the-art methods.
- Abstract(参考訳): 網膜疾患は視覚障害の主な原因の1つであり、早期診断はさらなる悪化を防ぐのに不可欠である。
近年, 強力な視覚表現能力により, 疾患診断用トランスフォーマーの探索が盛んである。
しかし、網膜疾患は軽度の形態を示し、しばしば重複する徴候を呈し、正確な多型分類には非常に困難である。
そこで本研究では,マルチスケールパッチメッセージパッシングスウィントランスという,マルチクラスの網膜疾患分類のための新しいフレームワークを提案する。
具体的には,病理的意味的特徴に対するグローバルインタラクションを確立するため,メッセージパッシング機構に基づいたパッチメッセージパッシング(pmp)モジュールを設計し,その微妙な差異を別々に活用する。
さらに, 様々な病的特徴を考慮し, パッチサイズの異なる複数のPMPモジュールを統合する。
評価のために,オプトスカメラで撮影した1,033個の高解像度眼底画像からなるOPTOSデータセットを構築し,提案手法の有効性を検証するための総合的な実験を行った。
また,本手法が最先端の手法と比較して顕著な性能を発揮することを示す。
関連論文リスト
- PLUTO: Pathology-Universal Transformer [4.920983796208486]
そこで我々はPathoLogy Universal TransfOrmer (PLUTO)を提案する。
我々はPLUTOの出力埋め込みを利用したタスク固有の適応ヘッドを,病的規模にまたがるタスクに設計する。
PLUTOは既存のタスク固有のベースラインや病理学固有の基盤モデルに適合するか、性能を向上する。
論文 参考訳(メタデータ) (2024-05-13T16:40:17Z) - Adapting Visual-Language Models for Generalizable Anomaly Detection in Medical Images [68.42215385041114]
本稿では,CLIPモデルを用いた医用異常検出のための軽量な多レベル適応と比較フレームワークを提案する。
提案手法では,複数の残像アダプタを事前学習した視覚エンコーダに統合し,視覚的特徴の段階的向上を実現する。
医学的異常検出ベンチマーク実験により,本手法が現在の最先端モデルを大幅に上回っていることが示された。
論文 参考訳(メタデータ) (2024-03-19T09:28:19Z) - AMLP:Adaptive Masking Lesion Patches for Self-supervised Medical Image
Segmentation [67.97926983664676]
自己監督型マスク画像モデリングは自然画像に対して有望な結果を示した。
しかし,このような手法を医用画像に直接適用することは依然として困難である。
適応型マスキング病変パッチ(AMLP)の自己管理型医用画像分割フレームワークを提案する。
論文 参考訳(メタデータ) (2023-09-08T13:18:10Z) - Diffusion Models for Counterfactual Generation and Anomaly Detection in
Brain Images [59.85702949046042]
病気の画像の健全なバージョンを生成し,それを用いて画素単位の異常マップを得るための弱教師付き手法を提案する。
健常者を対象にした拡散モデルを用いて, サンプリングプロセスの各ステップで拡散拡散確率モデル (DDPM) と拡散拡散確率モデル (DDIM) を組み合わせる。
本手法が正常なサンプルに適用された場合,入力画像は大幅な修正を伴わずに再構成されることを確認した。
論文 参考訳(メタデータ) (2023-08-03T21:56:50Z) - The Whole Pathological Slide Classification via Weakly Supervised
Learning [7.313528558452559]
細胞核疾患と病理タイルの空間的相関の2つの病因を考察した。
本研究では,抽出器訓練中の汚れ分離を利用したデータ拡張手法を提案する。
次に,隣接行列を用いてタイル間の空間的関係を記述する。
これら2つのビューを統合することで,H&E染色組織像を解析するためのマルチインスタンス・フレームワークを設計した。
論文 参考訳(メタデータ) (2023-07-12T16:14:23Z) - HST-MRF: Heterogeneous Swin Transformer with Multi-Receptive Field for
Medical Image Segmentation [5.51045524851432]
医用画像セグメンテーションのためのHST-MRFモデルを提案する。
主な目的は、トランスを用いたパッチセグメンテーションによる構造情報の損失を解決することである。
実験の結果,提案手法は最先端モデルよりも優れ,優れた性能が得られることがわかった。
論文 参考訳(メタデータ) (2023-04-10T14:30:03Z) - Hierarchical Transformer for Survival Prediction Using Multimodality
Whole Slide Images and Genomics [63.76637479503006]
下流タスクのためのギガピクセルレベルのスライド病理画像(WSI)の良質な表現を学習することが重要である。
本稿では,病理画像と対応する遺伝子間の階層的マッピングを学習する階層型マルチモーダルトランスフォーマーフレームワークを提案する。
より優れたWSI表現能力を維持しながら、ベンチマーク手法と比較してGPUリソースが少ないアーキテクチャです。
論文 参考訳(メタデータ) (2022-11-29T23:47:56Z) - TFormer: A throughout fusion transformer for multi-modal skin lesion
diagnosis [6.899641625551976]
我々は,MSLDで十分な情報干渉を行うために,純粋なトランスフォーマーベースのTFormer(スルーアウト・フュージョン・トランスフォーマー)を提案する。
そこで我々は,2分岐階層型マルチモーダルトランス (HMT) ブロックのスタックを慎重に設計し,ステージバイステージ方式で異なる画像モダリティ間で情報を融合する。
我々のTFormerは、他の最先端メソッドよりも優れています。
論文 参考訳(メタデータ) (2022-11-21T12:07:05Z) - Multi-Label Retinal Disease Classification using Transformers [0.0]
新たな多ラベル網膜疾患データセットである MuReD が構築され、眼底疾患分類のために公開されているデータセットが多数使用されている。
広範な実験によって最適化されたトランスフォーマーベースのモデルは、画像解析と意思決定に使用される。
この手法は, 疾患検出と疾患分類のためのAUCスコアの7.9%と8.1%の精度で, 同じ課題における最先端の作業よりも優れていた。
論文 参考訳(メタデータ) (2022-07-05T22:06:52Z) - AlignTransformer: Hierarchical Alignment of Visual Regions and Disease
Tags for Medical Report Generation [50.21065317817769]
本稿では,Align Hierarchical Attention (AHA)とMulti-Grained Transformer (MGT)モジュールを含むAlign Transformerフレームワークを提案する。
パブリックなIU-XrayとMIMIC-CXRデータセットの実験は、AlignTransformerが2つのデータセットの最先端メソッドと競合する結果が得られることを示している。
論文 参考訳(メタデータ) (2022-03-18T13:43:53Z) - A Hierarchical Transformation-Discriminating Generative Model for Few
Shot Anomaly Detection [93.38607559281601]
各トレーニングイメージのマルチスケールパッチ分布をキャプチャする階層的生成モデルを開発した。
この異常スコアは、スケール及び画像領域にわたる正しい変換のパッチベースの投票を集約して得られる。
論文 参考訳(メタデータ) (2021-04-29T17:49:48Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。