Fugu-MT 論文翻訳(概要): From Pixels to Gigapixels: Bridging Local Inductive Bias and Long-Range Dependencies with Pixel-Mamba

論文の概要: From Pixels to Gigapixels: Bridging Local Inductive Bias and Long-Range Dependencies with Pixel-Mamba

arxiv url: http://arxiv.org/abs/2412.16711v1
Date: Sat, 21 Dec 2024 17:45:27 GMT
ステータス: 翻訳完了
システム内更新日: 2024-12-24 19:42:48.061311
Title: From Pixels to Gigapixels: Bridging Local Inductive Bias and Long-Range Dependencies with Pixel-Mamba
Title（参考訳）: Pixelからギガピクセル:Pixel-Mambaによる局所誘導バイアスと長距離依存性のブリッジ
Authors: Zhongwei Qiu, Hanqing Chao, Tiancheng Lin, Wanxing Chang, Zijiang Yang, Wenpei Jiao, Yixuan Shen, Yunshuo Zhang, Yelin Yang, Wenbin Liu, Hui Jiang, Yun Bian, Ke Yan, Dakai Jin, Le Lu,
Abstract要約: ギガピクセルWSIを効率的に扱うように設計された新しいディープラーニングアーキテクチャであるPixel-Mambaを紹介する。 Pixel-Mambaは、畳み込みニューラルネットワークに似たトークンを徐々に拡大することで、局所的な誘導バイアスを取り入れている。実験では、エンドツーエンドのWSI分析のための強力で効率的なフレームワークとして、Pixel-Mambaの有効性を示す。
参考スコア（独自算出の注目度）: 16.19372261506739
License: http://creativecommons.org/licenses/by-nc-sa/4.0/
Abstract: Histopathology plays a critical role in medical diagnostics, with whole slide images (WSIs) offering valuable insights that directly influence clinical decision-making. However, the large size and complexity of WSIs may pose significant challenges for deep learning models, in both computational efficiency and effective representation learning. In this work, we introduce Pixel-Mamba, a novel deep learning architecture designed to efficiently handle gigapixel WSIs. Pixel-Mamba leverages the Mamba module, a state-space model (SSM) with linear memory complexity, and incorporates local inductive biases through progressively expanding tokens, akin to convolutional neural networks. This enables Pixel-Mamba to hierarchically combine both local and global information while efficiently addressing computational challenges. Remarkably, Pixel-Mamba achieves or even surpasses the quantitative performance of state-of-the-art (SOTA) foundation models that were pretrained on millions of WSIs or WSI-text pairs, in a range of tumor staging and survival analysis tasks, {\bf even without requiring any pathology-specific pretraining}. Extensive experiments demonstrate the efficacy of Pixel-Mamba as a powerful and efficient framework for end-to-end WSI analysis.
Abstract（参考訳）: 病理組織学は、臨床診断において重要な役割を担い、スライド画像全体(WSI)は、臨床的意思決定に直接影響を及ぼす貴重な洞察を提供する。しかし、WSIsの大規模化と複雑さは、計算効率と効率的な表現学習の両方において、ディープラーニングモデルに重大な課題をもたらす可能性がある。本稿では,ギガピクセルWSIを効率的に処理できる新しいディープラーニングアーキテクチャであるPixel-Mambaを紹介する。 Pixel-Mambaは、線形メモリ複雑性を備えた状態空間モデル(SSM)であるMambaモジュールを活用し、トークンを徐々に拡張することで局所的な帰納バイアスを取り入れ、畳み込みニューラルネットワークに似ている。これにより、Pixel-Mambaは、ローカル情報とグローバル情報の両方を階層的に組み合わせながら、効率的な計算課題に対処することができる。注目すべきは、Pixel-Mambaは、数百万のWSIまたはWSI-textペアで事前トレーニングされた最先端(SOTA)基盤モデルの定量的パフォーマンスを、病理学固有の事前トレーニングを必要とせずに、様々な腫瘍ステージングおよび生存分析タスクで達成または超えることである。大規模な実験は、エンドツーエンドのWSI分析のための強力で効率的なフレームワークとしてPixel-Mambaの有効性を示す。

関連論文リスト

From Pixels to Histopathology: A Graph-Based Framework for Interpretable Whole Slide Image Analysis [81.19923502845441]
我々はWSIグラフ表現を構成するグラフベースのフレームワークを開発する。任意のパッチではなく生物学的境界に従う組織表現(ノード)を構築します。本手法の最終段階として,グラフアテンションネットワークを用いて診断課題を解決する。
論文参考訳（メタデータ） (2025-03-14T20:15:04Z)
MambaClinix: Hierarchical Gated Convolution and Mamba-Based U-Net for Enhanced 3D Medical Image Segmentation [6.673169053236727]
医用画像分割のための新しいU字型アーキテクチャであるMambaClinixを提案する。 MambaClinixは、階層的なゲート畳み込みネットワークとMambaを適応的なステージワイドフレームワークに統合する。以上の結果から,MambaClinixは低モデルの複雑さを維持しつつ高いセグメンテーション精度を達成できることが示唆された。
論文参考訳（メタデータ） (2024-09-19T07:51:14Z)
MSVM-UNet: Multi-Scale Vision Mamba UNet for Medical Image Segmentation [3.64388407705261]
医用画像分割のためのマルチスケールビジョンマンバUNetモデルMSVM-UNetを提案する。具体的には、VSSブロックにマルチスケールの畳み込みを導入することで、VMambaエンコーダの階層的特徴から、より効果的にマルチスケールの特徴表現をキャプチャし、集約することができる。
論文参考訳（メタデータ） (2024-08-25T06:20:28Z)
Semi-Mamba-UNet: Pixel-Level Contrastive and Pixel-Level Cross-Supervised Visual Mamba-based UNet for Semi-Supervised Medical Image Segmentation [11.637738540262797]
本研究では,従来のCNNベースのUNetと純粋に視覚的なMambaベースのエンコーダデコーダアーキテクチャを組み込んだセミマンバUNetを,半教師付き学習フレームワークに統合する。この革新的なSSLアプローチは、両方のネットワークを利用して擬似ラベルを生成し、ピクセルレベルで相互に相互に監督する。本稿では,2対のプロジェクタを用いた自己教師型画素レベルのコントラスト学習戦略を導入し,特徴学習機能をさらに強化する。
論文参考訳（メタデータ） (2024-02-11T17:09:21Z)
A self-supervised framework for learning whole slide representations [52.774822784847565]
我々は、全スライド画像のギガピクセルスケールの自己スーパービジョンのためのSlide Pre-trained Transformer (SPT)を提案する。バイオメディカル・マイクロスコープ・データセットを用いて,5つの診断課題におけるSPT視覚表現のベンチマークを行った。
論文参考訳（メタデータ） (2024-02-09T05:05:28Z)
nnMamba: 3D Biomedical Image Segmentation, Classification and Landmark Detection with State Space Model [24.955052600683423]
本稿では、CNNの強みとステートスペースシーケンスモデル(SSM)の高度な長距離モデリング機能を統合する新しいアーキテクチャであるnnMambaを紹介する。 6つのデータセットの実験では、3D画像のセグメンテーション、分類、ランドマーク検出など、一連の困難なタスクにおいて、nnMambaが最先端のメソッドよりも優れていることが示されている。
論文参考訳（メタデータ） (2024-02-05T21:28:47Z)
Swin-UMamba: Mamba-based UNet with ImageNet-based pretraining [85.08169822181685]
本稿では,医療画像のセグメンテーションに特化して設計された新しいマンバモデルSwin-UMambaを紹介する。 Swin-UMamba は CNN や ViT,最新の Mamba ベースのモデルと比較して,優れたパフォーマンスを示している。
論文参考訳（メタデータ） (2024-02-05T18:58:11Z)
Pixel-Inconsistency Modeling for Image Manipulation Localization [59.968362815126326]
デジタル画像法医学は、画像認証と操作のローカライゼーションにおいて重要な役割を果たす。本稿では,画素不整合アーチファクトの解析を通じて,一般化されたロバストな操作ローカライゼーションモデルを提案する。実験により,本手法は固有の画素不整合偽指紋を抽出することに成功した。
論文参考訳（メタデータ） (2023-09-30T02:54:51Z)
Pyramid Pixel Context Adaption Network for Medical Image Classification with Supervised Contrastive Learning [9.391271552098878]
実用的で軽量なアーキテクチャユニットであるPraamid Pixel Context Adaption (PPCA) モジュールを提案する。 PPCAはマルチスケールの画素コンテキスト情報を利用して画素非依存の画素位置を補正する。 PPCANetは最先端の注目ネットワークや最近のディープニューラルネットワークよりも優れていることを示す。
論文参考訳（メタデータ） (2023-03-03T13:36:55Z)
Evolutionary Computation in Action: Feature Selection for Deep Embedding Spaces of Gigapixel Pathology Images [0.6037276428689636]
本稿では, 大規模多目的最適化(LSMOP)に基づくWSI表現の進化的アプローチを提案する。 The Cancer Genome Atlas(TC)画像を用いて,WSI表現,分類精度,特徴品質の観点から提案手法を検証した。提案した進化的アルゴリズムは、最先端の手法によって提供されるコードよりも8%高い精度でWSIを表現するための非常にコンパクトな特徴ベクトルを求める。
論文参考訳（メタデータ） (2023-03-02T03:36:15Z)
Hierarchical Transformer for Survival Prediction Using Multimodality Whole Slide Images and Genomics [63.76637479503006]
下流タスクのためのギガピクセルレベルのスライド病理画像(WSI)の良質な表現を学習することが重要である。本稿では,病理画像と対応する遺伝子間の階層的マッピングを学習する階層型マルチモーダルトランスフォーマーフレームワークを提案する。より優れたWSI表現能力を維持しながら、ベンチマーク手法と比較してGPUリソースが少ないアーキテクチャです。
論文参考訳（メタデータ） (2022-11-29T23:47:56Z)
Inducing Gaussian Process Networks [80.40892394020797]
本稿では,特徴空間と誘導点を同時に学習するシンプルなフレームワークであるGaussian Process Network (IGN)を提案する。特に誘導点は特徴空間で直接学習され、複雑な構造化領域のシームレスな表現を可能にする。実世界のデータセットに対する実験結果から,IGNは最先端の手法よりも大幅に進歩していることを示す。
論文参考訳（メタデータ） (2022-04-21T05:27:09Z)
Belief Propagation Reloaded: Learning BP-Layers for Labeling Problems [83.98774574197613]
最も単純な推論手法の1つとして、切り詰められた最大積のBelief伝播を取り上げ、それをディープラーニングモデルの適切なコンポーネントにするために必要となるものを加えます。このBP-Layerは畳み込みニューラルネットワーク(CNN)の最終ブロックまたは中間ブロックとして使用できるこのモデルは様々な密集予測問題に適用可能であり、パラメータ効率が高く、ステレオ、光フロー、セマンティックセグメンテーションにおける堅牢な解を提供する。
論文参考訳（メタデータ） (2020-03-13T13:11:35Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。