Fugu-MT 論文翻訳(概要): Factorizer: A Scalable Interpretable Approach to Context Modeling for Medical Image Segmentation

論文の概要: Factorizer: A Scalable Interpretable Approach to Context Modeling for Medical Image Segmentation

arxiv url: http://arxiv.org/abs/2202.12295v2
Date: Mon, 28 Feb 2022 17:23:16 GMT
ステータス: 翻訳完了
システム内更新日: 2022-03-01 11:53:53.255949
Title: Factorizer: A Scalable Interpretable Approach to Context Modeling for Medical Image Segmentation
Title（参考訳）: factorizer: 医用画像分割のためのコンテキストモデリングへのスケーラブルな解釈可能なアプローチ
Authors: Pooya Ashtari, Diana Sima, Lieven De Lathauwer, Dominique Sappey-Marinierd, Frederik Maes, and Sabine Van Huffel
Abstract要約: この研究はFacterizerと呼ばれるモデルのファミリーを導入し、エンド・ツー・エンドのセグメンテーション・モデルを構築するために低ランク行列係数化の力を利用する。具体的には、U字型アーキテクチャに組み込まれた微分可能な層として非負行列因子化(NMF)を定式化する、コンテキストモデリングに対する線形スケーラブルなアプローチを提案する。ファクターは精度、スケーラビリティ、解釈可能性の点でCNNやTransformerと良好に競合する。
参考スコア（独自算出の注目度）: 6.030648996110607
License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
Abstract: Convolutional Neural Networks (CNNs) with U-shaped architectures have dominated medical image segmentation, which is crucial for various clinical purposes. However, the inherent locality of convolution makes CNNs fail to fully exploit global context, essential for better recognition of some structures, e.g., brain lesions. Transformers have recently proved promising performance on vision tasks, including semantic segmentation, mainly due to their capability of modeling long-range dependencies. Nevertheless, the quadratic complexity of attention makes existing Transformer-based models use self-attention layers only after somehow reducing the image resolution, which limits the ability to capture global contexts present at higher resolutions. Therefore, this work introduces a family of models, dubbed Factorizer, which leverages the power of low-rank matrix factorization for constructing an end-to-end segmentation model. Specifically, we propose a linearly scalable approach to context modeling, formulating Nonnegative Matrix Factorization (NMF) as a differentiable layer integrated into a U-shaped architecture. The shifted window technique is also utilized in combination with NMF to effectively aggregate local information. Factorizers compete favorably with CNNs and Transformers in terms of accuracy, scalability, and interpretability, achieving state-of-the-art results on the BraTS dataset for brain tumor segmentation, with Dice scores of 79.33%, 83.14%, and 90.16% for enhancing tumor, tumor core, and whole tumor, respectively. Highly meaningful NMF components give an additional interpretability advantage to Factorizers over CNNs and Transformers. Moreover, our ablation studies reveal a distinctive feature of Factorizers that enables a significant speed-up in inference for a trained Factorizer without any extra steps and without sacrificing much accuracy.
Abstract（参考訳）: U字型アーキテクチャを用いた畳み込みニューラルネットワーク(CNN)は,様々な臨床目的に欠かせない医療画像セグメンテーションを支配している。しかし、畳み込みの固有の局所性により、cnnは脳病変のようないくつかの構造をよりよく認識するために必要となるグローバルコンテキストを完全に活用できない。トランスフォーマーは最近、セマンティックセグメンテーションを含む視覚タスクにおける有望なパフォーマンスを証明した。それでも、注意の二次的な複雑さにより、既存のTransformerベースのモデルは、画像解像度を何らかの方法で削減した後にのみ、自己注意層を使用する。そこで本研究では,エンド・ツー・エンドのセグメンテーションモデルを構築するために,低ランク行列分解のパワーを活用したファクタライザと呼ばれるモデル群を導入する。具体的には,非負行列分解(nmf)をu字型アーキテクチャに組み込んだ微分可能な層として定式化する,線形にスケーラブルなコンテキストモデリング手法を提案する。シフトウインドウ技術はNMFと組み合わせてローカル情報を効果的に集約する。因子化剤は、正確性、拡張性、解釈性の観点からcnnやトランスフォーマーと有利に競合し、脳腫瘍セグメンテーションのためのbratsデータセットで最新結果を達成し、それぞれ79.33%、83.14%、および90.16%のdiceスコアで腫瘍、腫瘍コア、および全腫瘍を増強する。非常に有意義なNMFコンポーネントは、CNNやTransformerよりもFactizerにさらなる解釈可能性の優位性を与える。さらに, アブレーション研究により, 追加のステップを要せず, 精度を犠牲にすることなく, 訓練された因子化器の推論を大幅に高速化できる因子化器の特徴が明らかになった。

関連論文リスト

MetaFormer-driven Encoding Network for Robust Medical Semantic Segmentation [0.0]
本稿では,U-Netバックボーンの符号化フェーズにMetaFormerを組み込んだ,効率的な医用画像分割フレームワークであるMFEnNetを提案する。自己注意に伴う計算コストを大幅に軽減するため,従来の変圧器モジュールをプール変圧器ブロックに置き換えた。医学セグメンテーションのベンチマークに関する総合的な実験は、提案されたMFEnNetアプローチが、最先端のモデルと比較して計算コストを大幅に下げながら、競争精度を向上することを示した。
論文参考訳（メタデータ） (2026-01-01T13:45:50Z)
EfficientGFormer: Multimodal Brain Tumor Segmentation via Pruned Graph-Augmented Transformer [0.0]
EfficientGFormerは、事前訓練された基礎モデルとグラフベースの推論を統合する新しいアーキテクチャである。 MSD Task01とBraTS 2021データセットの実験は、EfficientGFormerがメモリと推論時間を著しく削減して最先端の精度を達成することを示した。
論文参考訳（メタデータ） (2025-08-02T18:52:59Z)
Do We Really Need GNNs with Explicit Structural Modeling? MLPs Suffice for Language Model Representations [50.45261187796993]
グラフニューラルネットワーク(GNN)は構造情報を十分に活用できないが、MLP(Multi-Layer Perceptrons)は構造認識タスクにおいて驚くべき能力を示す。本稿では,情報理論の観点から総合的な探索フレームワークを提案する。
論文参考訳（メタデータ） (2025-06-26T18:10:28Z)
Multi-encoder nnU-Net outperforms Transformer models with self-supervised pretraining [0.0]
本研究は, 医用画像の解剖学的構造と病理的領域の自動同定と記述を含む, 医用画像セグメンテーションの課題に対処するものである。本稿では,複数のMRIモダリティを別個のエンコーダで独立に処理するために設計された,自己教師型学習用マルチエンコーダnnU-Netアーキテクチャを提案する。我々のマルチエンコーダnnU-Netは、Vanilla nnU-Net、SegResNet、Swin UNETRといった他のモデルを上回る93.72%のDice similarity Coefficient(DSC)を達成し、例外的な性能を示す。
論文参考訳（メタデータ） (2025-04-04T14:31:06Z)
Multi-Granularity Vision Fastformer with Fusion Mechanism for Skin Lesion Segmentation [7.944123371140182]
本研究の目的は,計算コストと長期依存性モデリングのバランスを最適化することである。 We propose a lightweight U-shape network that using Vision Fastformer with Fusion Mechanism (VFFM-UNet)。
論文参考訳（メタデータ） (2025-04-04T01:27:43Z)
MambaClinix: Hierarchical Gated Convolution and Mamba-Based U-Net for Enhanced 3D Medical Image Segmentation [6.673169053236727]
医用画像分割のための新しいU字型アーキテクチャであるMambaClinixを提案する。 MambaClinixは、階層的なゲート畳み込みネットワークとMambaを適応的なステージワイドフレームワークに統合する。以上の結果から,MambaClinixは低モデルの複雑さを維持しつつ高いセグメンテーション精度を達成できることが示唆された。
論文参考訳（メタデータ） (2024-09-19T07:51:14Z)
CNN-Transformer Rectified Collaborative Learning for Medical Image Segmentation [60.08541107831459]
本稿では,医用画像セグメンテーションのための強力なCNNベースモデルとトランスフォーマーベースモデルを学習するための,CNN-Transformer修正協調学習フレームワークを提案する。具体的には,学生ソフトラベルの誤り領域を適応的に選択・修正する基礎的真理を取り入れた修正ロジット・ワイド・コラボレーティブ・ラーニング(RLCL)戦略を提案する。また,機能空間におけるCNNベースモデルとTransformerベースモデル間の効果的な知識伝達を実現するために,クラス認識型特徴量協調学習(CFCL)戦略を提案する。
論文参考訳（メタデータ） (2024-08-25T01:27:35Z)
CSWin-UNet: Transformer UNet with Cross-Shaped Windows for Medical Image Segmentation [22.645013853519]
CSWin-UNetは,CSWinの自己保持機構をUNetに組み込んだ,U字型のセグメンテーション手法である。シナプス多臓器CT, 心臓MRI, 皮膚病変など多種多様なデータセットに対する経験的評価は, CSWin-UNetは高いセグメンテーション精度を達成しつつ, 低モデルの複雑さを維持していることを示している。
論文参考訳（メタデータ） (2024-07-25T14:25:17Z)
Flattening Singular Values of Factorized Convolution for Medical Images [2.41019965808244]
畳み込みニューラルネットワーク(CNN)は、長い間、堅牢な医療画像処理(MIP)のパラダイムとして選択されてきた。多くの方法は、限られた計算資源の負担を軽減するために、分解された畳み込み層を用いる。 MIPモデルにおける因子化畳み込みの表現力を向上させるために,Singular value equalization generalizer-induced Factorized Convolution (SFConv)を提案する。
論文参考訳（メタデータ） (2024-03-01T15:30:50Z)
SeUNet-Trans: A Simple yet Effective UNet-Transformer Model for Medical Image Segmentation [0.0]
医用画像セグメンテーションのためのシンプルなUNet-Transformer(seUNet-Trans)モデルを提案する。提案手法では,UNetモデルを特徴抽出器として設計し,入力画像から複数の特徴マップを生成する。 UNetアーキテクチャと自己認識機構を活用することで、我々のモデルはローカルとグローバルの両方のコンテキスト情報を保存するだけでなく、入力要素間の長距離依存関係をキャプチャできる。
論文参考訳（メタデータ） (2023-10-16T01:13:38Z)
AMIGO: Sparse Multi-Modal Graph Transformer with Shared-Context Processing for Representation Learning of Giga-pixel Images [53.29794593104923]
本稿では,スライド病理像全体に対する共有コンテキスト処理の新たな概念を提案する。 AMIGOは、組織内のセルラーグラフを使用して、患者に単一の表現を提供する。我々のモデルは、データの20%以下で同じ性能を達成できる程度に、欠落した情報に対して強い堅牢性を示す。
論文参考訳（メタデータ） (2023-03-01T23:37:45Z)
Cross-receptive Focused Inference Network for Lightweight Image Super-Resolution [64.25751738088015]
トランスフォーマーに基づく手法は、単一画像超解像(SISR)タスクにおいて顕著な性能を示した。動的に特徴を抽出するために文脈情報を組み込む必要がある変換器は無視される。我々は,CNNとTransformerを混合したCTブロックのカスケードで構成される,軽量なクロスレセプティブ・フォーカスド・推論・ネットワーク(CFIN)を提案する。
論文参考訳（メタデータ） (2022-07-06T16:32:29Z)
MISSU: 3D Medical Image Segmentation via Self-distilling TransUNet [55.16833099336073]
医用画像セグメンテーションのためのトランスフォーマーベースUNetを提案する。グローバルな意味情報と局所的な空間的詳細特徴を同時に学習する。 MISSUは従来の最先端手法よりも優れた性能を発揮する。
論文参考訳（メタデータ） (2022-06-02T07:38:53Z)
CSformer: Bridging Convolution and Transformer for Compressive Sensing [65.22377493627687]
本稿では,CNNからの詳細な空間情報を活用するためのハイブリッドフレームワークと,表現学習の強化を目的としたトランスフォーマーが提供するグローバルコンテキストを統合することを提案する。提案手法は、適応的なサンプリングとリカバリからなるエンドツーエンドの圧縮画像センシング手法である。実験により, 圧縮センシングにおける専用トランスアーキテクチャの有効性が示された。
論文参考訳（メタデータ） (2021-12-31T04:37:11Z)
TransUNet: Transformers Make Strong Encoders for Medical Image Segmentation [78.01570371790669]
医用画像のセグメンテーションは医療システムの開発に必須の前提条件である。様々な医療画像セグメンテーションタスクにおいて、U-Netとして知られるu字型アーキテクチャがデファクトスタンダードとなっている。医用画像セグメンテーションの強力な代替手段として,トランスフォーマーとU-Netの両方を有効活用するTransUNetを提案する。
論文参考訳（メタデータ） (2021-02-08T16:10:50Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。