論文の概要: TM-UNet: Token-Memory Enhanced Sequential Modeling for Efficient Medical Image Segmentation
- arxiv url: http://arxiv.org/abs/2511.12270v1
- Date: Sat, 15 Nov 2025 15:49:30 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-11-18 14:36:23.792059
- Title: TM-UNet: Token-Memory Enhanced Sequential Modeling for Efficient Medical Image Segmentation
- Title(参考訳): TM-UNet:効率的な医用画像分割のためのToken-Memory拡張シーケンスモデリング
- Authors: Yaxuan Jiao, Qing Xu, Yuxiang Luo, Xiangjian He, Zhen Chen, Wenting Duan,
- Abstract要約: TM-UNetは、トークンシーケンスモデリングと効率的な医療セグメント化のための効率的なメモリメカニズムを統合する、新しい軽量フレームワークである。
我々のMSTMブロックは、線形複雑度で長距離依存関係をキャプチャする動的知識ストアとして機能する。
広範な実験により、TM-UNetは、計算コストを大幅に削減し、様々な医学的セグメンテーションタスクにまたがる最先端の手法より優れていることが示された。
- 参考スコア(独自算出の注目度): 8.178014138307288
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Medical image segmentation is essential for clinical diagnosis and treatment planning. Although transformer-based methods have achieved remarkable results, their high computational cost hinders clinical deployment. To address this issue, we propose TM-UNet, a novel lightweight framework that integrates token sequence modeling with an efficient memory mechanism for efficient medical segmentation. Specifically, we introduce a multi-scale token-memory (MSTM) block that transforms 2D spatial features into token sequences through strategic spatial scanning, leveraging matrix memory cells to selectively retain and propagate discriminative contextual information across tokens. This novel token-memory mechanism acts as a dynamic knowledge store that captures long-range dependencies with linear complexity, enabling efficient global reasoning without redundant computation. Our MSTM block further incorporates exponential gating to identify token effectiveness and multi-scale contextual extraction via parallel pooling operations, enabling hierarchical representation learning without computational overhead. Extensive experiments demonstrate that TM-UNet outperforms state-of-the-art methods across diverse medical segmentation tasks with substantially reduced computation cost. The code is available at https://github.com/xq141839/TM-UNet.
- Abstract(参考訳): 医用画像分割は臨床診断と治療計画に不可欠である。
トランスフォーマーベースの手法は目覚ましい結果を得たが、その高い計算コストは臨床展開を妨げている。
この問題に対処するために,トークンシーケンスモデリングと効率的なメモリ機構を統合し,効率的な医用セグメンテーションを実現する,新しい軽量フレームワークTM-UNetを提案する。
具体的には、2次元空間特徴を戦略的空間走査によりトークンシーケンスに変換するマルチスケールトークンメモリ(MSTM)ブロックを導入し、行列メモリセルを利用してトークン間の識別的コンテキスト情報を選択的に保持・伝播する。
この新しいトークンメモリ機構は、線形複雑度で長距離依存関係をキャプチャする動的知識ストアとして機能し、冗長計算なしで効率的なグローバル推論を可能にする。
我々のMSTMブロックはさらに指数的ゲーティングを導入し、トークンの有効性と並列プーリング操作によるマルチスケールコンテキスト抽出を実現し、計算オーバーヘッドを伴わずに階層的表現学習を可能にした。
広範な実験により、TM-UNetは、計算コストを大幅に削減し、様々な医学的セグメンテーションタスクにまたがる最先端の手法より優れていることが示された。
コードはhttps://github.com/xq141839/TM-UNetで公開されている。
関連論文リスト
- EfficientGFormer: Multimodal Brain Tumor Segmentation via Pruned Graph-Augmented Transformer [0.0]
EfficientGFormerは、事前訓練された基礎モデルとグラフベースの推論を統合する新しいアーキテクチャである。
MSD Task01とBraTS 2021データセットの実験は、EfficientGFormerがメモリと推論時間を著しく削減して最先端の精度を達成することを示した。
論文 参考訳(メタデータ) (2025-08-02T18:52:59Z) - Prompt-based Dynamic Token Pruning for Efficient Segmentation of Medical Images [1.4146420810689422]
本研究では, セグメンテーションパイプラインにおける無関係トークンの処理を選択的に削減する, Prompt-driven Adaptive Token pruning法を提案する。
実験の結果,35-55%のトークンを$sim$で還元し,ベースラインに対する計算コストを低減した。
論文 参考訳(メタデータ) (2025-06-19T14:45:46Z) - InceptionMamba: Efficient Multi-Stage Feature Enhancement with Selective State Space Model for Microscopic Medical Image Segmentation [15.666926528144202]
InceptionMambaという,多段階のリッチな機能をエンコードするセグメンテーションタスクのための効率的なフレームワークを提案する。
我々は,低周波領域と高周波領域の両方を捕捉し,多段特徴を豊かにするためにセマンティック・キューを利用する。
本モデルでは,2つの挑戦的微視的セグメンテーションデータセットに対して,最先端の性能を実現する。
論文 参考訳(メタデータ) (2025-06-13T20:25:12Z) - Heterogenous Memory Augmented Neural Networks [84.29338268789684]
ニューラルネットワークのための新しいヘテロジニアスメモリ拡張手法を提案する。
学習可能なメモリトークンをアテンション機構付きで導入することにより、膨大な計算オーバーヘッドを伴わずに性能を効果的に向上させることができる。
In-distriion (ID) と Out-of-distriion (OOD) の両方の条件下での様々な画像およびグラフベースのタスクに対するアプローチを示す。
論文 参考訳(メタデータ) (2023-10-17T01:05:28Z) - Self-Supervised Neuron Segmentation with Multi-Agent Reinforcement
Learning [53.00683059396803]
マスク画像モデル(MIM)は,マスク画像から元の情報を復元する簡便さと有効性から広く利用されている。
本稿では、強化学習(RL)を利用して最適な画像マスキング比とマスキング戦略を自動検索する決定に基づくMIMを提案する。
本手法は,ニューロン分節の課題において,代替自己監督法に対して有意な優位性を有する。
論文 参考訳(メタデータ) (2023-10-06T10:40:46Z) - UNETR++: Delving into Efficient and Accurate 3D Medical Image Segmentation [93.88170217725805]
本稿では,高画質なセグメンテーションマスクと,パラメータ,計算コスト,推論速度の両面での効率性を提供するUNETR++という3次元医用画像セグメンテーション手法を提案する。
我々の設計の核となるのは、空間的およびチャネル的な識別的特徴を効率的に学習する、新しい効率的な対注意ブロック(EPA)の導入である。
Synapse, BTCV, ACDC, BRaTs, Decathlon-Lungの5つのベンチマークで評価した結果, 効率と精度の両面で, コントリビューションの有効性が示された。
論文 参考訳(メタデータ) (2022-12-08T18:59:57Z) - Cross-Modality Deep Feature Learning for Brain Tumor Segmentation [158.8192041981564]
本稿では, マルチモーダルMRIデータから脳腫瘍を抽出するクロスモーダルディープ・フィーチャーラーニング・フレームワークを提案する。
中心となる考え方は、不十分なデータスケールを補うために、マルチモダリティデータにまたがる豊富なパターンをマイニングすることだ。
on the BraTS benchmarks, this proposed cross-modality deep feature learning framework could effective improve the brain tumor segmentation performance。
論文 参考訳(メタデータ) (2022-01-07T07:46:01Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。