論文の概要: DTC: A Deformable Transposed Convolution Module for Medical Image Segmentation
- arxiv url: http://arxiv.org/abs/2601.17939v1
- Date: Sun, 25 Jan 2026 18:33:51 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-01-27 15:23:08.552066
- Title: DTC: A Deformable Transposed Convolution Module for Medical Image Segmentation
- Title(参考訳): DTC:医療画像セグメンテーションのための変形可能なトランスフォーメーション・コンボリューションモジュール
- Authors: Chengkun Sun, Jinqian Pan, Renjie Liang, Zhengkang Fan, Xin Miao, Jiang Bian, Jie Xu,
- Abstract要約: 本稿では,動的座標を学習して高分解能特徴写像を生成する新しいアップサンプリング手法であるDeformable Transposed Convolution (DTC)を提案する。
DTCは、既存の医用画像セグメンテーションモデルに効果的に統合することができ、デコーダの機能再構成と詳細回復能力を一貫して改善することができる。
- 参考スコア(独自算出の注目度): 16.78785887135973
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: In medical image segmentation, particularly in UNet-like architectures, upsampling is primarily used to transform smaller feature maps into larger ones, enabling feature fusion between encoder and decoder features and supporting multi-scale prediction. Conventional upsampling methods, such as transposed convolution and linear interpolation, operate on fixed positions: transposed convolution applies kernel elements to predetermined pixel or voxel locations, while linear interpolation assigns values based on fixed coordinates in the original feature map. These fixed-position approaches may fail to capture structural information beyond predefined sampling positions and can lead to artifacts or loss of detail. Inspired by deformable convolutions, we propose a novel upsampling method, Deformable Transposed Convolution (DTC), which learns dynamic coordinates (i.e., sampling positions) to generate high-resolution feature maps for both 2D and 3D medical image segmentation tasks. Experiments on 3D (e.g., BTCV15) and 2D datasets (e.g., ISIC18, BUSI) demonstrate that DTC can be effectively integrated into existing medical image segmentation models, consistently improving the decoder's feature reconstruction and detail recovery capability.
- Abstract(参考訳): 医用画像のセグメンテーション、特にUNetのようなアーキテクチャでは、アップサンプリングは主に小さな特徴マップを大きなものに変換するために使われ、エンコーダとデコーダの機能を融合させ、マルチスケールの予測をサポートする。
転位畳み込み(transposed convolution)や線形補間(lineline interpolation)のような従来のアップサンプリング法は、固定された位置で動作する: 転位畳み込み(transposed convolution)は、所定のピクセルやボクセルの位置にカーネル要素を適用し、一方、線形補間は元の特徴写像の固定座標に基づいて値を割り当てる。
これらの固定配置アプローチは、事前に定義されたサンプリング位置以上の構造情報をキャプチャできず、アーティファクトや詳細の喪失につながる可能性がある。
変形可能な畳み込みにインスパイアされた新しいアップサンプリング手法であるDeformable Transposed Convolution (DTC)を提案し、動的座標(サンプリング位置)を学習し、2次元および3次元の医用画像セグメンテーションタスクの高分解能特徴写像を生成する。
3D(e , BTCV15)と2Dデータセット(e , ISIC18, BUSI)の実験では、DTCが既存の医用画像セグメンテーションモデルに効果的に統合され、デコーダの特徴再構成と詳細回復能力が一貫して改善されていることが示されている。
関連論文リスト
- Joint Semantic and Rendering Enhancements in 3D Gaussian Modeling with Anisotropic Local Encoding [86.55824709875598]
本稿では,セマンティックとレンダリングの両方を相乗化する3次元セマンティックガウスモデリングのための統合拡張フレームワークを提案する。
従来の点雲形状符号化とは異なり、細粒度3次元形状を捉えるために異方性3次元ガウシアン・チェビシェフ記述子を導入する。
我々は、学習した形状パターンを継続的に更新するために、クロスシーンの知識伝達モジュールを使用し、より高速な収束と堅牢な表現を可能にします。
論文 参考訳(メタデータ) (2026-01-05T18:33:50Z) - MOSformer: Momentum encoder-based inter-slice fusion transformer for medical image segmentation [10.17757702972375]
この問題を解決するために,新しいモーメントエンコーダを用いたスライス間核融合トランス (MOSformer) を提案する。
MOSformerは3つのベンチマークデータセット(Synapse、ACDC、AMOS)で評価され、それぞれ85.63%、92.19%、85.43%の新たな最先端のDSCを実現している。
論文 参考訳(メタデータ) (2024-01-22T11:25:59Z) - Dual-scale Enhanced and Cross-generative Consistency Learning for Semi-supervised Medical Image Segmentation [49.57907601086494]
医用画像のセグメンテーションはコンピュータ支援診断において重要な役割を担っている。
半教師型医用画像(DEC-Seg)のための新しいDual-scale Enhanced and Cross-generative consistency learning frameworkを提案する。
論文 参考訳(メタデータ) (2023-12-26T12:56:31Z) - MIST: Medical Image Segmentation Transformer with Convolutional
Attention Mixing (CAM) Decoder [0.0]
本稿では,CAMデコーダを組み込んだ医用画像変換器(MIST)を提案する。
MISTには2つの部分がある: 事前訓練された多軸視覚変換器(MaxViT)をエンコーダとして使用し、符号化された特徴表現をCAMデコーダに渡して画像のセグメンテーションを行う。
空間情報ゲインを高めるため、特徴抽出及び受容野拡大に深部及び浅部畳み込みを用いる。
論文 参考訳(メタデータ) (2023-10-30T18:07:57Z) - MISSU: 3D Medical Image Segmentation via Self-distilling TransUNet [55.16833099336073]
医用画像セグメンテーションのためのトランスフォーマーベースUNetを提案する。
グローバルな意味情報と局所的な空間的詳細特徴を同時に学習する。
MISSUは従来の最先端手法よりも優れた性能を発揮する。
論文 参考訳(メタデータ) (2022-06-02T07:38:53Z) - Two-Stream Graph Convolutional Network for Intra-oral Scanner Image
Segmentation [133.02190910009384]
本稿では,2ストリームグラフ畳み込みネットワーク(TSGCN)を提案する。
TSGCNは3次元歯(表面)セグメンテーションにおいて最先端の方法よりも優れています。
論文 参考訳(メタデータ) (2022-04-19T10:41:09Z) - AFTer-UNet: Axial Fusion Transformer UNet for Medical Image Segmentation [19.53151547706724]
トランスをベースとしたモデルは、医療画像セグメンテーションにおけるこれらの手法の探求に注目されている。
本稿では、畳み込み層の長周期モデリングにおける詳細特徴抽出能力と変圧器強度の両面を活かしたAxial Fusion Transformer UNet(AFTer-UNet)を提案する。
パラメータが少なく、GPUメモリのトレーニングも従来のトランスフォーマーベースのモデルよりも少ない。
論文 参考訳(メタデータ) (2021-10-20T06:47:28Z) - CoTr: Efficiently Bridging CNN and Transformer for 3D Medical Image
Segmentation [95.51455777713092]
畳み込みニューラルネットワーク(CNN)は、現代の3D医療画像セグメンテーションのデファクトスタンダードとなっている。
本稿では,bf畳み込みニューラルネットワークとbfトランスbf(cotr)を効率良く橋渡しし,正確な3次元医用画像分割を実現する新しい枠組みを提案する。
論文 参考訳(メタデータ) (2021-03-04T13:34:22Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。