論文の概要: Tetrahedron-Net for Medical Image Registration
- arxiv url: http://arxiv.org/abs/2505.04380v1
- Date: Wed, 07 May 2025 13:00:49 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-05-08 19:07:36.076877
- Title: Tetrahedron-Net for Medical Image Registration
- Title(参考訳): 医用画像登録のためのTetrahedron-Net
- Authors: Jinhai Xiang, Shuai Guo, Qianru Han, Dantong Shi, Xinwei He, Xiang Bai,
- Abstract要約: 1つのデコーダを追加することで、登録のための表現を強化するためのシンプルで効果的な戦略を導入する。
新しいアーキテクチャは簡潔だが一般化されており、1つのエンコーダと2つのデコーダのみがテトラエドロンの構造を形成する。
本実験は, 医用画像登録の代表的なベンチマークにおいて, 優れた性能が得られることを示すものである。
- 参考スコア(独自算出の注目度): 44.070676207684954
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Medical image registration plays a vital role in medical image processing. Extracting expressive representations for medical images is crucial for improving the registration quality. One common practice for this end is constructing a convolutional backbone to enable interactions with skip connections among feature extraction layers. The de facto structure, U-Net-like networks, has attempted to design skip connections such as nested or full-scale ones to connect one single encoder and one single decoder to improve its representation capacity. Despite being effective, it still does not fully explore interactions with a single encoder and decoder architectures. In this paper, we embrace this observation and introduce a simple yet effective alternative strategy to enhance the representations for registrations by appending one additional decoder. The new decoder is designed to interact with both the original encoder and decoder. In this way, it not only reuses feature presentation from corresponding layers in the encoder but also interacts with the original decoder to corporately give more accurate registration results. The new architecture is concise yet generalized, with only one encoder and two decoders forming a ``Tetrahedron'' structure, thereby dubbed Tetrahedron-Net. Three instantiations of Tetrahedron-Net are further constructed regarding the different structures of the appended decoder. Our extensive experiments prove that superior performance can be obtained on several representative benchmarks of medical image registration. Finally, such a ``Tetrahedron'' design can also be easily integrated into popular U-Net-like architectures including VoxelMorph, ViT-V-Net, and TransMorph, leading to consistent performance gains.
- Abstract(参考訳): 医用画像登録は、医用画像処理において重要な役割を担っている。
医用画像の表現表現の抽出は, 登録品質の向上に不可欠である。
この目的のための一般的なプラクティスの1つは、特徴抽出層間のスキップ接続とのインタラクションを可能にする、畳み込みバックボーンの構築である。
事実上のネットワークであるU-Netのようなネットワークは、ネストやフルスケールのようなスキップ接続を設計し、1つのエンコーダと1つのデコーダを接続して表現能力を向上させる。
効果的であるにもかかわらず、単一のエンコーダとデコーダアーキテクチャとのインタラクションを完全には探索していない。
本稿では、この観測を取り入れ、さらに1つのデコーダを追加することで、登録のための表現を強化するための、シンプルで効果的な代替戦略を導入する。
新しいデコーダは、元のエンコーダとデコーダの両方と相互作用するように設計されている。
このように、エンコーダ内の対応するレイヤからフィーチャープレゼンテーションを再利用するだけでなく、元のデコーダと対話して、より正確な登録結果を提供する。
新しいアーキテクチャは簡潔だが一般化されており、エンコーダは1つとデコーダが2つしかなく、「テトラエドロン」構造を形成しており、テトラエドロンネットと呼ばれている。
Tetrahedron-Netの3つのインスタンス化は、付加されたデコーダの異なる構造に関してさらに構成されている。
本研究は, 医用画像登録の代表的なベンチマークにおいて, 優れた性能が得られることを示すものである。
設計はVoxelMorph、ViT-V-Net、TransMorphなどの一般的なU-Netアーキテクチャにも容易に統合でき、一貫したパフォーマンス向上をもたらす。
関連論文リスト
- Deformable Image Registration with Multi-scale Feature Fusion from Shared Encoder, Auxiliary and Pyramid Decoders [2.6089354079273512]
教師なし画像登録のための新しい変形可能な畳み込みピラミッドネットワークを提案する。
提案するネットワークは、画像ペア用の共有補助デコーダを追加することにより、従来のピラミッドネットワークを強化する。
以上の結果から, 高い登録精度を達成し, 円滑かつ可塑性変形を維持しつつ, 複雑な変形を捉えることが可能であることが示唆された。
論文 参考訳(メタデータ) (2024-08-11T08:02:28Z) - Decoder-Only Image Registration [6.956962783406289]
教師なしの医用画像登録では、エンコーダ-デコーダネットワークアーキテクチャの利用が主なアプローチである。
本稿では,学習可能なデコーダのみを含むLessNetを提案する。
我々のデコーダのみのLessNetは、VoxelMorphやTransMorphのような最先端のメソッドに匹敵する登録性能を得ることができる。
論文 参考訳(メタデータ) (2024-02-05T23:30:37Z) - More complex encoder is not all you need [0.882348769487259]
我々は,強力なデコーダを構築するために,新しいサブピクセル・コンボリューションを組み込んだneU-Net(複雑なエンコーダではないU-Net)を導入する。
我々のモデル設計は、SynapseとACDCの両方のデータセット上で、最先端の手法を上回る優れた結果が得られる。
論文 参考訳(メタデータ) (2023-09-20T08:34:38Z) - VNVC: A Versatile Neural Video Coding Framework for Efficient
Human-Machine Vision [59.632286735304156]
コード化された表現をピクセルに復号することなく直接拡張・解析することがより効率的である。
再構成と直接拡張/分析の両方をサポートするために,コンパクト表現の学習を目標とする汎用型ニューラルビデオ符号化(VNVC)フレームワークを提案する。
論文 参考訳(メタデータ) (2023-06-19T03:04:57Z) - SoftPool++: An Encoder-Decoder Network for Point Cloud Completion [93.54286830844134]
本稿では,ポイントクラウド完了作業のための新しい畳み込み演算子を提案する。
提案した演算子は、最大プールやボキセル化操作を一切必要としない。
提案手法は,低解像度・高解像度の形状仕上げにおける最先端性能を実現する。
論文 参考訳(メタデータ) (2022-05-08T15:31:36Z) - Dynamic Neural Representational Decoders for High-Resolution Semantic
Segmentation [98.05643473345474]
動的ニューラル表現デコーダ(NRD)と呼ばれる新しいデコーダを提案する。
エンコーダの出力上の各位置がセマンティックラベルの局所的なパッチに対応するので、この研究では、これらの局所的なパッチをコンパクトなニューラルネットワークで表現する。
このニューラル表現により、意味ラベル空間に先行する滑らかさを活用することができ、デコーダをより効率的にすることができる。
論文 参考訳(メタデータ) (2021-07-30T04:50:56Z) - Crosslink-Net: Double-branch Encoder Segmentation Network via Fusing
Vertical and Horizontal Convolutions [58.71117402626524]
医用画像分割のための新しいダブルブランチエンコーダアーキテクチャを提案する。
1)正方形畳み込みカーネルによる特徴の識別をさらに改善する必要があるため,非正方形および水平畳み込みカーネルの利用を提案する。
実験では,4つのデータセット上でのモデルの有効性を検証した。
論文 参考訳(メタデータ) (2021-07-24T02:58:32Z) - Beyond Single Stage Encoder-Decoder Networks: Deep Decoders for Semantic
Image Segmentation [56.44853893149365]
セマンティックセグメンテーションのための単一エンコーダ-デコーダ手法は、セマンティックセグメンテーションの品質とレイヤー数あたりの効率の観点からピークに達している。
そこで本研究では,より多くの情報コンテンツを取得するために,浅層ネットワークの集合を用いたデコーダに基づく新しいアーキテクチャを提案する。
アーキテクチャをさらに改善するために,ネットワークの注目度を高めるために,クラスの再バランスを目的とした重み関数を導入する。
論文 参考訳(メタデータ) (2020-07-19T18:44:34Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。