論文の概要: Deformable Image Registration with Multi-scale Feature Fusion from Shared Encoder, Auxiliary and Pyramid Decoders
- arxiv url: http://arxiv.org/abs/2408.05717v1
- Date: Sun, 11 Aug 2024 08:02:28 GMT
- ステータス: 処理完了
- システム内更新日: 2024-08-13 15:57:51.943914
- Title: Deformable Image Registration with Multi-scale Feature Fusion from Shared Encoder, Auxiliary and Pyramid Decoders
- Title(参考訳): 共有エンコーダ,補助デコーダ,ピラミッドデコーダからのマルチスケール特徴フュージョンによる変形可能な画像登録
- Authors: Hongchao Zhou, Shunbo Hu,
- Abstract要約: 教師なし画像登録のための新しい変形可能な畳み込みピラミッドネットワークを提案する。
提案するネットワークは、画像ペア用の共有補助デコーダを追加することにより、従来のピラミッドネットワークを強化する。
以上の結果から, 高い登録精度を達成し, 円滑かつ可塑性変形を維持しつつ, 複雑な変形を捉えることが可能であることが示唆された。
- 参考スコア(独自算出の注目度): 2.6089354079273512
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: In this work, we propose a novel deformable convolutional pyramid network for unsupervised image registration. Specifically, the proposed network enhances the traditional pyramid network by adding an additional shared auxiliary decoder for image pairs. This decoder provides multi-scale high-level feature information from unblended image pairs for the registration task. During the registration process, we also design a multi-scale feature fusion block to extract the most beneficial features for the registration task from both global and local contexts. Validation results indicate that this method can capture complex deformations while achieving higher registration accuracy and maintaining smooth and plausible deformations.
- Abstract(参考訳): 本研究では,教師なし画像登録のための新しい変形可能な畳み込みピラミッドネットワークを提案する。
具体的には、画像ペアのための共有補助デコーダを追加することにより、従来のピラミッドネットワークを強化する。
このデコーダは、登録タスク用の未訳画像対からマルチスケールの高レベル特徴情報を提供する。
登録プロセス中、グローバルおよびローカルの両方のコンテキストから、登録タスクの最も有益な特徴を抽出するために、マルチスケールの機能融合ブロックを設計する。
以上の結果から, 高い登録精度を達成し, 円滑かつ可塑性変形を維持しつつ, 複雑な変形を捉えることが可能であることが示唆された。
関連論文リスト
- StitchFusion: Weaving Any Visual Modalities to Enhance Multimodal Semantic Segmentation [63.31007867379312]
我々は,大規模な事前学習モデルを直接エンコーダや機能フューザとして統合するフレームワークであるStitchFusionを提案する。
我々は,エンコーディング中に多方向アダプタモジュール(MultiAdapter)を導入し,モーダル間情報転送を実現する。
本モデルは,最小限の追加パラメータを持つ4つのマルチモーダルセグメンテーションデータセット上での最先端性能を実現する。
論文 参考訳(メタデータ) (2024-08-02T15:41:16Z) - BusReF: Infrared-Visible images registration and fusion focus on
reconstructible area using one set of features [39.575353043949725]
マルチモーダルカメラが連携するシナリオでは、非アライメント画像を扱う際の問題は回避できない。
既存の画像融合アルゴリズムは、より正確な融合結果を得るために、厳密に登録された入力画像対に大きく依存している。
本稿では,BusRefと呼ばれる単一のフレームワークにおける画像登録と融合の問題に対処することを目的とする。
論文 参考訳(メタデータ) (2023-12-30T17:32:44Z) - Improving Misaligned Multi-modality Image Fusion with One-stage
Progressive Dense Registration [67.23451452670282]
多モード画像間の相違は、画像融合の課題を引き起こす。
マルチスケールプログレッシブ・センス・レジストレーション方式を提案する。
このスキームは、一段階最適化のみで粗大な登録を行う。
論文 参考訳(メタデータ) (2023-08-22T03:46:24Z) - Laplacian Pyramid-like Autoencoder [0.0]
我々は,信号処理における画像解析に広く用いられているラプラシアンピラミッド (LP) の概念を付加することにより,ラプラシアンピラミッドライクオートエンコーダ (LPAE) を開発した。
LPAEを用いて分類と超解像領域の実験を行った。
論文 参考訳(メタデータ) (2022-08-26T07:45:06Z) - CM-GAN: Image Inpainting with Cascaded Modulation GAN and Object-Aware
Training [112.96224800952724]
複雑な画像に大きな穴をあける際の可視像構造を生成するためのカスケード変調GAN(CM-GAN)を提案する。
各デコーダブロックにおいて、まず大域変調を適用し、粗い意味認識合成構造を行い、次に大域変調の出力に空間変調を適用し、空間適応的に特徴写像を更に調整する。
さらに,ネットワークがホール内の新たな物体を幻覚させるのを防ぐため,実世界のシナリオにおける物体除去タスクのニーズを満たすために,オブジェクト認識型トレーニングスキームを設計する。
論文 参考訳(メタデータ) (2022-03-22T16:13:27Z) - Learnable Fourier Features for Multi-DimensionalSpatial Positional
Encoding [96.9752763607738]
本稿では,学習可能なフーリエ特徴に基づく位置符号化手法を提案する。
本研究では,多次元位置符号化のための学習可能な特徴表現が既存の手法より優れていることを示す。
論文 参考訳(メタデータ) (2021-06-05T04:40:18Z) - Attention-Based Multimodal Image Matching [16.335191345543063]
本稿では,Transformerエンコーダを用いたマルチモーダル画像パッチマッチングのためのアテンションベースアプローチを提案する。
このエンコーダは,タスク固有の外見不変のイメージキューを強調しつつ,マルチスケールな画像埋め込みを効率的に集約する。
これはTransformerエンコーダアーキテクチャをマルチモーダル画像パッチマッチングタスクに実装した最初の成功例である。
論文 参考訳(メタデータ) (2021-03-20T21:14:24Z) - Cascaded Feature Warping Network for Unsupervised Medical Image
Registration [11.052668687673998]
我々は,細部まで粗い登録を行うために,カスケード特徴ウォーピングネットワークを事前に設定する。
共有重みエンコーダネットワークを採用し、不整合画像の特徴ピラミッドを生成する。
その結果,本手法は最先端手法よりも優れていた。
論文 参考訳(メタデータ) (2021-03-15T08:50:06Z) - TransUNet: Transformers Make Strong Encoders for Medical Image
Segmentation [78.01570371790669]
医用画像のセグメンテーションは医療システムの開発に必須の前提条件である。
様々な医療画像セグメンテーションタスクにおいて、U-Netとして知られるu字型アーキテクチャがデファクトスタンダードとなっている。
医用画像セグメンテーションの強力な代替手段として,トランスフォーマーとU-Netの両方を有効活用するTransUNetを提案する。
論文 参考訳(メタデータ) (2021-02-08T16:10:50Z) - Free-Form Image Inpainting via Contrastive Attention Network [64.05544199212831]
画像の塗装作業では、複雑なパターンを形成する画像のどこにでも、どんな形でもマスクが現れる。
エンコーダはこの複雑な状況下でこのような強力な表現を捕捉することは困難である。
本稿では,ロバスト性と一般化性を改善するための自己教師型シームズ推論ネットワークを提案する。
論文 参考訳(メタデータ) (2020-10-29T14:46:05Z) - Image fusion using symmetric skip autoencodervia an Adversarial
Regulariser [6.584748347223698]
本稿では,より現実的な融合画像を生成するために,残差対向ネットワークによって正規化された残差自己エンコーダアーキテクチャを提案する。
残余モジュールはエンコーダ、デコーダ、および敵ネットワークの主要なビルディングとして機能する。
本稿では、融合画像と元の視覚画像の教師あり学習を行う対向正規化ネットワークを提案する。
論文 参考訳(メタデータ) (2020-05-01T15:31:45Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。