論文の概要: Deformable Convolution Module with Globally Learned Relative Offsets for Fundus Vessel Segmentation
- arxiv url: http://arxiv.org/abs/2507.18354v1
- Date: Thu, 24 Jul 2025 12:25:45 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-07-25 15:10:43.628217
- Title: Deformable Convolution Module with Globally Learned Relative Offsets for Fundus Vessel Segmentation
- Title(参考訳): 基底容器セグメンテーションのための大域的に学習された相対オフセットを持つ変形可能な畳み込みモジュール
- Authors: Lexuan Zhu, Yuxuan Li, Yuning Ren,
- Abstract要約: 変形可能な畳み込みは、複雑な形状の特徴を扱うオフセットを学習することで、畳み込みカーネルの形状を適応的に変更することができる。
本稿では,オフセット学習に注意とフィードフォワードネットワークを用いた新しいプラグ・プレイ・デフォルマブル・コンボリューション・モジュールを提案する。
提案するモジュールは,従来の畳み込みのインタフェースに似ており,複雑なグローバルな自己類似機能を備えたマシンビジョンタスクに適用することを提案する。
- 参考スコア(独自算出の注目度): 4.383085134007795
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Deformable convolution can adaptively change the shape of convolution kernel by learning offsets to deal with complex shape features. We propose a novel plug and play deformable convolutional module that uses attention and feedforward networks to learn offsets, so that the deformable patterns can capture long-distance global features. Compared with previously existing deformable convolutions, the proposed module learns the sub pixel displacement field and adaptively warps the feature maps across all channels rather than directly deforms the convolution kernel , which is equivalent to a relative deformation of the kernel sampling grids, achieving global feature deformation and the decoupling of kernel size and learning network. Considering that the fundus blood vessels have globally self similar complex edges, we design a deep learning model for fundus blood vessel segmentation, GDCUnet, based on the proposed convolutional module. Empirical evaluations under the same configuration and unified framework show that GDCUnet has achieved state of the art performance on public datasets. Further ablation experiments demonstrated that the proposed deformable convolutional module could more significantly learn the complex features of fundus blood vessels, enhancing the model representation and generalization capabilities.The proposed module is similar to the interface of conventional convolution, we suggest applying it to more machine vision tasks with complex global self similar features.
- Abstract(参考訳): 変形可能な畳み込みは、複雑な形状の特徴を扱うオフセットを学習することで、畳み込みカーネルの形状を適応的に変更することができる。
本稿では,注目とフィードフォワードネットワークを用いてオフセットを学習し,デフォルマブルパターンが長距離グローバルな特徴を捉えることができる新しいプラグ・プレイ・デフォルマブル・コンボリューション・モジュールを提案する。
既存の変形可能な畳み込みと比較して、提案モジュールはサブピクセル変位場を学習し、カーネルサンプリンググリッドの相対的変形と等価である畳み込みカーネルを直接変形するのではなく、全てのチャネルにまたがる特徴マップを適応的にワープし、グローバルな特徴変形とカーネルサイズと学習ネットワークの分離を達成する。
底部血管は地球規模で類似した複雑なエッジを持つため,提案した畳み込みモジュールに基づいて,底部血管分節の深部学習モデルGDCUnetを設計する。
同じ構成と統一されたフレームワークの下での実証的な評価は、GDCUnetがパブリックデータセット上で最先端のパフォーマンスを達成したことを示している。
さらなるアブレーション実験により, 変形可能な畳み込みモジュールは, 基礎血管の複雑な特徴をより深く学習し, モデル表現と一般化能力の向上を図り, 提案モジュールは従来の畳み込みのインタフェースに似ており, 複雑なグローバルな自己類似機能を持つ機械視覚タスクに適用することを提案する。
関連論文リスト
- Intervening to learn and compose disentangled representations [8.452837716541705]
本稿では,非絡み付き潜在構造を同時に学習する任意表現型生成モデルの学習手法を提案する。
これは、任意の複雑な既存のデコーダブロックのヘッドに単純なデコーダのみのモジュールを追加することで実現される。
因果的グラフィカルモデルへの介入の概念に触発されて、我々のモジュールはトレーニング中にアーキテクチャを選択的に修正し、異なるコンテキストでコンパクトなジョイントモデルを学ぶことができる。
論文 参考訳(メタデータ) (2025-07-07T08:30:27Z) - KLDD: Kalman Filter based Linear Deformable Diffusion Model in Retinal Image Segmentation [51.03868117057726]
本稿では,網膜血管分割のためのKLDDモデルを提案する。
我々のモデルは、変形可能な畳み込みの柔軟な受容場を利用して、分割を反復的に洗練する拡散過程を用いる。
実験は網膜基底画像データセット(DRIVE,CHASE_DB1)とOCTA-500データセットの3mm,6mmで評価された。
論文 参考訳(メタデータ) (2024-09-19T14:21:38Z) - Learning Modulated Transformation in GANs [69.95217723100413]
生成逆数ネットワーク(GAN)のジェネレータに、変調変換モジュール(Modulated transformation module, MTM)と呼ばれるプラグアンドプレイモジュールを装備する。
MTMは、可変位置で畳み込み操作を適用可能な潜在符号の制御下で空間オフセットを予測する。
挑戦的なTaiChiデータセット上での人為的な生成に向けて、StyleGAN3のFIDを21.36から13.60に改善し、変調幾何変換の学習の有効性を実証した。
論文 参考訳(メタデータ) (2023-08-29T17:51:22Z) - MOLE: MOdular Learning FramEwork via Mutual Information Maximization [3.8399484206282146]
本稿では、モジュールラーニングフレームワーク(MOLE)という、ニューラルネットワークのための非同期で局所的な学習フレームワークを紹介する。
MOLEはニューラルネットワークをレイヤごとにモジュール化し、各モジュールの相互情報を通じてトレーニング目標を定義し、各モジュールを相互情報で順次トレーニングする。
特に、このフレームワークはグラフ型データに対するグラフレベルのタスクとノードレベルのタスクの両方を解決することができる。
論文 参考訳(メタデータ) (2023-08-15T13:48:16Z) - DepthFormer: Exploiting Long-Range Correlation and Local Information for
Accurate Monocular Depth Estimation [50.08080424613603]
高精度な単分子深度推定には長距離相関が不可欠である。
我々は,このグローバルコンテキストを効果的な注意機構でモデル化するためにTransformerを活用することを提案する。
提案したモデルであるDepthFormerは、最先端のモノクル深度推定手法をはるかに超えている。
論文 参考訳(メタデータ) (2022-03-27T05:03:56Z) - Content-aware Directed Propagation Network with Pixel Adaptive Kernel
Attention [20.0783340490331]
画素適応カーネルアテンション(Paka)と呼ばれる新しい操作を提案する。
PAKAは、学習可能な特徴から空間的に異なる注意を掛けることで、フィルタ重みへの指向性を提供する。
本手法はエンドツーエンドで学習可能であり,任意のCNNモデルに適用可能である。
論文 参考訳(メタデータ) (2021-07-28T02:59:19Z) - X-volution: On the unification of convolution and self-attention [52.80459687846842]
本稿では,畳み込み操作と自己注意操作の両方からなるマルチブランチ基本モジュールを提案する。
提案したX-進化は、非常に競争力のある視覚的理解の改善を実現する。
論文 参考訳(メタデータ) (2021-06-04T04:32:02Z) - Conformer: Local Features Coupling Global Representations for Visual
Recognition [72.9550481476101]
本稿では,畳み込み操作と自己アテンション機構を利用した表現学習のためのハイブリッドネットワーク構造,conformerを提案する。
実験では、コンフォーマーが同等のパラメータ複雑性の下で視覚変換器(DeiT-B)を2.3%上回ることが示されている。
論文 参考訳(メタデータ) (2021-05-09T10:00:03Z) - Joint Self-Attention and Scale-Aggregation for Self-Calibrated Deraining
Network [13.628218953897946]
本稿では,JDNetとよばれる有効アルゴリズムを提案する。
自己校正畳み込みを用いたスケール・アグリゲーション・セルフアグリゲーション・モジュールを巧みに設計することにより,提案モデルはより優れたデコレーション結果が得られる。
論文 参考訳(メタデータ) (2020-08-06T17:04:34Z) - S2RMs: Spatially Structured Recurrent Modules [105.0377129434636]
モジュール構造とテンポラル構造の両方を同時に活用できる動的構造を利用するための一歩を踏み出します。
我々のモデルは利用可能なビューの数に対して堅牢であり、追加のトレーニングなしで新しいタスクに一般化できる。
論文 参考訳(メタデータ) (2020-07-13T17:44:30Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。