論文の概要: DB-KAUNet: An Adaptive Dual Branch Kolmogorov-Arnold UNet for Retinal Vessel Segmentation
- arxiv url: http://arxiv.org/abs/2512.01657v1
- Date: Mon, 01 Dec 2025 13:30:01 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-12-02 19:46:34.864585
- Title: DB-KAUNet: An Adaptive Dual Branch Kolmogorov-Arnold UNet for Retinal Vessel Segmentation
- Title(参考訳): DB-KAUNet:網膜血管セグメンテーションのための適応型デュアルブランチKolmogorov-Arnold UNet
- Authors: Hongyu Xu, Panpan Meng, Meng Wang, Dayu Hu, Liming Liang, Xiaoqi Sheng,
- Abstract要約: 網膜血管分節に対する適応型二重枝Kolmogorov-Arnold UNet(DB-KAUNet)を提案する。
DB-KAUNetでは、並列CNNとTransformer経路を備えた異種二重分岐空間(HDBE)を設計する。
HDBEは戦略的に標準的なCNNとTransformerブロックを新しいkanConvとKATブロックでインターリーブし、モデルが包括的な特徴表現を形成することを可能にする。
- 参考スコア(独自算出の注目度): 12.894330512218113
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Accurate segmentation of retinal vessels is crucial for the clinical diagnosis of numerous ophthalmic and systemic diseases. However, traditional Convolutional Neural Network (CNN) methods exhibit inherent limitations, struggling to capture long-range dependencies and complex nonlinear relationships. To address the above limitations, an Adaptive Dual Branch Kolmogorov-Arnold UNet (DB-KAUNet) is proposed for retinal vessel segmentation. In DB-KAUNet, we design a Heterogeneous Dual-Branch Encoder (HDBE) that features parallel CNN and Transformer pathways. The HDBE strategically interleaves standard CNN and Transformer blocks with novel KANConv and KAT blocks, enabling the model to form a comprehensive feature representation. To optimize feature processing, we integrate several critical components into the HDBE. First, a Cross-Branch Channel Interaction (CCI) module is embedded to facilitate efficient interaction of channel features between the parallel pathways. Second, an attention-based Spatial Feature Enhancement (SFE) module is employed to enhance spatial features and fuse the outputs from both branches. Building upon the SFE module, an advanced Spatial Feature Enhancement with Geometrically Adaptive Fusion (SFE-GAF) module is subsequently developed. In the SFE-GAF module, adaptive sampling is utilized to focus on true vessel morphology precisely. The adaptive process strengthens salient vascular features while significantly reducing background noise and computational overhead. Extensive experiments on the DRIVE, STARE, and CHASE_DB1 datasets validate that DB-KAUNet achieves leading segmentation performance and demonstrates exceptional robustness.
- Abstract(参考訳): 網膜血管の正確なセグメンテーションは、多くの眼科および全身疾患の臨床的診断に不可欠である。
しかし、従来の畳み込みニューラルネットワーク(CNN)手法は、長距離依存や複雑な非線形関係を捉えるのに苦労する固有の制限を示す。
以上の制限に対処するために、網膜血管の分節に対する適応二重枝Kolmogorov-Arnold UNet(DB-KAUNet)を提案する。
DB-KAUNetでは、並列CNNとTransformer経路を備えた異種デュアルブランチエンコーダ(HDBE)を設計する。
HDBEは戦略的に標準的なCNNとTransformerブロックを新しいkanConvとKATブロックでインターリーブし、モデルが包括的な特徴表現を形成することを可能にする。
特徴処理を最適化するために、HDBEにいくつかの重要なコンポーネントを統合する。
まず、CCI(Cross-Branch Channel Interaction)モジュールが組み込まれ、並列経路間のチャネル特性の効率的な相互作用を容易にする。
第2に、注意に基づく空間特徴強調(SFE)モジュールを用いて、空間的特徴を高め、両方の枝からの出力を融合させる。
SFEモジュールをベースとして、幾何学的適応核融合(SFE-GAF)モジュールによる高度な空間特徴拡張が開発された。
SFE-GAFモジュールでは、アダプティブサンプリングを用いて真の血管形態を正確に測定する。
アダプティブプロセスは、背景雑音と計算オーバーヘッドを著しく低減しつつ、正常な血管機能を強化する。
DRIVE、STARE、CHASE_DB1データセットに関する大規模な実験では、DB-KAUNetが主要なセグメンテーション性能を達成し、例外的な堅牢性を示す。
関連論文リスト
- Source-Free Object Detection with Detection Transformer [59.33653163035064]
Source-Free Object Detection (SFOD) は、ソースデータにアクセスすることなく、ソースドメインから教師なしのターゲットドメインへの知識転送を可能にする。
ほとんどの既存のSFODアプローチは、より高速なR-CNNのような従来のオブジェクト検出(OD)モデルに限られるか、新しいODアーキテクチャ、特に検出変換器(DETR)に適合しない一般的なソリューションとして設計されている。
本稿では,DTRのクエリ中心の機能強化を特化して設計された新しいSFODフレームワークであるFeature Reweighting ANd Contrastive Learning NetworK(FRANCK)を紹介する。
論文 参考訳(メタデータ) (2025-10-13T07:35:04Z) - SCRNet: Spatial-Channel Regulation Network for Medical Ultrasound Image Segmentation [1.4930126157970809]
CNNベースのメソッドは長距離依存を無視する傾向があり、Transformerベースのメソッドはローカルなコンテキスト情報を見落としてしまう。
本稿では,前層から2つの入力特徴を処理するために設計された新しい特徴集約モジュール(FAM)を提案する。
この戦略により、モジュールは長距離依存とローカルコンテキスト情報の両方に同時に集中することができます。
論文 参考訳(メタデータ) (2025-08-19T15:02:27Z) - DART: Dual Adaptive Refinement Transfer for Open-Vocabulary Multi-Label Recognition [59.203152078315235]
Open-Vocabulary Multi-Label Recognition (OV-MLR)は、画像内の複数の見えないオブジェクトカテゴリを識別することを目的としている。
ビジョンランゲージ事前学習モデルは強力なオープン語彙基盤を提供するが、弱い監督下では微粒な局所化に苦慮する。
本稿では,これらの制約を克服するためのDART(Dual Adaptive Refinement Transfer)フレームワークを提案する。
論文 参考訳(メタデータ) (2025-08-07T17:22:33Z) - Unleashing Vision Foundation Models for Coronary Artery Segmentation: Parallel ViT-CNN Encoding and Variational Fusion [12.839049648094893]
冠動脈セグメンテーションは冠動脈疾患(CAD)のコンピュータ診断に重要である
並列符号化アーキテクチャを用いて,視覚基盤モデル(VFM)のパワーを利用する新しいフレームワークを提案する。
提案手法は, 精度の高い冠動脈セグメンテーションにおいて, 最先端の手法よりも優れ, 優れた性能を発揮する。
論文 参考訳(メタデータ) (2025-07-17T09:25:00Z) - MedVKAN: Efficient Feature Extraction with Mamba and KAN for Medical Image Segmentation [1.376408511310322]
医用画像セグメンテーションは、伝統的に畳み込みニューラルネットワーク(CNN)とトランスフォーマーベースのモデルに依存してきた。
トランスフォーマーモジュールの代替として,VSSと拡張フィールド畳み込みKAN(EFC-KAN)を統合したVSS拡張KAN(VKAN)モジュールを提案する。
さらに,VKANをU-Netフレームワークに組み込むことで,医用画像の効率的な分割モデルであるMedVKANを実現する。
論文 参考訳(メタデータ) (2025-05-17T02:56:58Z) - A Novel Hybrid Approach for Retinal Vessel Segmentation with Dynamic Long-Range Dependency and Multi-Scale Retinal Edge Fusion Enhancement [0.3611754783778107]
既存の方法は、マルチスケールの船の変動性、複雑な曲率、曖昧な境界といった課題に対処する。
本稿では,CNNとMambaを相乗的に統合した新しいハイブリッドフレームワークを提案する。
本手法は血管の連続性維持と低コントラスト領域の血管の分断を効果的に行う上で,最先端の性能を実現する。
論文 参考訳(メタデータ) (2025-04-18T08:41:35Z) - BHViT: Binarized Hybrid Vision Transformer [53.38894971164072]
モデルバイナライゼーションは畳み込みニューラルネットワーク(CNN)のリアルタイムおよびエネルギー効率の計算を可能にした。
本稿では,バイナライズフレンドリーなハイブリッドViTアーキテクチャであるBHViTとそのバイナライズモデルを提案する。
提案アルゴリズムは,バイナリ ViT 手法間でSOTA 性能を実現する。
論文 参考訳(メタデータ) (2025-03-04T08:35:01Z) - CFFormer: Cross CNN-Transformer Channel Attention and Spatial Feature Fusion for Improved Segmentation of Heterogeneous Medical Images [29.68616115427831]
医用画像のセグメンテーションはコンピュータ支援診断において重要な役割を担っている。
医用撮像装置の限界により、医用画像は大きな異質性を示し、セグメンテーションの課題を提起する。
本稿では,効果的なチャネル特徴抽出を利用するCFFormerと呼ばれるハイブリッドCNN-Transformerモデルを提案する。
論文 参考訳(メタデータ) (2025-01-07T08:59:20Z) - DA-Flow: Dual Attention Normalizing Flow for Skeleton-based Video Anomaly Detection [52.74152717667157]
本稿では,DAM(Dual Attention Module)と呼ばれる軽量モジュールを提案する。
フレームアテンション機構を使用して、最も重要なフレームを識別し、スケルトンアテンション機構を使用して、最小パラメータとフロップで固定されたパーティション間の広範な関係をキャプチャする。
論文 参考訳(メタデータ) (2024-06-05T06:18:03Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。