論文の概要: SFB-net for cardiac segmentation: Bridging the semantic gap with attention
- arxiv url: http://arxiv.org/abs/2410.18503v1
- Date: Thu, 24 Oct 2024 07:48:13 GMT
- ステータス: 翻訳完了
- システム内更新日: 2024-10-25 16:43:47.584814
- Title: SFB-net for cardiac segmentation: Bridging the semantic gap with attention
- Title(参考訳): 心的セグメンテーションのためのSFB-net : 注意による意味的ギャップを埋める
- Authors: Nicolas Portal, Nadjia Kachenoura, Thomas Dietenbeck, Catherine Achard,
- Abstract要約: 本稿では,Swin Filtering Block Network (SFB-net)について紹介する。
平均的なDiceスコアは、ACDCデータセットで92.4に達した。私たちの知る限り、この結果は、このデータセットに関する他の作業よりも優れています。
- 参考スコア(独自算出の注目度): 1.8499314936771556
- License:
- Abstract: In the past few years, deep learning algorithms have been widely used for cardiac image segmentation. However, most of these architectures rely on convolutions that hardly model long-range dependencies, limiting their ability to extract contextual information. In order to tackle this issue, this article introduces the Swin Filtering Block network (SFB-net) which takes advantage of both conventional and swin transformer layers. The former are used to introduce spatial attention at the bottom of the network, while the latter are applied to focus on high level semantically rich features between the encoder and decoder. An average Dice score of 92.4 was achieved on the ACDC dataset. To the best of our knowledge, this result outperforms any other work on this dataset. The average Dice score of 87.99 obtained on the M\&M's dataset demonstrates that the proposed method generalizes well to data from different vendors and centres.
- Abstract(参考訳): 過去数年間、深層学習アルゴリズムは心臓画像のセグメンテーションに広く用いられてきた。
しかしながら、これらのアーキテクチャのほとんどは、長距離依存をほとんどモデル化しない畳み込みに依存しており、コンテキスト情報を抽出する能力を制限する。
この問題に対処するため、本稿では、従来のトランスフォーマー層とスウィントランス層の両方を利用するSwin Filtering Block Network(SFB-net)を紹介します。
前者はネットワークの下部に空間的注意を向けるために使用され、後者はエンコーダとデコーダの間の高レベルな意味的リッチな特徴に焦点を当てる。
平均DiceスコアはACDCデータセットで92.4に達した。
私たちの知る限りでは、この結果は、このデータセットに関する他の作業よりも優れています。
M\&Mのデータセットで得られた平均Diceスコア87.99は、提案手法が様々なベンダーやセンターのデータによく当てはまることを示した。
関連論文リスト
- Deep Homography Estimation for Visual Place Recognition [49.235432979736395]
本稿では,変換器を用いたディープホモグラフィー推定(DHE)ネットワークを提案する。
バックボーンネットワークによって抽出された濃密な特徴写像を入力とし、高速で学習可能な幾何的検証のためにホモグラフィーに適合する。
ベンチマークデータセットを用いた実験により,本手法はいくつかの最先端手法より優れていることが示された。
論文 参考訳(メタデータ) (2024-02-25T13:22:17Z) - An Empirical Study of Attention Networks for Semantic Segmentation [11.000308726481236]
近年,注目度に基づくデコーダは,各種データセット上での最先端(SOTA)性能を実現している。
本稿ではまず,計算の複雑さを分析し,その性能を比較する実験を行う。
論文 参考訳(メタデータ) (2023-09-19T00:07:57Z) - Lightweight Monocular Depth Estimation with an Edge Guided Network [34.03711454383413]
本稿では,新しいエッジガイド深度推定ネットワーク(EGD-Net)を提案する。
特に、軽量なエンコーダデコーダアーキテクチャから始め、エッジガイダンスブランチを組み込む。
コンテクスト情報とエッジアテンション特徴を集約するために,トランスフォーマーをベースとした機能アグリゲーションモジュールを設計する。
論文 参考訳(メタデータ) (2022-09-29T14:45:47Z) - TC-Net: Triple Context Network for Automated Stroke Lesion Segmentation [0.5482532589225552]
本稿では,空間的コンテキスト情報を中心として,新たなネットワークである Triple Context Network (TC-Net) を提案する。
我々のネットワークはオープンデータセットATLASで評価され、最高スコアは0.594、ハウスドルフ距離は27.005mm、平均対称性表面距離は7.137mmである。
論文 参考訳(メタデータ) (2022-02-28T11:12:16Z) - CvS: Classification via Segmentation For Small Datasets [52.821178654631254]
本稿では,分類ラベルをセグメントマップの予測から導出する小型データセットのコスト効率の高い分類器であるCvSを提案する。
我々は,CvSが従来の手法よりもはるかに高い分類結果が得られることを示す多種多様な問題に対して,本フレームワークの有効性を評価する。
論文 参考訳(メタデータ) (2021-10-29T18:41:15Z) - MD-CSDNetwork: Multi-Domain Cross Stitched Network for Deepfake
Detection [80.83725644958633]
現在のディープフェイク生成法では、偽画像やビデオの周波数スペクトルに識別的アーティファクトが残されている。
MD-CSDNetwork(MD-CSDNetwork)と呼ばれる新しい手法を提案する。
論文 参考訳(メタデータ) (2021-09-15T14:11:53Z) - Deep ensembles based on Stochastic Activation Selection for Polyp
Segmentation [82.61182037130406]
本研究は,大腸内視鏡検査における画像分割,特に正確なポリープ検出とセグメンテーションを扱う。
イメージセグメンテーションの基本アーキテクチャはエンコーダとデコーダで構成されている。
我々はデコーダのバックボーンを変更することで得られるDeepLabアーキテクチャのバリエーションを比較した。
論文 参考訳(メタデータ) (2021-04-02T02:07:37Z) - Context Decoupling Augmentation for Weakly Supervised Semantic
Segmentation [53.49821324597837]
微調整されたセマンティックセグメンテーションは、近年深く研究されている困難な問題です。
本稿では、オブジェクトが現れる固有のコンテキストを変更する Context Decoupling Augmentation (CDA) メソッドを紹介します。
提案手法の有効性を検証するため, PASCAL VOC 2012データセットにいくつかの代替ネットワークアーキテクチャを用いた広範な実験を行い, CDAが様々なWSSS手法を新たな最先端技術に拡張できることを実証した。
論文 参考訳(メタデータ) (2021-03-02T15:05:09Z) - Spatio-Temporal Inception Graph Convolutional Networks for
Skeleton-Based Action Recognition [126.51241919472356]
我々はスケルトンに基づく行動認識のためのシンプルで高度にモジュール化されたグラフ畳み込みネットワークアーキテクチャを設計する。
ネットワークは,空間的および時間的経路から多粒度情報を集約するビルディングブロックを繰り返すことで構築される。
論文 参考訳(メタデータ) (2020-11-26T14:43:04Z) - End-to-end training of deep kernel map networks for image classification [15.99072005190786]
深層カーネルマップネットワークは画像アノテーションを含む様々な分類問題において優れた性能を示した。
本稿では,カーネルの近似品質と識別能力のバランスをとる,深層カーネルマップ学習のための新しい「エンドツーエンド」設計を提案する。
提案手法は,まず階層的にSVDを適用して初期深層カーネルマップの近似を構築し,次に「エンドツーエンド」教師付き学習を用いて識別能力を向上する。
論文 参考訳(メタデータ) (2020-06-26T16:37:41Z) - On the Texture Bias for Few-Shot CNN Segmentation [21.349705243254423]
畳み込みニューラルネットワーク(CNN)は、視覚認識タスクを実行するために形状によって駆動される。
最近の証拠は、CNNのテクスチャバイアスが、大きなラベル付きトレーニングデータセットで学習するときに、より高いパフォーマンスのモデルを提供することを示している。
本稿では,特徴空間内の高周波局所成分を減衰させるために,ガウス差分(DoG)の集合を統合する新しいアーキテクチャを提案する。
論文 参考訳(メタデータ) (2020-03-09T11:55:47Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。