論文の概要: Sequential vessel segmentation via deep channel attention network
- arxiv url: http://arxiv.org/abs/2102.05229v1
- Date: Wed, 10 Feb 2021 02:45:08 GMT
- ステータス: 処理完了
- システム内更新日: 2021-02-11 14:29:21.457611
- Title: Sequential vessel segmentation via deep channel attention network
- Title(参考訳): ディープチャネルアテンションネットワークによる連続血管セグメンテーション
- Authors: Dongdong Hao, Song Ding, Linwei Qiu, Yisong Lv, Baowei Fei, Yueqi Zhu,
Binjie Qin
- Abstract要約: 本稿では,新しいエンコーダ・デコーダ・ディープネットワークアーキテクチャを提案する。
これは、現在のフレーム中心のスライディングウィンドウ内の2D+tシーケンシャル画像のコンテキストフレームを利用して、現在のフレームから2D容器マスクを分割する。
このアーキテクチャは、エンコーダ段階での時間空間的特徴抽出、スキップ接続層における特徴融合、デコーダ段階でのチャネルアテンション機構を備える。
- 参考スコア(独自算出の注目度): 5.941874421818899
- License: http://creativecommons.org/licenses/by-nc-sa/4.0/
- Abstract: This paper develops a novel encoder-decoder deep network architecture which
exploits the several contextual frames of 2D+t sequential images in a sliding
window centered at current frame to segment 2D vessel masks from the current
frame. The architecture is equipped with temporal-spatial feature extraction in
encoder stage, feature fusion in skip connection layers and channel attention
mechanism in decoder stage. In the encoder stage, a series of 3D convolutional
layers are employed to hierarchically extract temporal-spatial features. Skip
connection layers subsequently fuse the temporal-spatial feature maps and
deliver them to the corresponding decoder stages. To efficiently discriminate
vessel features from the complex and noisy backgrounds in the XCA images, the
decoder stage effectively utilizes channel attention blocks to refine the
intermediate feature maps from skip connection layers for subsequently decoding
the refined features in 2D ways to produce the segmented vessel masks.
Furthermore, Dice loss function is implemented to train the proposed deep
network in order to tackle the class imbalance problem in the XCA data due to
the wide distribution of complex background artifacts. Extensive experiments by
comparing our method with other state-of-the-art algorithms demonstrate the
proposed method's superior performance over other methods in terms of the
quantitative metrics and visual validation. The source codes are at
https://github.com/Binjie-Qin/SVS-net
- Abstract(参考訳): 本論文では,現在のフレームを中心に2次元船舶マスクをセグメント化するスライディングウィンドウにおける2D+tシーケンシャル画像の複数のコンテキストフレームを利用する,新しいエンコーダデコーダディープネットワークアーキテクチャを開発した。
このアーキテクチャは、エンコーダ段階での時間空間的特徴抽出、スキップ接続層における特徴融合、デコーダ段階でのチャネルアテンション機構を備える。
エンコーダ段階では、時間空間的特徴を階層的に抽出するために一連の3次元畳み込み層が用いられる。
スキップ接続層はその後、時間空間の特徴マップを融合させ、対応するデコーダステージに配信する。
デコーダステージは、XCA画像の複雑でノイズの多い背景から船舶の特徴を効率的に識別するために、チャネルの注意ブロックを効果的に利用して、中間の特徴マップをスキップ接続層から洗練し、2D方法で洗練された特徴をデコードしてセグメント化された船舶マスクを生成する。
さらに,複雑なバックグラウンドアーティファクトの分布が広いため,XCAデータにおけるクラス不均衡問題に対処するために,提案したディープネットワークをトレーニングするためにDice損失関数を実装した。
本手法と最先端アルゴリズムとの比較による広範な実験により, 定量的指標と視覚的検証の観点から, 提案手法が他の手法よりも優れた性能を示す。
ソースコードはhttps://github.com/Binjie-Qin/SVS-netにある。
関連論文リスト
- FFCA-Net: Stereo Image Compression via Fast Cascade Alignment of Side
Information [44.88123177525665]
マルチビュー圧縮技術、特にステレオ画像圧縮(SIC)は、車載カメラや3D関連アプリケーションにおいて重要な役割を果たす。
本稿では,デコーダの側情報を完全に活用する機能ベースの高速カスケードアライメントネットワーク(FFCA-Net)を提案する。
提案手法は,他の手法よりも3倍から10倍高速な復号化を実現する。
論文 参考訳(メタデータ) (2023-12-28T11:12:03Z) - Triple-View Knowledge Distillation for Semi-Supervised Semantic
Segmentation [54.23510028456082]
半教師付きセマンティックセグメンテーションのためのトリプルビュー知識蒸留フレームワークTriKDを提案する。
このフレームワークは、トリプルビューエンコーダとデュアル周波数デコーダを含む。
論文 参考訳(メタデータ) (2023-09-22T01:02:21Z) - S^2-Transformer for Mask-Aware Hyperspectral Image Reconstruction [48.83280067393851]
代表的ハイパースペクトル画像取得手順は、符号化開口分光画像センサ(CASSI)による3D-to-2D符号化を行う
i) 2次元計測を得るために、CASSIは分散器タイトリングにより複数のチャネルを分散させ、それらを同じ空間領域に絞り込み、絡み合ったデータ損失をもたらす。
本稿では,これらの課題に対処するためのマスク対応学習戦略を備えた空間スペクトル(S2-)トランスフォーマーアーキテクチャを提案する。
論文 参考訳(メタデータ) (2022-09-24T19:26:46Z) - Adjacent Context Coordination Network for Salient Object Detection in
Optical Remote Sensing Images [102.75699068451166]
本稿では,光RSI-SODのためのエンコーダ・デコーダアーキテクチャにおいて,隣接した特徴のコーディネートを探索するための新しいアジャセントコンテキストコーディネートネットワーク(ACCoNet)を提案する。
提案されたACCoNetは、9つの評価基準の下で22の最先端メソッドを上回り、1つのNVIDIA Titan X GPU上で81fpsで動作する。
論文 参考訳(メタデータ) (2022-03-25T14:14:55Z) - Crosslink-Net: Double-branch Encoder Segmentation Network via Fusing
Vertical and Horizontal Convolutions [58.71117402626524]
医用画像分割のための新しいダブルブランチエンコーダアーキテクチャを提案する。
1)正方形畳み込みカーネルによる特徴の識別をさらに改善する必要があるため,非正方形および水平畳み込みカーネルの利用を提案する。
実験では,4つのデータセット上でのモデルの有効性を検証した。
論文 参考訳(メタデータ) (2021-07-24T02:58:32Z) - FPS-Net: A Convolutional Fusion Network for Large-Scale LiDAR Point
Cloud Segmentation [30.736361776703568]
LiDARポイントクラウドに基づくシーン理解は、自動運転車が安全に運転するのに不可欠なタスクです。
既存のほとんどのメソッドは、情報容量を増やすために、画像チャネルとして異なるポイント属性/モダリティを積み重ねる。
fps-netは,最適なポイントクラウドセグメンテーションのために,投影画像チャネル間の一意性と不一致を生かす畳み込み型融合ネットワークである。
論文 参考訳(メタデータ) (2021-03-01T04:08:28Z) - CovSegNet: A Multi Encoder-Decoder Architecture for Improved Lesion
Segmentation of COVID-19 Chest CT Scans [11.946078871080836]
高度に効率的なニューラルネットワークアーキテクチャ、すなわちCovSegNetを利用して、自動化されたCOVID-19病変のセグメンテーションスキームを提案する。
パフォーマンスは3つの公開データセットで達成されており、他の最先端のアプローチよりも大幅に向上している。
論文 参考訳(メタデータ) (2020-12-02T19:26:35Z) - Two-stream Encoder-Decoder Network for Localizing Image Forgeries [4.982505311411925]
本稿では,高レベル画像と低レベル画像の両方を利用する2ストリームエンコーダデコーダネットワークを提案する。
提案手法の性能評価のために,複数の標準法医学データセットの実験的検討を行った。
論文 参考訳(メタデータ) (2020-09-27T15:49:17Z) - Beyond Single Stage Encoder-Decoder Networks: Deep Decoders for Semantic
Image Segmentation [56.44853893149365]
セマンティックセグメンテーションのための単一エンコーダ-デコーダ手法は、セマンティックセグメンテーションの品質とレイヤー数あたりの効率の観点からピークに達している。
そこで本研究では,より多くの情報コンテンツを取得するために,浅層ネットワークの集合を用いたデコーダに基づく新しいアーキテクチャを提案する。
アーキテクチャをさらに改善するために,ネットワークの注目度を高めるために,クラスの再バランスを目的とした重み関数を導入する。
論文 参考訳(メタデータ) (2020-07-19T18:44:34Z) - Rethinking and Improving Natural Language Generation with Layer-Wise
Multi-View Decoding [59.48857453699463]
シーケンシャル・ツー・シーケンス学習では、デコーダは注意機構に依存してエンコーダから情報を効率的に抽出する。
近年の研究では、異なるエンコーダ層からの表現を多様なレベルの情報に利用することが提案されている。
本稿では, 各デコーダ層に対して, グローバルビューとして機能する最後のエンコーダ層からの表現とともに, ソースシーケンスの立体視のために他のエンコーダ層からのデコーダ層からのデコーダ層を補足するレイヤワイド・マルチビューデコーダを提案する。
論文 参考訳(メタデータ) (2020-05-16T20:00:39Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。