論文の概要: FCSN: Global Context Aware Segmentation by Learning the Fourier
Coefficients of Objects in Medical Images
- arxiv url: http://arxiv.org/abs/2207.14477v1
- Date: Fri, 29 Jul 2022 04:56:36 GMT
- ステータス: 処理完了
- システム内更新日: 2022-08-01 13:21:22.031693
- Title: FCSN: Global Context Aware Segmentation by Learning the Fourier
Coefficients of Objects in Medical Images
- Title(参考訳): fcsn:医療画像における物体のフーリエ係数の学習によるグローバルコンテキスト認識セグメンテーション
- Authors: Young Seok Jeon, Hongfei Yang, Mengling Feng
- Abstract要約: encoder-decoderモデルは、ピクセルの周りの局所パターンに重点を置いたピクセルワイズ予測を行う。
FCSNは、物体のマスクの複雑なフーリエ係数を学習することで物体をセグメント化する新しいディープニューラルネットワーク(DNN)モデルである。
FCSNのトレーニング速度は1.6ms/imgと6.3ms/imgで、UNetやUNETRよりも8$times$と3$times$が速い。
- 参考スコア(独自算出の注目度): 1.2338729811609355
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: The encoder-decoder model is a commonly used Deep Neural Network (DNN) model
for medical image segmentation. Conventional encoder-decoder models make
pixel-wise predictions focusing heavily on local patterns around the pixel.
This makes it challenging to give segmentation that preserves the object's
shape and topology, which often requires an understanding of the global context
of the object. In this work, we propose a Fourier Coefficient Segmentation
Network~(FCSN) -- a novel DNN-based model that segments an object by learning
the complex Fourier coefficients of the object's masks. The Fourier
coefficients are calculated by integrating over the whole contour. Therefore,
for our model to make a precise estimation of the coefficients, the model is
motivated to incorporate the global context of the object, leading to a more
accurate segmentation of the object's shape. This global context awareness also
makes our model robust to unseen local perturbations during inference, such as
additive noise or motion blur that are prevalent in medical images. When FCSN
is compared with other state-of-the-art models (UNet+, DeepLabV3+, UNETR) on 3
medical image segmentation tasks (ISIC\_2018, RIM\_CUP, RIM\_DISC), FCSN
attains significantly lower Hausdorff scores of 19.14 (6\%), 17.42 (6\%), and
9.16 (14\%) on the 3 tasks, respectively. Moreover, FCSN is lightweight by
discarding the decoder module, which incurs significant computational overhead.
FCSN only requires 22.2M parameters, 82M and 10M fewer parameters than UNETR
and DeepLabV3+. FCSN attains inference and training speeds of 1.6ms/img and
6.3ms/img, that is 8$\times$ and 3$\times$ faster than UNet and UNETR.
- Abstract(参考訳): エンコーダ・デコーダモデル(encoder-decoder model)は、医療画像セグメンテーションに用いられるディープニューラルネットワーク(DNN)モデルである。
従来のエンコーダ-デコーダモデルは、ピクセル周辺の局所パターンに重点を置いたピクセル単位での予測を行う。
これにより、オブジェクトの形状とトポロジを保存するセグメンテーションを与えることが難しくなり、オブジェクトの全体的コンテキストを理解することがしばしば必要となる。
本研究では,物体のマスクの複雑なフーリエ係数を学習することにより物体をセグメント化する新しいDNNモデルであるFourier Coefficient Segmentation Network~(FCSN)を提案する。
フーリエ係数は輪郭全体の積分によって計算される。
そこで,本モデルが係数の正確な推定を行うためには,対象物の大域的文脈を組み込むことを動機として,対象物の形状のより正確なセグメンテーションを行う。
このグローバルな文脈認識により、医療画像によく見られる付加的なノイズや動きのぼかしなど、推論中の局所的な摂動に頑健なモデルがもたらされる。
FCSNが3つの医療画像セグメンテーションタスク(ISIC\_2018, RIM\_CUP, RIM\_DISC)の他の最先端モデル(UNet+, DeepLabV3+, UNETR)と比較された場合、FCSNは3つのタスクのハウスドルフスコアを19.14 (6\%), 17.42 (6\%), 9.16 (14\%) と大きく低下させる。
さらに、FCSNはデコーダモジュールを破棄することで軽量になり、計算オーバーヘッドが大幅に増大する。
FCSN は UNETR や DeepLabV3+ よりも 22.2M のパラメータ、82M と 10M のパラメータしか必要としない。
FCSNは1.6ms/imgと6.3ms/imgの推論とトレーニング速度を実現しており、これはUNetやUNETRよりも高速な8$\times$と3$\times$である。
関連論文リスト
- LiteNeXt: A Novel Lightweight ConvMixer-based Model with Self-embedding Representation Parallel for Medical Image Segmentation [2.0901574458380403]
医用画像分割のための軽量だが効率的な新しいモデル LiteNeXt を提案する。
LiteNeXtは、少量のパラメータ (0.71M) とギガ浮動小数点演算 (0.42) でスクラッチから訓練されている。
論文 参考訳(メタデータ) (2024-04-04T01:59:19Z) - BEFUnet: A Hybrid CNN-Transformer Architecture for Precise Medical Image
Segmentation [0.0]
本稿では,医療画像の正確な分割のために,身体情報とエッジ情報の融合を強化するBEFUnetという,革新的なU字型ネットワークを提案する。
BEFUnetは、新しいローカル・クロス・アテンション・フィーチャー(LCAF)融合モジュール、新しいダブル・レベル・フュージョン(DLF)モジュール、デュアルブランチ・エンコーダの3つの主要モジュールから構成されている。
LCAFモジュールは、2つのモダリティの間に空間的に近接する特徴に対して、局所的な相互注意を選択的に行うことにより、エッジとボディの特徴を効率よく融合させる。
論文 参考訳(メタデータ) (2024-02-13T21:03:36Z) - nnMamba: 3D Biomedical Image Segmentation, Classification and Landmark
Detection with State Space Model [24.955052600683423]
本稿では、CNNの強みとステートスペースシーケンスモデル(SSM)の高度な長距離モデリング機能を統合する新しいアーキテクチャであるnnMambaを紹介する。
6つのデータセットの実験では、3D画像のセグメンテーション、分類、ランドマーク検出など、一連の困難なタスクにおいて、nnMambaが最先端のメソッドよりも優れていることが示されている。
論文 参考訳(メタデータ) (2024-02-05T21:28:47Z) - Neural Attentive Circuits [93.95502541529115]
我々は、NAC(Neural Attentive Circuits)と呼ばれる汎用的でモジュラーなニューラルアーキテクチャを導入する。
NACは、ドメイン知識を使わずに、ニューラルネットワークモジュールのパラメータ化と疎結合を学習する。
NACは推論時に8倍のスピードアップを達成するが、性能は3%以下である。
論文 参考訳(メタデータ) (2022-10-14T18:00:07Z) - NAF: Neural Attenuation Fields for Sparse-View CBCT Reconstruction [79.13750275141139]
本稿では,スパースビューCBCT再構成のための新規かつ高速な自己教師型ソリューションを提案する。
所望の減衰係数は、3次元空間座標の連続関数として表現され、完全に接続されたディープニューラルネットワークによってパラメータ化される。
ハッシュ符号化を含む学習ベースのエンコーダが採用され、ネットワークが高周波の詳細をキャプチャするのに役立つ。
論文 参考訳(メタデータ) (2022-09-29T04:06:00Z) - Two-Stream Graph Convolutional Network for Intra-oral Scanner Image
Segmentation [133.02190910009384]
本稿では,2ストリームグラフ畳み込みネットワーク(TSGCN)を提案する。
TSGCNは3次元歯(表面)セグメンテーションにおいて最先端の方法よりも優れています。
論文 参考訳(メタデータ) (2022-04-19T10:41:09Z) - Automatic size and pose homogenization with spatial transformer network
to improve and accelerate pediatric segmentation [51.916106055115755]
空間変換器ネットワーク(STN)を利用することにより、ポーズとスケール不変の新たなCNNアーキテクチャを提案する。
私たちのアーキテクチャは、トレーニング中に一緒に見積もられる3つのシーケンシャルモジュールで構成されています。
腹部CTスキャナーを用いた腎および腎腫瘍の分節法について検討した。
論文 参考訳(メタデータ) (2021-07-06T14:50:03Z) - Global Filter Networks for Image Classification [90.81352483076323]
本稿では,対数線形複雑度を持つ周波数領域における長期空間依存性を学習する,概念的に単純だが計算効率のよいアーキテクチャを提案する。
この結果から,GFNetはトランスフォーマー型モデルやCNNの効率,一般化能力,堅牢性において,非常に競争力のある代替手段となる可能性が示唆された。
論文 参考訳(メタデータ) (2021-07-01T17:58:16Z) - Group-Wise Semantic Mining for Weakly Supervised Semantic Segmentation [49.90178055521207]
この研究は、画像レベルのアノテーションとピクセルレベルのセグメンテーションのギャップを埋めることを目標に、弱い監督されたセマンティックセグメンテーション(WSSS)に対処する。
画像群における意味的依存関係を明示的にモデル化し,より信頼性の高い擬似的基盤構造を推定する,新たなグループ学習タスクとしてWSSSを定式化する。
特に、入力画像がグラフノードとして表現されるグループ単位のセマンティックマイニングのためのグラフニューラルネットワーク(GNN)を考案する。
論文 参考訳(メタデータ) (2020-12-09T12:40:13Z) - Efficient Deep Learning of Non-local Features for Hyperspectral Image
Classification [28.72648031677868]
高スペクトル画像(HSI)分類のために, ENL-FCN と呼ばれる効率的な非局所モジュールを持つ深部完全畳み込みネットワーク (FCN) を提案する。
提案するフレームワークである深部FCNは、全HSIを入力とみなし、局所受容領域におけるスペクトル空間情報を抽出する。
リカレント操作を使用することで、各画素の応答はHSIの全画素から集約される。
論文 参考訳(メタデータ) (2020-08-02T19:13:22Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。