論文の概要: Group Shift Pointwise Convolution for Volumetric Medical Image
Segmentation
- arxiv url: http://arxiv.org/abs/2109.12629v1
- Date: Sun, 26 Sep 2021 15:27:33 GMT
- ステータス: 処理完了
- システム内更新日: 2021-09-28 15:16:59.955089
- Title: Group Shift Pointwise Convolution for Volumetric Medical Image
Segmentation
- Title(参考訳): 容積的医用画像分割のための群シフト方向畳み込み
- Authors: Junjun He, Jin Ye, Cheng Li, Diping Song, Wanli Chen, Shanshan Wang,
Lixu Gu, and Yu Qiao
- Abstract要約: 本稿では,3次元畳み込みの有効性と効率を向上させるために,GSP-Conv(Group Shift Pointwise Convolution)を提案する。
GSP-Convは1x1x1カーネルで3D畳み込みをポイントワイズに単純化し、モデルパラメータやFLOPの数を劇的に削減する。
以上の結果から,本手法は3次元畳み込みモデルと同等あるいはそれ以上の性能が得られた。
- 参考スコア(独自算出の注目度): 31.72090839643412
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Recent studies have witnessed the effectiveness of 3D convolutions on
segmenting volumetric medical images. Compared with the 2D counterparts, 3D
convolutions can capture the spatial context in three dimensions. Nevertheless,
models employing 3D convolutions introduce more trainable parameters and are
more computationally complex, which may lead easily to model overfitting
especially for medical applications with limited available training data. This
paper aims to improve the effectiveness and efficiency of 3D convolutions by
introducing a novel Group Shift Pointwise Convolution (GSP-Conv). GSP-Conv
simplifies 3D convolutions into pointwise ones with 1x1x1 kernels, which
dramatically reduces the number of model parameters and FLOPs (e.g. 27x fewer
than 3D convolutions with 3x3x3 kernels). Na\"ive pointwise convolutions with
limited receptive fields cannot make full use of the spatial image context. To
address this problem, we propose a parameter-free operation, Group Shift (GS),
which shifts the feature maps along with different spatial directions in an
elegant way. With GS, pointwise convolutions can access features from different
spatial locations, and the limited receptive fields of pointwise convolutions
can be compensated. We evaluate the proposed methods on two datasets, PROMISE12
and BraTS18. Results show that our method, with substantially decreased model
complexity, achieves comparable or even better performance than models
employing 3D convolutions.
- Abstract(参考訳): 近年の研究では、体積医用画像の分割における3次元畳み込みの有効性が確認されている。
2次元に比べて、3次元の畳み込みは空間コンテキストを3次元で捉えることができる。
それでも、3d畳み込みを使用するモデルは、より訓練可能なパラメータを導入し、計算が複雑になり、特に利用可能なトレーニングデータが少ない医療アプリケーションでは、過剰フィッティングのモデル化が容易になる。
本稿では,GSP-Conv(Group Shift Pointwise Convolution)を導入することで,3次元畳み込みの有効性と効率を向上させることを目的とする。
gsp-convは3d畳み込みを1x1x1カーネルでポイントワイズに単純化し、モデルパラメータとフロップの数を劇的に削減する(例えば3x3x3カーネルの3d畳み込みより27倍少ない)。
限られた受容場を持つna\"ive pointwise畳み込みは、空間的イメージコンテキストをフルに利用することはできない。
この問題に対処するために,空間方向の異なる特徴マップをエレガントな方法でシフトする,パラメータフリーなグループシフト(GS)を提案する。
GSでは、ポイントワイズ畳み込みは異なる空間位置からの特徴にアクセスでき、ポイントワイズ畳み込みの限られた受容領域を補償することができる。
提案手法をProMISE12とBraTS18の2つのデータセット上で評価した。
その結果,3次元畳み込みを用いたモデルと同等あるいはそれ以上の性能が得られることがわかった。
関連論文リスト
- Geometric Algebra Planes: Convex Implicit Neural Volumes [70.12234371845445]
GA-Planes はスパース低ランク係数と低分解能行列と等価であることを示す。
また,GA-Planeは既存の表現にも適用可能であることを示す。
論文 参考訳(メタデータ) (2024-11-20T18:21:58Z) - Neural Signed Distance Function Inference through Splatting 3D Gaussians Pulled on Zero-Level Set [49.780302894956776]
多視点表面再構成における符号付き距離関数(SDF)の推測は不可欠である。
本稿では3DGSとニューラルSDFの学習をシームレスに融合する手法を提案する。
我々の数値的および視覚的比較は、広く使用されているベンチマークの最先端結果よりも優れていることを示している。
論文 参考訳(メタデータ) (2024-10-18T05:48:06Z) - Spatiotemporal Modeling Encounters 3D Medical Image Analysis:
Slice-Shift UNet with Multi-View Fusion [0.0]
本稿では,2次元CNNにおける3次元特徴をエンコードする2次元モデルSlice SHift UNetを提案する。
より正確にマルチビュー機能は、ボリュームの3次元平面に沿って2次元の畳み込みを実行することで協調的に学習される。
提案手法の有効性は,多モード腹部多臓器軸 (AMOS) と Cranial Vault (BTCV) データセットを越えたマルチアトラスラベリング (Multi-Atlas Labeling Beyond the Cranial Vault) で検証した。
論文 参考訳(メタデータ) (2023-07-24T14:53:23Z) - Deformably-Scaled Transposed Convolution [17.4596321623511]
我々は、変換された畳み込みを再検討し、画像に情報を選択的に配置できる新しいレイヤを導入する。
私たちの新しいレイヤは、2Dおよび3Dアップサンプリングオペレータのドロップイン代替として使用することができ、コードは公開されます。
論文 参考訳(メタデータ) (2022-10-17T21:35:29Z) - Spatial Pruned Sparse Convolution for Efficient 3D Object Detection [41.62839541489369]
3Dシーンは多数のバックグラウンドポイントによって支配されており、主に前景オブジェクトにフォーカスする必要がある検出タスクには冗長である。
本稿では,既存の3D CNNの主要なコンポーネントを分析し,データの冗長性を無視し,さらにダウンサンプリングプロセスでそれを増幅することにより,余分な計算オーバーヘッドと不要な計算オーバーヘッドを発生させる。
SPS-ConvとSPSS-ConvとSPRSの2つの変種を含む新しい畳み込み演算子を提案する。
論文 参考訳(メタデータ) (2022-09-28T16:19:06Z) - Cylindrical and Asymmetrical 3D Convolution Networks for LiDAR-based
Perception [122.53774221136193]
運転時のLiDARに基づく認識のための最先端の手法は、しばしば点雲を2D空間に投影し、2D畳み込みによって処理する。
自然な対策として、3Dボクセル化と3D畳み込みネットワークを利用する方法がある。
本研究では,3次元幾何学的パターンを探索するために,円筒状分割と非対称な3次元畳み込みネットワークを設計する,屋外LiDARセグメンテーションのための新しいフレームワークを提案する。
論文 参考訳(メタデータ) (2021-09-12T06:25:11Z) - Equivariant Point Network for 3D Point Cloud Analysis [17.689949017410836]
点雲解析のための実効的で実用的なSE(3)(3次元翻訳と回転)同変ネットワークを提案する。
まず,6次元の畳み込みを2つの分離可能な畳み込み作用素に分解する新しい枠組みであるSE(3)分離点畳み込みを提案する。
第2に,同変特徴の表現性を効果的に活用するアテンション層を導入する。
論文 参考訳(メタデータ) (2021-03-25T21:57:10Z) - Cylindrical and Asymmetrical 3D Convolution Networks for LiDAR
Segmentation [81.02742110604161]
大規模運転シーンのLiDARセグメンテーションのための最先端の手法は、しばしば点雲を2次元空間に投影し、2D畳み込みによって処理する。
そこで我々は,3次元幾何学的パタンを探索するために,円筒分割と非対称な3次元畳み込みネットワークを設計する,屋外LiDARセグメンテーションのための新しいフレームワークを提案する。
提案手法はセマンティックKITTIのリーダーボードにおいて第1位を獲得し,既存のnuScenesの手法を約4%のマージンで上回っている。
論文 参考訳(メタデータ) (2020-11-19T18:53:11Z) - Reinforced Axial Refinement Network for Monocular 3D Object Detection [160.34246529816085]
モノクロ3次元物体検出は、2次元入力画像から物体の位置と特性を抽出することを目的としている。
従来のアプローチでは、空間から3D境界ボックスをサンプリングし、対象オブジェクトと各オブジェクトの関係を推定するが、有効サンプルの確率は3D空間で比較的小さい。
我々は,まず最初の予測から始めて,各ステップで1つの3dパラメータだけを変えて,基礎的真理に向けて徐々に洗練することを提案する。
これは、いくつかのステップの後に報酬を得るポリシーを設計する必要があるため、最適化するために強化学習を採用します。
論文 参考訳(メタデータ) (2020-08-31T17:10:48Z) - Spatial Information Guided Convolution for Real-Time RGBD Semantic
Segmentation [79.78416804260668]
本稿では,効率的なRGB機能と3次元空間情報統合を実現するための空間情報ガイドコンボリューション(S-Conv)を提案する。
S-Convは、3次元空間情報によって導かれる畳み込みカーネルのサンプリングオフセットを推測する能力を有する。
我々はさらにS-Convを空間情報ガイド畳み込みネットワーク(SGNet)と呼ばれるセグメンテーションネットワークに組み込みます。
論文 参考訳(メタデータ) (2020-04-09T13:38:05Z) - Anisotropic Convolutional Networks for 3D Semantic Scene Completion [24.9671648682339]
セマンティックシーン補完(SSC)は、単一の深さおよび/またはRGB画像からシーンの占有度とセマンティックラベルを同時に推測しようとする。
異方性畳み込みと呼ばれる新しいモジュールを提案する。
固定された3次元受容場に制限される標準的な3次元畳み込みとは対照的に、我々のモジュールは次元異方性ボクセルを賢明にモデル化することができる。
論文 参考訳(メタデータ) (2020-04-05T07:57:02Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。