論文の概要: Gaussian Dynamic Convolution for Efficient Single-Image Segmentation
- arxiv url: http://arxiv.org/abs/2104.08783v1
- Date: Sun, 18 Apr 2021 09:20:55 GMT
- ステータス: 処理完了
- システム内更新日: 2021-04-22 07:50:49.285801
- Title: Gaussian Dynamic Convolution for Efficient Single-Image Segmentation
- Title(参考訳): 効率的な単一画像分割のためのガウス動的畳み込み
- Authors: Xin Sun, Changrui Chen, Xiaorui Wang, Junyu Dong, Huiyu Zhou, Sheng
Chen
- Abstract要約: ニューラルネットワークのコンテキスト情報を高速かつ効率的に集約するガウス力学畳み込み(GDC)を提案する。
当社のGDCは、軽量または複雑なセグメンテーションネットワークを構築するためのモジュールとして簡単に使用できます。
実験では、GDCが3つのベンチマークセグメンテーションデータセットで他の既存の畳み込みよりも優れていることが示されている。
- 参考スコア(独自算出の注目度): 37.80759016943627
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Interactive single-image segmentation is ubiquitous in the scientific and
commercial imaging software. In this work, we focus on the single-image
segmentation problem only with some seeds such as scribbles. Inspired by the
dynamic receptive field in the human being's visual system, we propose the
Gaussian dynamic convolution (GDC) to fast and efficiently aggregate the
contextual information for neural networks. The core idea is randomly selecting
the spatial sampling area according to the Gaussian distribution offsets. Our
GDC can be easily used as a module to build lightweight or complex segmentation
networks. We adopt the proposed GDC to address the typical single-image
segmentation tasks. Furthermore, we also build a Gaussian dynamic pyramid
Pooling to show its potential and generality in common semantic segmentation.
Experiments demonstrate that the GDC outperforms other existing convolutions on
three benchmark segmentation datasets including Pascal-Context, Pascal-VOC
2012, and Cityscapes. Additional experiments are also conducted to illustrate
that the GDC can produce richer and more vivid features compared with other
convolutions. In general, our GDC is conducive to the convolutional neural
networks to form an overall impression of the image.
- Abstract(参考訳): インタラクティブなシングルイメージセグメンテーションは、科学および商業のイメージングソフトウェアにおいてユビキタスである。
本研究では,スクリブルなどの種子のみを用いた単一画像分割問題に焦点をあてる。
人間の視覚系における動的受容場に着想を得て,ニューラルネットワークの文脈情報を高速かつ効率的に集約するガウス動的畳み込み(gdc)を提案する。
中心となる考え方は、ガウス分布オフセットに従って空間サンプリング領域をランダムに選択することである。
我々のGDCは、軽量または複雑なセグメンテーションネットワークを構築するモジュールとして簡単に利用できる。
提案したGDCを用いて、典型的な単一画像分割タスクに対処する。
さらに,ガウスの動的ピラミッド・プールも構築し,そのポテンシャルと共通セマンティックセグメンテーションの一般性を示す。
実験によると、GDCはPascal-Context、Pascal-VOC 2012、Cityscapesを含む3つのベンチマークセグメンテーションデータセットで、既存の畳み込みよりも優れている。
また、GDCが他の畳み込みよりも豊かで鮮明な特徴を生み出すことを示すために、さらなる実験が行われた。
一般に、我々のgdcは畳み込みニューラルネットワークと結合し、画像の全体的な印象を形成する。
関連論文リスト
- Segment Anything in 3D Gaussians [69.68566640585671]
ニューラルレイディアンス場(NeRF)の代替3次元表現として3次元ガウス散乱が出現した
3Dガウス表現は未解析であるため、まずこの領域内でオブジェクトセグメンテーションを実行する必要がある。
本研究では,3次元ガウス空間における物体分割を,学習過程や学習パラメータを使わずに,対話的な手順で実現するための新しい手法を提案する。
論文 参考訳(メタデータ) (2024-01-31T14:19:03Z) - CoSSegGaussians: Compact and Swift Scene Segmenting 3D Gaussians with
Dual Feature Fusion [17.778755539808547]
RGB画像のみを入力した高速レンダリング速度で3次元連続シーンセグメンテーションを実現する手法を提案する。
本モデルでは, セグメンテーションタスクのセグメンテーションにおいて, セグメンテーション・セグメンテーション・タスクのベースラインに優れる。
論文 参考訳(メタデータ) (2024-01-11T14:05:01Z) - SPPNet: A Single-Point Prompt Network for Nuclei Image Segmentation [6.149725843029721]
核画像分割のためのシングルポイントプロンプトネットワークを提案する。
オリジナル画像エンコーダを軽量な視覚変換器に置き換える。
提案モデルはMoNuSeg-2018データセットで評価される。
論文 参考訳(メタデータ) (2023-08-23T16:13:58Z) - Two-Stream Graph Convolutional Network for Intra-oral Scanner Image
Segmentation [133.02190910009384]
本稿では,2ストリームグラフ畳み込みネットワーク(TSGCN)を提案する。
TSGCNは3次元歯(表面)セグメンテーションにおいて最先端の方法よりも優れています。
論文 参考訳(メタデータ) (2022-04-19T10:41:09Z) - Fast and High-Quality Image Denoising via Malleable Convolutions [72.18723834537494]
動的畳み込みの効率的な変種として、Malleable Convolution (MalleConv)を提案する。
以前の作品とは異なり、MalleConvは入力から空間的に変化するカーネルのより小さなセットを生成する。
また、MalleNetという造語であるMalleConvを用いて、効率的なdenoisingネットワークを構築した。
論文 参考訳(メタデータ) (2022-01-02T18:35:20Z) - Deep ensembles based on Stochastic Activation Selection for Polyp
Segmentation [82.61182037130406]
本研究は,大腸内視鏡検査における画像分割,特に正確なポリープ検出とセグメンテーションを扱う。
イメージセグメンテーションの基本アーキテクチャはエンコーダとデコーダで構成されている。
我々はデコーダのバックボーンを変更することで得られるDeepLabアーキテクチャのバリエーションを比較した。
論文 参考訳(メタデータ) (2021-04-02T02:07:37Z) - Fully Convolutional Networks for Panoptic Segmentation [91.84686839549488]
そこで我々は,Panoptic FCNという概念的,シンプルで,強力で,効率的なパノプティックセグメンテーションフレームワークを提案する。
我々のアプローチは、統一された完全な畳み込みパイプラインにおいて、前景や背景を表現し、予測することを目的としています。
Panoptic FCNは、提案されたカーネルジェネレータで、各オブジェクトインスタンスまたは物カテゴリを特定のカーネル重みにエンコードする。
論文 参考訳(メタデータ) (2020-12-01T18:31:41Z) - Learning compact generalizable neural representations supporting
perceptual grouping [7.23389716633927]
本稿では,皮質回路に横方向接続をユビキタスに組み込んだバイオインスパイアされたリカレントユニットであるV1Netを紹介する。
V1Net-DCNの学習効率と精度を、慎重に選択された14のフィードフォワードおよびリカレントニューラルネットワークアーキテクチャと比較した。
これらの結果から, 小型3層V1Net-DCNは, 試験精度, 試料効率を比較検討した。
論文 参考訳(メタデータ) (2020-06-21T05:46:01Z) - The Semantic Mutex Watershed for Efficient Bottom-Up Semantic Instance
Segmentation [15.768804877756384]
本稿では,共同グラフ分割とラベリングのためのグリーディアルゴリズムを提案する。
アルゴリズムの効率のため、イメージをスーパーピクセルにオーバーセグメンテーションすることなく、直接ピクセル上で操作することができる。
論文 参考訳(メタデータ) (2019-12-29T19:48:39Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。