論文の概要: Towards Diverse Binary Segmentation via A Simple yet General Gated
Network
- arxiv url: http://arxiv.org/abs/2303.10396v1
- Date: Sat, 18 Mar 2023 11:26:36 GMT
- ステータス: 処理完了
- システム内更新日: 2023-03-21 19:35:50.404746
- Title: Towards Diverse Binary Segmentation via A Simple yet General Gated
Network
- Title(参考訳): 単純で汎用的なゲートネットワークによる多種多様なバイナリセグメンテーションに向けて
- Authors: Xiaoqi Zhao, Youwei Pang, Lihe Zhang, Huchuan Lu, Lei Zhang
- Abstract要約: 本稿では,バイナリセグメンテーションタスクに対処するシンプルな汎用ネットワーク(GateNet)を提案する。
多段ゲートユニットの助けを借りて、エンコーダからの貴重なコンテキスト情報をデコーダに選択的に送信することができる。
我々は,アトーラス畳み込みを改善するためにFold'操作を導入し,新しい折り畳み畳み畳み畳み畳み込みを形成する。
- 参考スコア(独自算出の注目度): 89.88222217065858
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: In many binary segmentation tasks, most CNNs-based methods use a U-shape
encoder-decoder network as their basic structure. They ignore two key problems
when the encoder exchanges information with the decoder: one is the lack of
interference control mechanism between them, the other is without considering
the disparity of the contributions from different encoder levels. In this work,
we propose a simple yet general gated network (GateNet) to tackle them all at
once. With the help of multi-level gate units, the valuable context information
from the encoder can be selectively transmitted to the decoder. In addition, we
design a gated dual branch structure to build the cooperation among the
features of different levels and improve the discrimination ability of the
network. Furthermore, we introduce a ``Fold'' operation to improve the atrous
convolution and form a novel folded atrous convolution, which can be flexibly
embedded in ASPP or DenseASPP to accurately localize foreground objects of
various scales. GateNet can be easily generalized to many binary segmentation
tasks, including general and specific object segmentation and multi-modal
segmentation. Without bells and whistles, our network consistently performs
favorably against the state-of-the-art methods under 10 metrics on 33 datasets
of 10 binary segmentation tasks.
- Abstract(参考訳): 多くのバイナリセグメンテーションタスクでは、ほとんどのCNNベースのメソッドは基本構造としてU字型エンコーダデコーダネットワークを使用している。
エンコーダがデコーダと情報を交換する際には2つの重要な問題を無視する: 1つは干渉制御機構の欠如であり、もう1つは異なるエンコーダレベルからのコントリビューションの相違を考慮しない。
本研究では,これらすべてを同時に扱うためのシンプルな汎用ネットワーク(GateNet)を提案する。
多レベルゲートユニットの助けを借りて、エンコーダからの貴重なコンテキスト情報をデコーダに選択的に送信することができる。
さらに,異なるレベルの特徴間の協調性を構築し,ネットワークの識別能力を向上させるために,ゲート付き二重分岐構造を設計する。
さらに,畳み込みを改良し,新しい折り畳み畳み畳み畳み畳み畳み込みをaspp や denseaspp に柔軟に組み込むことで,様々なスケールの前景オブジェクトを正確にローカライズする '`fold'' 演算を導入する。
GateNetは、汎用および特定のオブジェクトセグメンテーションやマルチモーダルセグメンテーションなど、多くのバイナリセグメンテーションタスクに簡単に一般化できる。
10のバイナリセグメンテーションタスクの33のデータセットの10以下のメトリクスに対して,当社のネットワークは一貫して,最先端のメソッドに対して好適に動作します。
関連論文リスト
- SACNet: A Spatially Adaptive Convolution Network for 2D Multi-organ Medical Segmentation [7.897088081928714]
医用画像解析における多臓器分割は診断と治療計画に不可欠である。
本稿では、変形可能な畳み込みV3の知識を利用して、空間適応畳み込みネットワーク(SACNet)を最適化する。
ACDCとSynapseの3Dスライスデータセットの実験は、SACNetが既存のいくつかの手法と比較して優れたセグメンテーション性能を提供することを示した。
論文 参考訳(メタデータ) (2024-07-14T10:58:09Z) - Object Segmentation by Mining Cross-Modal Semantics [68.88086621181628]
マルチモーダル特徴の融合と復号を導くために,クロスモーダル・セマンティックスをマイニングする手法を提案する。
具体的には,(1)全周減衰核融合(AF),(2)粗大デコーダ(CFD),(3)多層自己超越からなる新しいネットワークXMSNetを提案する。
論文 参考訳(メタデータ) (2023-05-17T14:30:11Z) - LENet: Lightweight And Efficient LiDAR Semantic Segmentation Using
Multi-Scale Convolution Attention [0.0]
本稿では,LDARに基づくセマンティックセマンティックセマンティクスのためのエンコーダデコーダ構造を持つLENetと呼ばれるプロジェクションベースのセマンティクスセマンティクスセマンティクスネットワークを提案する。
エンコーダは、特徴を捉えるために、様々な受信フィールドサイズを持つ新しいマルチスケール・コンボリューション・アテンション(MSCA)モジュールで構成されている。
提案手法は, 最先端のセマンティックセグメンテーション法と比較して, 軽量で, 効率的で, 堅牢であることを示す。
論文 参考訳(メタデータ) (2023-01-11T02:51:38Z) - Effective and Interpretable Information Aggregation with Capacity
Networks [3.4012007729454807]
キャパシティネットワークは、意味論的意味のある空間に集約できる複数の解釈可能な中間結果を生成する。
この単純な帰納バイアスを実装することで、異なるエンコーダ・デコーダアーキテクチャの改善がもたらされることを示す。
論文 参考訳(メタデータ) (2022-07-25T09:45:16Z) - Multi-scale and Cross-scale Contrastive Learning for Semantic
Segmentation [5.281694565226513]
セグメンテーションネットワークによって抽出されたマルチスケール特徴の識別能力を高めるために,コントラスト学習を適用した。
まず、エンコーダのマルチスケール表現を共通の特徴空間にマッピングすることにより、教師付き局所言語制約の新しい形式をインスタンス化する。
論文 参考訳(メタデータ) (2022-03-25T01:24:24Z) - Crosslink-Net: Double-branch Encoder Segmentation Network via Fusing
Vertical and Horizontal Convolutions [58.71117402626524]
医用画像分割のための新しいダブルブランチエンコーダアーキテクチャを提案する。
1)正方形畳み込みカーネルによる特徴の識別をさらに改善する必要があるため,非正方形および水平畳み込みカーネルの利用を提案する。
実験では,4つのデータセット上でのモデルの有効性を検証した。
論文 参考訳(メタデータ) (2021-07-24T02:58:32Z) - A Holistically-Guided Decoder for Deep Representation Learning with
Applications to Semantic Segmentation and Object Detection [74.88284082187462]
一般的な戦略の1つは、バックボーンネットワークに拡張畳み込みを採用し、高解像度のフィーチャーマップを抽出することです。
本稿では,高分解能なセマンティクスリッチな特徴マップを得るために紹介される,新たなホリスティック誘導デコーダを提案する。
論文 参考訳(メタデータ) (2020-12-18T10:51:49Z) - Interactive Video Object Segmentation Using Global and Local Transfer
Modules [51.93009196085043]
我々はアノテーションネットワーク(A-Net)と転送ネットワーク(T-Net)からなるディープニューラルネットワークを開発する。
A-Netは、フレーム上のユーザ記述を前提として、エンコーダ-デコーダアーキテクチャに基づいたセグメンテーション結果を生成する。
ユーザスクリブルをエミュレートし,補助的な損失を生かして,ネットワーク全体を2段階に分けてトレーニングする。
論文 参考訳(メタデータ) (2020-07-16T06:49:07Z) - Suppress and Balance: A Simple Gated Network for Salient Object
Detection [89.88222217065858]
両問題を同時に解くための単純なゲートネットワーク(GateNet)を提案する。
多レベルゲートユニットの助けを借りて、エンコーダからの貴重なコンテキスト情報をデコーダに最適に送信することができる。
さらに,提案したFold-ASPP操作(Fold-ASPP)に基づくアトラス空間ピラミッドプーリングを用いて,様々なスケールのサリアンオブジェクトを正確に位置決めする。
論文 参考訳(メタデータ) (2020-07-16T02:00:53Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。