論文の概要: Dilated SpineNet for Semantic Segmentation
- arxiv url: http://arxiv.org/abs/2103.12270v1
- Date: Tue, 23 Mar 2021 02:39:04 GMT
- ステータス: 処理完了
- システム内更新日: 2021-03-25 02:42:30.868649
- Title: Dilated SpineNet for Semantic Segmentation
- Title(参考訳): セマンティックセグメンテーションのためのDilated SpineNet
- Authors: Abdullah Rashwan and Xianzhi Du and Xiaoqi Yin and Jing Li
- Abstract要約: スケール順列ネットワークは、オブジェクト境界ボックス検出とインスタンスセグメンテーションに有望な結果を示した。
本研究では,このセマンティックセグメンテーションのメタアーキテクチャ設計を評価する。
我々は,DeepLabv3システムからNASによって発見されたネットワークであるSpineNet-Segを提案する。
- 参考スコア(独自算出の注目度): 5.6590540986523035
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Scale-permuted networks have shown promising results on object bounding box
detection and instance segmentation. Scale permutation and cross-scale fusion
of features enable the network to capture multi-scale semantics while
preserving spatial resolution. In this work, we evaluate this meta-architecture
design on semantic segmentation - another vision task that benefits from high
spatial resolution and multi-scale feature fusion at different network stages.
By further leveraging dilated convolution operations, we propose SpineNet-Seg,
a network discovered by NAS that is searched from the DeepLabv3 system.
SpineNet-Seg is designed with a better scale-permuted network topology with
customized dilation ratios per block on a semantic segmentation task.
SpineNet-Seg models outperform the DeepLabv3/v3+ baselines at all model scales
on multiple popular benchmarks in speed and accuracy. In particular, our
SpineNet-S143+ model achieves the new state-of-the-art on the popular
Cityscapes benchmark at 83.04% mIoU and attained strong performance on the
PASCAL VOC2012 benchmark at 85.56% mIoU. SpineNet-Seg models also show
promising results on a challenging Street View segmentation dataset. Code and
checkpoints will be open-sourced.
- Abstract(参考訳): スケール置換されたネットワークは、オブジェクト境界ボックスの検出とインスタンスセグメンテーションに有望な結果を示している。
スケールの置換とクロススケールな機能の融合により、ネットワークは空間解像度を維持しながらマルチスケールのセマンティクスをキャプチャできる。
本稿では,セマンティックセグメンテーションにおけるメタアーキテクチャ設計について評価する。ネットワークの異なる段階において,高い空間分解能とマルチスケール機能融合の利点を享受するもう1つのビジョンタスクである。
拡張畳み込み処理のさらなる活用により,DeepLabv3システムからNASによって発見されたネットワークであるSpineNet-Segを提案する。
spinenet-segは、セマンティックセグメンテーションタスクでブロック毎の拡張比をカスタマイズした、スケール順に変化するネットワークトポロジーで設計されている。
SpineNet-Segモデルは、DeepLabv3/v3+のベースラインを、スピードと精度で複数の人気のあるベンチマークで上回っている。
特に,私たちのSpineNet-S143+モデルは,人気の高いCityscapesベンチマークの83.04% mIoUでの最先端性を達成し,PASCAL VOC2012ベンチマークの85.56% mIoUでの強いパフォーマンスを達成した。
SpineNet-Segモデルは、挑戦的なストリートビューセグメンテーションデータセットで有望な結果を示す。
コードとチェックポイントはオープンソースになる。
関連論文リスト
- Y-CA-Net: A Convolutional Attention Based Network for Volumetric Medical Image Segmentation [47.12719953712902]
差別的なローカル機能は、注目ベースのVSメソッドのパフォーマンスの鍵となるコンポーネントである。
コンボリューションエンコーダ分岐をトランスフォーマーバックボーンに組み込んで,局所的特徴と大域的特徴を並列に抽出する。
Y-CT-Netは、複数の医療セグメンテーションタスクにおいて競合性能を達成する。
論文 参考訳(メタデータ) (2024-10-01T18:50:45Z) - PointeNet: A Lightweight Framework for Effective and Efficient Point
Cloud Analysis [28.54939134635978]
PointeNetは、ポイントクラウド分析に特化したネットワークである。
本手法は,分類/分割ヘッドとシームレスに統合したり,市販の3Dオブジェクト検出ネットワークに埋め込んだりすることで,柔軟性を示す。
ModelNet40、ScanObjectNN、ShapeNet KITTI、およびシーンレベルのデータセットKITTIを含むオブジェクトレベルのデータセットの実験は、ポイントクラウド分析における最先端メソッドよりもPointeNetの方が優れたパフォーマンスを示している。
論文 参考訳(メタデータ) (2023-12-20T03:34:48Z) - SODAWideNet -- Salient Object Detection with an Attention augmented Wide
Encoder Decoder network without ImageNet pre-training [3.66237529322911]
我々は、ImageNet事前トレーニングなしで、Salient Object Detectionを直接訓練したスクラッチからニューラルネットワークを開発することを検討する。
本稿では,Salient Object Detection のためのエンコーダデコーダ型ネットワーク SODAWideNet を提案する。
SODAWideNet-S (3.03M) と SODAWideNet (9.03M) の2つの変種は、5つのデータセット上の最先端モデルと競合する性能を達成する。
論文 参考訳(メタデータ) (2023-11-08T16:53:44Z) - SVNet: Where SO(3) Equivariance Meets Binarization on Point Cloud
Representation [65.4396959244269]
本論文は,3次元学習アーキテクチャを構築するための一般的なフレームワークを設計することによる課題に対処する。
提案手法はPointNetやDGCNNといった一般的なバックボーンに適用できる。
ModelNet40、ShapeNet、および実世界のデータセットであるScanObjectNNの実験では、この手法が効率、回転、精度の間の大きなトレードオフを達成することを示した。
論文 参考訳(メタデータ) (2022-09-13T12:12:19Z) - Lightweight and Progressively-Scalable Networks for Semantic
Segmentation [100.63114424262234]
マルチスケール学習フレームワークは,セマンティックセグメンテーションを向上する有効なモデルのクラスと見なされてきた。
本稿では,畳み込みブロックの設計と,複数スケールにわたる相互作用の仕方について,徹底的に解析する。
我々は,軽量で拡張性の高いネットワーク(LPS-Net)を考案した。
論文 参考訳(メタデータ) (2022-07-27T16:00:28Z) - Point-Unet: A Context-aware Point-based Neural Network for Volumetric
Segmentation [18.81644604997336]
本稿では,3次元点雲による深層学習の効率をボリュームセグメンテーションに組み込む新しい手法であるPoint-Unetを提案する。
私たちのキーとなるアイデアは、まず注意確率マップを学習することで、ボリュームに対する関心領域を予測することです。
異なるメトリクスに関する包括的なベンチマークでは、私たちのコンテキスト認識のPoint-UnetがSOTAのボクセルベースネットワークより優れていることが示されている。
論文 参考訳(メタデータ) (2022-03-16T22:02:08Z) - Background-Aware 3D Point Cloud Segmentationwith Dynamic Point Feature
Aggregation [12.093182949686781]
DPFA-Net(Dynamic Point Feature Aggregation Network)と呼ばれる新しい3Dポイント・クラウド・ラーニング・ネットワークを提案する。
DPFA-Netにはセマンティックセグメンテーションと3Dポイントクラウドの分類のための2つのバリエーションがある。
S3DISデータセットのセマンティックセグメンテーションのための、最先端の全体的な精度スコアを達成する。
論文 参考訳(メタデータ) (2021-11-14T05:46:05Z) - Location-Sensitive Visual Recognition with Cross-IOU Loss [177.86369890708457]
本稿では,オブジェクト検出,インスタンスセグメンテーション,ポーズ推定のための位置感知ネットワーク (LSNet) という統合ソリューションを提案する。
ディープニューラルネットワークをバックボーンとして、LSNetは、ターゲットオブジェクトの形状を一緒に定義するアンカーポイントとランドマークのセットを予測します。
論文 参考訳(メタデータ) (2021-04-11T02:17:14Z) - SALA: Soft Assignment Local Aggregation for Parameter Efficient 3D
Semantic Segmentation [65.96170587706148]
3dポイントクラウドセマンティクスセグメンテーションのためのパラメータ効率の良いネットワークを生成するポイントローカルアグリゲーション関数の設計に着目する。
グリッド型アグリゲーション関数における学習可能な隣り合わせソフトアロケーションの利用について検討する。
論文 参考訳(メタデータ) (2020-12-29T20:16:37Z) - Real-Time Semantic Segmentation via Auto Depth, Downsampling Joint
Decision and Feature Aggregation [54.28963233377946]
本稿では,セグメンテーション戦略の自動化を目的として,AutoRTNetという共同検索フレームワークを提案する。
具体的には,ネットワーク深度とダウンサンプリング戦略を協調的に決定するハイパーセルと,自動マルチスケール機能アグリゲーションを実現するアグリゲーションセルを提案する。
論文 参考訳(メタデータ) (2020-03-31T14:02:25Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。