論文の概要: ElegantSeg: End-to-End Holistic Learning for Extra-Large Image Semantic
Segmentation
- arxiv url: http://arxiv.org/abs/2211.11316v1
- Date: Mon, 21 Nov 2022 10:00:59 GMT
- ステータス: 処理完了
- システム内更新日: 2022-11-22 21:00:20.158926
- Title: ElegantSeg: End-to-End Holistic Learning for Extra-Large Image Semantic
Segmentation
- Title(参考訳): elegantseg: 大規模画像セマンティクスセグメンテーションのためのエンドツーエンド総合学習
- Authors: Wei Chen, Yansheng Li, Bo Dang, Yongjun Zhang
- Abstract要約: 本稿では,ELISS(包括的外画像セマンティックセマンティックセマンティックス)の処理を可能としたElegantSegという,大規模画像セマンティックスの新しいパラダイムを提案する。
従来の方法とは異なり、ElegantSegは、テンソルストレージをGPUメモリからホストメモリに拡張することで、全体的なELISSをエレガントに処理することができる。
ElegantSegは2つの典型的なELISSデータセットにおいて、これまでの最先端よりも優れています。
- 参考スコア(独自算出の注目度): 9.704776038367262
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: This paper presents a new paradigm for Extra-large image semantic
Segmentation, called ElegantSeg, that capably processes holistic extra-large
image semantic segmentation (ELISS). The extremely large sizes of extra-large
images (ELIs) tend to cause GPU memory exhaustion. To tackle this issue,
prevailing works either follow the global-local fusion pipeline or conduct the
multi-stage refinement. These methods can only process limited information at
one time, and they are not able to thoroughly exploit the abundant information
in ELIs. Unlike previous methods, ElegantSeg can elegantly process holistic
ELISS by extending the tensor storage from GPU memory to host memory. To the
best of our knowledge, it is the first time that ELISS can be performed
holistically. Besides, ElegantSeg is specifically designed with three modules
to utilize the characteristics of ELIs, including the multiple large kernel
module for developing long-range dependency, the efficient class relation
module for building holistic contextual relationships, and the boundary-aware
enhancement module for obtaining complete object boundaries. ElegantSeg
outperforms previous state-of-the-art on two typical ELISS datasets. We hope
that ElegantSeg can open a new perspective for ELISS. The code and models will
be made publicly available.
- Abstract(参考訳): 本稿では,超大規模画像セマンティクスセグメンテーション(eliss)を包括的に処理可能な,超大規模画像セマンティクスセグメンテーションのための新しいパラダイムを提案する。
超大型画像(elis)の非常に大きなサイズは、gpuメモリの枯渇を引き起こす傾向がある。
この問題に取り組むためには、グローバル・ローカル・フュージョン・パイプラインに従うか、マルチステージ・リファインメントを行う。
これらの手法は一度に限られた情報のみを処理でき、ELIの豊富な情報を徹底的に活用することはできない。
従来の方法とは異なり、エレガントsegはテンソルストレージをgpuメモリからホストメモリに拡張することで、総合的なelisをエレガントに処理できる。
私たちの知る限りでは、ELISSをホリスティックに行うのは初めてです。
さらに、ElegantSegは、長距離依存性を開発するための複数の大きなカーネルモジュール、全体的コンテキスト関係を構築するための効率的なクラス関係モジュール、完全なオブジェクト境界を得るための境界認識拡張モジュールを含む、ELIの特性を利用するための3つのモジュールを特別に設計している。
ElegantSegは2つの典型的なELISSデータセットにおいて、これまでの最先端よりも優れている。
ElegantSegがELISSの新しい視点を開拓できることを願っています。
コードとモデルは公開される予定だ。
関連論文リスト
- Salient Object Detection in Optical Remote Sensing Images Driven by
Transformer [69.22039680783124]
光リモートセンシング画像(ORSI-SOD)のためのGlobal extract Local Exploration Network(GeleNet)を提案する。
具体的には、GeleNetはまずトランスフォーマーバックボーンを採用し、グローバルな長距離依存関係を持つ4レベルの機能埋め込みを生成する。
3つの公開データセットに関する大規模な実験は、提案されたGeleNetが関連する最先端メソッドより優れていることを示している。
論文 参考訳(メタデータ) (2023-09-15T07:14:43Z) - Lightweight and Progressively-Scalable Networks for Semantic
Segmentation [100.63114424262234]
マルチスケール学習フレームワークは,セマンティックセグメンテーションを向上する有効なモデルのクラスと見なされてきた。
本稿では,畳み込みブロックの設計と,複数スケールにわたる相互作用の仕方について,徹底的に解析する。
我々は,軽量で拡張性の高いネットワーク(LPS-Net)を考案した。
論文 参考訳(メタデータ) (2022-07-27T16:00:28Z) - Highly Accurate Dichotomous Image Segmentation [139.79513044546]
Dichotomous Image segmentation (DIS)と呼ばれる新しいタスクは、自然画像から高度に正確な物体を抽出することを目的としている。
私たちは、5,470の高解像度画像(例えば、2K、4K以上の画像)を含む最初の大規模データセットdis5Kを収集します。
また、Disdisモデルトレーニングのための特徴レベルとマスクレベルの両方のガイダンスを用いて、単純な中間監視ベースライン(IS-Net)を導入する。
論文 参考訳(メタデータ) (2022-03-06T20:09:19Z) - Multi-Content Complementation Network for Salient Object Detection in
Optical Remote Sensing Images [108.79667788962425]
光リモートセンシング画像(RSI-SOD)における有能な物体検出は、いまだに課題である。
本稿では, RSI-SOD における複数コンテンツの相補性を検討するために, MCCNet (Multi-Content Complementation Network) を提案する。
MCCMでは、前景機能、エッジ機能、背景機能、グローバル画像レベル機能など、RSI-SODにとって重要な複数の機能について検討する。
論文 参考訳(メタデータ) (2021-12-02T04:46:40Z) - CSRNet: Cascaded Selective Resolution Network for Real-time Semantic
Segmentation [18.63596070055678]
本稿では,リアルタイムセグメンテーションの性能向上を図るために,光カスケード選択分解ネットワーク(CSRNet)を提案する。
提案するネットワークは,低解像度から高解像度までの特徴情報を統合した3段階セグメンテーションシステムを構築している。
2つのよく知られたデータセットの実験により、提案したCSRNetはリアルタイムセグメンテーションの性能を効果的に向上することを示した。
論文 参考訳(メタデータ) (2021-06-08T14:22:09Z) - MDA-Net: Multi-Dimensional Attention-Based Neural Network for 3D Image
Segmentation [4.221871357181261]
マルチ次元アテンションネットワーク(MDA-Net)を提案し,スライスワイド,空間,チャネルワイドアテンションを効率よくU-Netネットワークに統合する。
MICCAI iSegおよびIBSRデータセット上のモデルを評価し、実験結果が既存の方法よりも一貫した改善を示した。
論文 参考訳(メタデータ) (2021-05-10T16:58:34Z) - Cross-Attention in Coupled Unmixing Nets for Unsupervised Hyperspectral
Super-Resolution [79.97180849505294]
本稿では,HSIの空間分解能を高めるために,CUCaNetというクロスアテンション機構を備えた新しい結合型アンミックスネットワークを提案する。
3つの広く使われているHS-MSデータセットに対して、最先端のHSI-SRモデルと比較実験を行った。
論文 参考訳(メタデータ) (2020-07-10T08:08:20Z) - X-ModalNet: A Semi-Supervised Deep Cross-Modal Network for
Classification of Remote Sensing Data [69.37597254841052]
我々はX-ModalNetと呼ばれる新しいクロスモーダルディープラーニングフレームワークを提案する。
X-ModalNetは、ネットワークの上部にある高レベルな特徴によって構築されたアップダスタブルグラフ上にラベルを伝搬するため、うまく一般化する。
我々は2つのマルチモーダルリモートセンシングデータセット(HSI-MSIとHSI-SAR)上でX-ModalNetを評価し、いくつかの最先端手法と比較して大幅に改善した。
論文 参考訳(メタデータ) (2020-06-24T15:29:41Z) - GSANet: Semantic Segmentation with Global and Selective Attention [37.26671754212935]
セマンティックセグメンテーションのための新しいディープラーニングアーキテクチャを提案する。
我々はGSANetがMobileNetEdgeとより正確なセグメンテーションをもたらすことを示し、Xceptionのような強力なFXNを持つことを示した。
GSANetはADE20kとCityscapesのデータセットの最先端セマンティックセマンティックセマンティクスの精度を改善している。
論文 参考訳(メタデータ) (2020-02-14T00:09:42Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。