論文の概要: Strip Pooling: Rethinking Spatial Pooling for Scene Parsing
- arxiv url: http://arxiv.org/abs/2003.13328v1
- Date: Mon, 30 Mar 2020 10:40:11 GMT
- ステータス: 処理完了
- システム内更新日: 2022-12-18 08:05:17.952964
- Title: Strip Pooling: Rethinking Spatial Pooling for Scene Parsing
- Title(参考訳): strip pooling: シーン解析のための空間プール再考
- Authors: Qibin Hou, Li Zhang, Ming-Ming Cheng, Jiashi Feng
- Abstract要約: 長いが狭いカーネル、すなわち1xNまたはNx1を考えるストリッププーリングを導入する。
提案するストリッププール性能と従来の空間プール技術との比較を行った。
両方の新しいプールベースのデザインは軽量であり、既存のシーン解析ネットワークにおいて効率的なプラグアンドプレイモジュールとして機能する。
- 参考スコア(独自算出の注目度): 161.7521770950933
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Spatial pooling has been proven highly effective in capturing long-range
contextual information for pixel-wise prediction tasks, such as scene parsing.
In this paper, beyond conventional spatial pooling that usually has a regular
shape of NxN, we rethink the formulation of spatial pooling by introducing a
new pooling strategy, called strip pooling, which considers a long but narrow
kernel, i.e., 1xN or Nx1. Based on strip pooling, we further investigate
spatial pooling architecture design by 1) introducing a new strip pooling
module that enables backbone networks to efficiently model long-range
dependencies, 2) presenting a novel building block with diverse spatial pooling
as a core, and 3) systematically comparing the performance of the proposed
strip pooling and conventional spatial pooling techniques. Both novel
pooling-based designs are lightweight and can serve as an efficient
plug-and-play module in existing scene parsing networks. Extensive experiments
on popular benchmarks (e.g., ADE20K and Cityscapes) demonstrate that our simple
approach establishes new state-of-the-art results. Code is made available at
https://github.com/Andrew-Qibin/SPNet.
- Abstract(参考訳): 空間プーリングは、シーン解析のようなピクセル単位での予測タスクの長距離コンテキスト情報を取得するのに非常に効果的であることが証明されている。
本稿では、通常NxNの規則的な形状を持つ従来の空間プーリング以外にも、長いが狭いカーネルである1xNやNx1を考えるストリッププーリングと呼ばれる新しいプール戦略を導入することで、空間プーリングの定式化を再考する。
ストリッププーリングに基づき,空間プーリングアーキテクチャの設計をさらに検討する。
1) バックボーンネットワークが長距離依存を効率的にモデル化できる新しいストリッププールモジュールを導入する。
2 多様な空間プールをコアとする新規なビルディングブロックの提示、及び
3) 提案するストリッププーリングの性能と従来の空間プーリング手法を体系的に比較した。
両方の新しいプールベースのデザインは軽量であり、既存のシーン解析ネットワークにおいて効率的なプラグアンドプレイモジュールとして機能する。
一般的なベンチマーク(ADE20KやCityscapesなど)に関する大規模な実験は、我々の単純なアプローチが新しい最先端の結果を確立することを示した。
コードはhttps://github.com/andrew-qibin/spnetで入手できる。
関連論文リスト
- MorphPool: Efficient Non-linear Pooling & Unpooling in CNNs [9.656707333320037]
ポーリングは本質的には数学的形態学の分野からの操作であり、極大プールは限定的な特殊なケースである。
プール操作に加えて、ピクセルレベルの予測に使用されるエンコーダデコーダネットワークもアンプールを必要とする。
2つのタスクと3つの大規模データセットの大規模な実験により、モルフォロジープーリングとアンプールがパラメータ数を大幅に削減して予測性能を向上させることが示されている。
論文 参考訳(メタデータ) (2022-11-25T11:25:20Z) - Pooling Revisited: Your Receptive Field is Suboptimal [35.11562214480459]
受信フィールドのサイズと形状は、ネットワークがどのようにローカル情報を集約するかを決定する。
我々はDynOPoolと呼ばれるシンプルだが効果的な動的最適化プール操作を提案する。
実験の結果,学習可能なリサイズモジュールを備えたモデルは,画像分類やセマンティックセグメンテーションにおいて,複数のデータセットのベースラインネットワークよりも優れていることがわかった。
論文 参考訳(メタデータ) (2022-05-30T17:03:40Z) - Fuzzy Pooling [7.6146285961466]
畳み込みニューラルネットワーク(英: Convolutional Neural Networks、CNN)は、一般的には畳み込みとプールという2つの操作に基づく人工知能システムである。
本稿では, (type-1) ファジィ集合に基づく新しいプール操作を提案し, 特徴写像の局所的精度に対処する。
公開データセットを用いた実験により,提案手法はCNNの分類性能を向上させることができることが示された。
論文 参考訳(メタデータ) (2022-02-12T11:18:32Z) - AdaPool: Exponential Adaptive Pooling for Information-Retaining
Downsampling [82.08631594071656]
畳み込み層は畳み込みニューラルネットワーク(CNN)の重要な構成要素である
適応的で指数関数的に重み付けされたアダプール法を提案する。
adaPoolは画像やビデオの分類やオブジェクト検出など,さまざまなタスクを通じて,ディテールの保存性の向上を実証する。
論文 参考訳(メタデータ) (2021-11-01T08:50:37Z) - Learning Semantic Segmentation of Large-Scale Point Clouds with Random
Sampling [52.464516118826765]
我々はRandLA-Netを紹介した。RandLA-Netは、大規模ポイントクラウドのポイントごとの意味を推論する、効率的で軽量なニューラルネットワークアーキテクチャである。
我々のアプローチの鍵は、より複雑な点選択アプローチではなく、ランダムな点サンプリングを使用することである。
我々のRandLA-Netは、既存のアプローチよりも最大200倍高速な1回のパスで100万ポイントを処理できます。
論文 参考訳(メタデータ) (2021-07-06T05:08:34Z) - Refining activation downsampling with SoftPool [74.1840492087968]
畳み込みニューラルネットワーク(cnns)は、アクティベーションマップのサイズを減らすためにプールを使用する。
指数重化アクティベーションダウンサンプリングの高速かつ効率的な方法であるSoftPoolを提案します。
SoftPoolは、アクティベーションマップの縮小でより多くの情報を保持できることを示します。
論文 参考訳(メタデータ) (2021-01-02T12:09:49Z) - ASAP-Net: Attention and Structure Aware Point Cloud Sequence
Segmentation [49.15948235059343]
我々は、ASAPと呼ばれるフレキシブルモジュールにより、ポイントテンポラルクラウド機能をさらに改善する。
我々のASAPモジュールは、フレーム間の比較的情報性の高い局所的特徴を連続的に融合させるために、注意深い時間的埋め込み層を含んでいる。
本稿では、ポイントクラウドシーケンシャルセグメンテーションのための異なる計算バックボーンネットワークを持つASAPモジュールの一般化能力を示す。
論文 参考訳(メタデータ) (2020-08-12T07:37:16Z) - SimPool: Towards Topology Based Graph Pooling with Structural Similarity
Features [0.0]
本稿では,2つの主要な寄与について提案する。1つ目は,隣接行列に基づく構造的類似性を計算した差分モジュールである。
2つ目の主な貢献は、これらの機能をDiffPool arXiv:1806.08804の再検討されたプール層と統合し、SimPoolと呼ばれるプーリング層を提案することである。
実験の結果、エンドツーエンドのグラフニューラルネットワークアーキテクチャの一部として、SimPoolは、より局所性に近いノードクラスタ割り当てを計算する。
論文 参考訳(メタデータ) (2020-06-03T12:51:57Z) - Real-Time High-Performance Semantic Image Segmentation of Urban Street
Scenes [98.65457534223539]
都市景観のロバストなセマンティックセマンティックセグメンテーションのためのリアルタイムDCNNに基づく高速DCNN手法を提案する。
提案手法は, 51.0 fps と 39.3 fps の推論速度で, 平均 73.6% と平均 68.0% (mIoU) の精度を実現する。
論文 参考訳(メタデータ) (2020-03-11T08:45:53Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。