論文の概要: Split-Merge Pooling
- arxiv url: http://arxiv.org/abs/2006.07742v1
- Date: Sat, 13 Jun 2020 23:20:30 GMT
- ステータス: 処理完了
- システム内更新日: 2022-11-21 21:18:27.524296
- Title: Split-Merge Pooling
- Title(参考訳): スプリットマージプール
- Authors: Omid Hosseini Jafari, Carsten Rother
- Abstract要約: スプリット・マージ・プールはサブサンプリングなしで空間情報を保存するために導入された。
本研究では,CityscapesとGTA-5データセットから得られた大規模画像の高密度なセマンティックセマンティックセマンティックセグメンテーションについて検討した。
- 参考スコア(独自算出の注目度): 36.2980225204665
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: There are a variety of approaches to obtain a vast receptive field with
convolutional neural networks (CNNs), such as pooling or striding convolutions.
Most of these approaches were initially designed for image classification and
later adapted to dense prediction tasks, such as semantic segmentation.
However, the major drawback of this adaptation is the loss of spatial
information. Even the popular dilated convolution approach, which in theory is
able to operate with full spatial resolution, needs to subsample features for
large image sizes in order to make the training and inference tractable. In
this work, we introduce Split-Merge pooling to fully preserve the spatial
information without any subsampling. By applying Split-Merge pooling to deep
networks, we achieve, at the same time, a very large receptive field. We
evaluate our approach for dense semantic segmentation of large image sizes
taken from the Cityscapes and GTA-5 datasets. We demonstrate that by replacing
max-pooling and striding convolutions with our split-merge pooling, we are able
to improve the accuracy of different variations of ResNet significantly.
- Abstract(参考訳): プールやストライド畳み込みなど、畳み込みニューラルネットワーク(CNN)を備えた広大な受容領域を得るには、さまざまなアプローチがある。
これらのアプローチの多くは、最初は画像分類のために設計され、後にセマンティックセグメンテーションのような密集した予測タスクに適応した。
しかし、この適応の大きな欠点は空間情報の喪失である。
理論上、全空間解像度で操作できる一般的な拡張畳み込みアプローチでさえ、トレーニングと推論を抽出できるように、大きな画像サイズの特徴をサブサンプリングする必要がある。
本研究ではスプリット・マージ・プールを導入し,サブサンプリングなしで空間情報を完全保存する。
Split-Mergeプーリングをディープネットワークに適用することにより、同時に非常に大きな受容場を実現する。
我々は,都市景観とgta-5データセットから得られた大規模画像サイズの密集したセマンティックセグメンテーションのアプローチを評価する。
我々は、最大プールとストレート畳み込みを分割マージプールに置き換えることで、ResNetの異なるバリエーションの精度を大幅に改善できることを実証した。
関連論文リスト
- FuseNet: Self-Supervised Dual-Path Network for Medical Image
Segmentation [3.485615723221064]
FuseNetは、自己教師型セマンティックセグメンテーションのためのデュアルストリームフレームワークである。
クロスモーダル融合技術は、テキストデータを拡張画像に置き換えることで、CLIPの原理を拡張している。
皮膚病変と肺分画データセットの実験により, 本手法の有効性が示された。
論文 参考訳(メタデータ) (2023-11-22T00:03:16Z) - DeepMerge: Deep-Learning-Based Region-Merging for Image Segmentation [7.063322114865965]
本稿では,DeepMergeと呼ばれる深層学習に基づく領域マージ手法を提案する。
これは、ディープラーニングを用いて類似性を学習し、RAGに隣接する類似のスーパーピクセルをマージする最初の方法である。
DeepMergeは最も高いF値(0.9550)と最も低い総誤差TE(0.0895)を達成し、異なるサイズのオブジェクトを正しく分割し、競合する全てのセグメンテーション法より優れている。
論文 参考訳(メタデータ) (2023-05-31T12:27:58Z) - Pooling Revisited: Your Receptive Field is Suboptimal [35.11562214480459]
受信フィールドのサイズと形状は、ネットワークがどのようにローカル情報を集約するかを決定する。
我々はDynOPoolと呼ばれるシンプルだが効果的な動的最適化プール操作を提案する。
実験の結果,学習可能なリサイズモジュールを備えたモデルは,画像分類やセマンティックセグメンテーションにおいて,複数のデータセットのベースラインネットワークよりも優れていることがわかった。
論文 参考訳(メタデータ) (2022-05-30T17:03:40Z) - AF$_2$: Adaptive Focus Framework for Aerial Imagery Segmentation [86.44683367028914]
航空画像のセグメンテーションにはいくつかの独特な課題があり、中でも最も重要なものは前景と背景のアンバランスにある。
本稿では,階層的なセグメンテーション手法を採用し,マルチスケール表現を適応的に活用するAdaptive Focus Framework (AF$)を提案する。
AF$は、広く使われている3つの航空ベンチマークの精度を大幅に改善した。
論文 参考訳(メタデータ) (2022-02-18T10:14:45Z) - Multi-Representation Adaptation Network for Cross-domain Image
Classification [20.615155915233693]
画像分類では、十分なラベルを取得するのに高価で時間がかかることが多い。
既存のアプローチは、主に単一の構造によって抽出された表現の分布を整列させる。
クロスドメイン画像分類における分類精度を劇的に向上させる多表現適応を提案する。
論文 参考訳(メタデータ) (2022-01-04T06:34:48Z) - Augmenting Convolutional networks with attention-based aggregation [55.97184767391253]
我々は,非局所的推論を実現するために,注目に基づくグローバルマップを用いた畳み込みネットワークの強化方法を示す。
この学習集約層を2つのパラメータ(幅と深さ)でパラメータ化した単純パッチベースの畳み込みネットワークで接続する。
これは、特にメモリ消費の点で、精度と複雑さの間の驚くほど競争力のあるトレードオフをもたらす。
論文 参考訳(メタデータ) (2021-12-27T14:05:41Z) - Adaptive Context-Aware Multi-Modal Network for Depth Completion [107.15344488719322]
我々は,観測された空間コンテキストを捉えるために,グラフ伝搬を採用することを提案する。
次に、注意機構を伝搬に適用し、ネットワークが文脈情報を適応的にモデル化することを奨励する。
最後に、抽出したマルチモーダル特徴を効果的に活用するための対称ゲート融合戦略を導入する。
本稿では,Adaptive Context-Aware Multi-Modal Network (ACMNet) を2つのベンチマークで評価した。
論文 参考訳(メタデータ) (2020-08-25T06:00:06Z) - Semantic Segmentation With Multi Scale Spatial Attention For Self
Driving Cars [2.7317088388886384]
本稿では,様々なスケールのマルチスケール特徴融合を用いた新しいニューラルネットワークを提案し,その精度と効率的なセマンティックイメージセグメンテーションを提案する。
我々は、ResNetベースの特徴抽出器、ダウンサンプリング部における拡張畳み込み層、アップサンプリング部におけるアトラス畳み込み層を使用し、コンキャット操作を用いてそれらをマージした。
より文脈的な情報をエンコードし、ネットワークの受容領域を強化するため、新しいアテンションモジュールが提案されている。
論文 参考訳(メタデータ) (2020-06-30T20:19:09Z) - CRNet: Cross-Reference Networks for Few-Shot Segmentation [59.85183776573642]
少ないショットセグメンテーションは、少数のトレーニングイメージを持つ新しいクラスに一般化できるセグメンテーションモデルを学ぶことを目的としている。
相互参照機構により、我々のネットワークは2つの画像に共起する物体をよりよく見つけることができる。
PASCAL VOC 2012データセットの実験は、我々のネットワークが最先端のパフォーマンスを達成することを示す。
論文 参考訳(メタデータ) (2020-03-24T04:55:43Z) - Image Fine-grained Inpainting [89.17316318927621]
拡張畳み込みの密結合を利用してより大きく効果的な受容場を得る一段階モデルを提案する。
この効率的なジェネレータをよく訓練するために、頻繁に使用されるVGG特徴整合損失を除いて、新しい自己誘導回帰損失を設計する。
また、局所的・グローバルな分枝を持つ識別器を用いて、局所的・グローバルな内容の整合性を確保する。
論文 参考訳(メタデータ) (2020-02-07T03:45:25Z) - Gated Path Selection Network for Semantic Segmentation [72.44994579325822]
我々は,適応的な受容場を学習することを目的とした,GPSNetという新しいネットワークを開発した。
GPSNetにおいて、我々はまず2次元のマルチスケールネットワーク、SuperNetを設計する。
望ましいセマンティックコンテキストを動的に選択するために、ゲート予測モジュールがさらに導入される。
論文 参考訳(メタデータ) (2020-01-19T12:32:17Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。