論文の概要: Deep Generalized Max Pooling
- arxiv url: http://arxiv.org/abs/1908.05040v2
- Date: Mon, 26 Feb 2024 21:43:16 GMT
- ステータス: 処理完了
- システム内更新日: 2024-02-29 01:30:08.474315
- Title: Deep Generalized Max Pooling
- Title(参考訳): 深い一般化されたマックスプール
- Authors: Vincent Christlein, Lukas Spranger, Mathias Seuret, Anguelos Nicolaou,
Pavel Kr\'al, Andreas Maier
- Abstract要約: Deep Generalized Max Poolingは、空間的コヒーレント領域のすべての活性化の寄与のバランスをとる。
この層は、中世中世の写本の分類において、平均と最大のプールよりも優れていることを示す。
- 参考スコア(独自算出の注目度): 7.657265437363035
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Global pooling layers are an essential part of Convolutional Neural Networks
(CNN). They are used to aggregate activations of spatial locations to produce a
fixed-size vector in several state-of-the-art CNNs. Global average pooling or
global max pooling are commonly used for converting convolutional features of
variable size images to a fix-sized embedding. However, both pooling layer
types are computed spatially independent: each individual activation map is
pooled and thus activations of different locations are pooled together. In
contrast, we propose Deep Generalized Max Pooling that balances the
contribution of all activations of a spatially coherent region by re-weighting
all descriptors so that the impact of frequent and rare ones is equalized. We
show that this layer is superior to both average and max pooling on the
classification of Latin medieval manuscripts (CLAMM'16, CLAMM'17), as well as
writer identification (Historical-WI'17).
- Abstract(参考訳): グローバルプール層は畳み込みニューラルネットワーク(cnn)の重要な部分である。
それらは空間的位置の活性化を集約し、いくつかの最先端CNNで固定サイズのベクトルを生成するために使用される。
グローバル平均プーリング(Global average pooling)は、可変サイズの画像の畳み込み特性を固定サイズの埋め込みに変換するために一般的に用いられる。
しかし、どちらのプール層も空間的に独立に計算され、それぞれのアクティベーションマップがプール化され、異なる場所のアクティベーションがプール化される。
対照的に,空間的にコヒーレントな領域のすべての活性化の寄与を均衡させ,すべての記述子を再重み付けすることにより,頻繁かつ希少な領域の影響を均等化する深い一般化マックスプーリングを提案する。
この層は、中古写本の分類(CLAMM'16, CLAMM'17)と著者識別(Historical-WI'17)において、平均と最大のプールよりも優れていることを示す。
関連論文リスト
- Augmenting Convolutional networks with attention-based aggregation [55.97184767391253]
我々は,非局所的推論を実現するために,注目に基づくグローバルマップを用いた畳み込みネットワークの強化方法を示す。
この学習集約層を2つのパラメータ(幅と深さ)でパラメータ化した単純パッチベースの畳み込みネットワークで接続する。
これは、特にメモリ消費の点で、精度と複雑さの間の驚くほど競争力のあるトレードオフをもたらす。
論文 参考訳(メタデータ) (2021-12-27T14:05:41Z) - AdaPool: Exponential Adaptive Pooling for Information-Retaining
Downsampling [82.08631594071656]
畳み込み層は畳み込みニューラルネットワーク(CNN)の重要な構成要素である
適応的で指数関数的に重み付けされたアダプール法を提案する。
adaPoolは画像やビデオの分類やオブジェクト検出など,さまざまなタスクを通じて,ディテールの保存性の向上を実証する。
論文 参考訳(メタデータ) (2021-11-01T08:50:37Z) - Ordinal Pooling [26.873004843826962]
通常のプーリングは、シーケンス内のプール領域の要素を並べ替え、シーケンス内の順序に基づいて各要素に異なる重みを割り当てる。
実験により、ネットワークがプーリング層内で異なるタイプのプール操作を行うのが有利であることが示唆された。
論文 参考訳(メタデータ) (2021-09-03T14:33:02Z) - DualNorm-UNet: Incorporating Global and Local Statistics for Robust
Medical Image Segmentation [29.368070780337415]
バッチ正規化(BN)は,ネットワークトレーニングを加速する鍵となる要素の一つであり,医用画像解析分野で広く採用されている。
本稿では,意味クラス情報を正規化層に組み込むことにより,異なる領域に対応するアクティベーションを異なる方法で変調できるようにする。
本手法は正規化における意味的知識を活用し,頑健なセグメンテーション結果に対してより識別的特徴を与える。
論文 参考訳(メタデータ) (2021-03-29T18:09:56Z) - Dual-constrained Deep Semi-Supervised Coupled Factorization Network with
Enriched Prior [80.5637175255349]
本稿では、DS2CF-Netと呼ばれる、拡張された事前制約付きDual-Constrained Deep Semi-Supervised Coupled Factorization Networkを提案する。
隠れた深い特徴を抽出するために、DS2CF-Netは、深い構造と幾何学的な構造に制約のあるニューラルネットワークとしてモデル化される。
我々のネットワークは、表現学習とクラスタリングのための最先端の性能を得ることができる。
論文 参考訳(メタデータ) (2020-09-08T13:10:21Z) - Split-Merge Pooling [36.2980225204665]
スプリット・マージ・プールはサブサンプリングなしで空間情報を保存するために導入された。
本研究では,CityscapesとGTA-5データセットから得られた大規模画像の高密度なセマンティックセマンティックセマンティックセグメンテーションについて検討した。
論文 参考訳(メタデータ) (2020-06-13T23:20:30Z) - Action Recognition with Deep Multiple Aggregation Networks [14.696233190562936]
動作認識における時間的粒度の異なるレベルをキャプチャする新しい階層型プール設計を提案する。
我々の設計原則は粗大であり、木構造ネットワークを用いて達成される。
原理と基礎が整っただけでなく、提案された階層的なプーリングもビデオ長と解像度に依存しない。
論文 参考訳(メタデータ) (2020-06-08T11:37:38Z) - Regularized Pooling [12.387676601792899]
畳み込みニューラルネットワーク(CNN)では、スプーリング操作は次元減少や変形補償といった重要な役割を果たす。
本稿では,隣接するカーネル間で空間的にスムーズなスムーズなプール操作を行うために,正規化プーリングを提案する。
論文 参考訳(メタデータ) (2020-05-06T09:02:17Z) - Attentive Normalization for Conditional Image Generation [126.08247355367043]
我々は、従来のインスタンス正規化の拡張である注意的正規化(AN)により、長距離依存を特徴づける。
自己注意型GANと比較して、注意的正規化はすべての位置の相関を測る必要がない。
クラス条件の画像生成とセマンティックインパインティングの実験により,提案モジュールの有効性が検証された。
論文 参考訳(メタデータ) (2020-04-08T06:12:25Z) - Evolving Normalization-Activation Layers [100.82879448303805]
我々は、うまく機能しない候補層を迅速にフィルタリングする効率的な拒絶プロトコルを開発した。
EvoNormsは、新しい正規化活性化層であり、新しい構造を持ち、時には驚くべき構造を持つ。
我々の実験は、EvoNormsがResNets、MobileNets、EfficientNetsなどの画像分類モデルでうまく機能していることを示している。
論文 参考訳(メタデータ) (2020-04-06T19:52:48Z) - Dense Residual Network: Enhancing Global Dense Feature Flow for
Character Recognition [75.4027660840568]
本稿では,すべての畳み込み層から階層的特徴をフルに活用することにより,局所的・大域的特徴フローを改善する方法について検討する。
技術的には、テキスト認識のための効率的で効果的なCNNフレームワークであるFDRN(Fast Dense Residual Network)を提案する。
論文 参考訳(メタデータ) (2020-01-23T06:55:08Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。