論文の概要: Meta-learning of Pooling Layers for Character Recognition
- arxiv url: http://arxiv.org/abs/2103.09528v1
- Date: Wed, 17 Mar 2021 09:25:47 GMT
- ステータス: 処理完了
- システム内更新日: 2021-03-18 18:16:20.762758
- Title: Meta-learning of Pooling Layers for Character Recognition
- Title(参考訳): 文字認識のためのプール層のメタラーニング
- Authors: Takato Otsuzuki, Heon Song, Seiichi Uchida, Hideaki Hayashi
- Abstract要約: 畳み込みニューラルネットワークに基づく文字認識における層をプールするためのメタラーニングフレームワークを提案する。
2つのパラメータを用いてカーネル形状とプーリング動作を訓練可能なパラメータ化プーリング層を提案する。
また,複数のタスクにまたがって適切なプーリング層を得ることができるパラメータ化プーリング層のメタラーニングアルゴリズムを提案する。
- 参考スコア(独自算出の注目度): 3.708656266586146
- License: http://creativecommons.org/licenses/by-sa/4.0/
- Abstract: In convolutional neural network-based character recognition, pooling layers
play an important role in dimensionality reduction and deformation
compensation. However, their kernel shapes and pooling operations are
empirically predetermined; typically, a fixed-size square kernel shape and max
pooling operation are used. In this paper, we propose a meta-learning framework
for pooling layers. As part of our framework, a parameterized pooling layer is
proposed in which the kernel shape and pooling operation are trainable using
two parameters, thereby allowing flexible pooling of the input data. We also
propose a meta-learning algorithm for the parameterized pooling layer, which
allows us to acquire a suitable pooling layer across multiple tasks. In the
experiment, we applied the proposed meta-learning framework to character
recognition tasks. The results demonstrate that a pooling layer that is
suitable across character recognition tasks was obtained via meta-learning, and
the obtained pooling layer improved the performance of the model in both
few-shot character recognition and noisy image recognition tasks.
- Abstract(参考訳): 畳み込みニューラルネットワークに基づく文字認識では、プール層は次元減少と変形補償において重要な役割を果たす。
しかし、そのカーネル形状とプーリング操作は実験的に規定されており、通常、固定サイズの正方形カーネル形状と最大プーリング操作が使用される。
本稿では,層をプールするメタラーニングフレームワークを提案する。
このフレームワークでは,2つのパラメータを用いてカーネル形状とプーリング操作を学習可能なパラメータ化プーリング層を提案し,入力データのフレキシブルプーリングを可能にした。
また,複数のタスクにまたがって適切なプーリング層を得ることができるパラメータ化プーリング層のメタラーニングアルゴリズムを提案する。
実験では,提案するメタラーニングフレームワークを文字認識タスクに適用した。
その結果、メタラーニングにより文字認識タスクに適合するプーリング層が得られ、得られたプーリング層は、少ない文字認識と騒がしい画像認識タスクの両方において、モデルの性能を改善した。
関連論文リスト
- Retinal IPA: Iterative KeyPoints Alignment for Multimodal Retinal Imaging [11.70130626541926]
マルチモダリティ網膜画像間のマッチングと登録を強化するために,クロスモダリティ特徴を学習するための新しいフレームワークを提案する。
本モデルでは,従来の学習に基づく特徴検出と記述手法の成功を例に挙げる。
同じ画像の異なるオーグメンテーション間のセグメンテーション一貫性を強制することにより、自己指導的な方法で訓練される。
論文 参考訳(メタデータ) (2024-07-25T19:51:27Z) - Lacunarity Pooling Layers for Plant Image Classification using Texture Analysis [0.38366697175402226]
ポーリング層は、画素強度及び/または特徴値の空間配置に符号化された重要な情報を見渡す。
そこで本研究では,特徴マップの空間的不均一性を,局所窓内における変動性の評価により捉えることを目的とした,新しいラキュナリティプーリング層を提案する。
ラキュナリティプーリング層は、任意の人工ニューラルネットワークアーキテクチャにシームレスに統合することができる。
論文 参考訳(メタデータ) (2024-04-25T00:34:52Z) - Class Anchor Margin Loss for Content-Based Image Retrieval [97.81742911657497]
距離学習パラダイムに該当する新しいレペラ・トラクタ損失を提案するが、ペアを生成する必要がなく、直接L2メトリックに最適化する。
CBIRタスクにおいて,畳み込みアーキテクチャと変圧器アーキテクチャの両方を用いて,少数ショットおよびフルセットトレーニングの文脈で提案した目的を評価する。
論文 参考訳(メタデータ) (2023-06-01T12:53:10Z) - Progressive Meta-Pooling Learning for Lightweight Image Classification
Model [20.076610051602618]
本稿では,軽量ネットワークにおいて受容場を学習可能にするメタポーリングフレームワークを提案する。
本稿では,パラメータ化空間エンハンサーのためのPMPL(Progressive Meta-Pooling Learning)戦略を提案する。
ImageNetデータセットの結果、Meta-Poolingを使用したMobileNetV2は74.6%で、MobileNetV2の2.3%を上回っている。
論文 参考訳(メタデータ) (2023-01-24T14:28:05Z) - Hierarchical Spherical CNNs with Lifting-based Adaptive Wavelets for
Pooling and Unpooling [101.72318949104627]
本稿では, 階層型畳み込みニューラルネットワーク(HS-CNN)の新たな枠組みを提案し, プールやアンプールのための適応球面ウェーブレットを学習する。
LiftHS-CNNは、画像レベルのタスクとピクセルレベルのタスクの両方において、より効率的な階層的特徴学習を実現する。
論文 参考訳(メタデータ) (2022-05-31T07:23:42Z) - Revisiting Pooling through the Lens of Optimal Transport [25.309212446782684]
最適な輸送のレンズを通した,新しい,ソリッドなアルゴリズムプーリングフレームワークを開発した。
UOT問題のパラメータを学習可能にし、それに基づいて、ニューラルネットワークのためのtextitUOT-Poolingと呼ばれる一般化されたプーリング層を提案する。
マルチインスタンスラーニング(MIL)とグラフ埋め込みという2つのアプリケーションシナリオで、UOT-Poolingレイヤをテストします。
論文 参考訳(メタデータ) (2022-01-23T06:20:39Z) - AdaPool: Exponential Adaptive Pooling for Information-Retaining
Downsampling [82.08631594071656]
畳み込み層は畳み込みニューラルネットワーク(CNN)の重要な構成要素である
適応的で指数関数的に重み付けされたアダプール法を提案する。
adaPoolは画像やビデオの分類やオブジェクト検出など,さまざまなタスクを通じて,ディテールの保存性の向上を実証する。
論文 参考訳(メタデータ) (2021-11-01T08:50:37Z) - MetaGater: Fast Learning of Conditional Channel Gated Networks via
Federated Meta-Learning [46.79356071007187]
本稿では,バックボーンネットワークとチャネルゲーティングを協調的にトレーニングするための総合的なアプローチを提案する。
我々は,バックボーンネットワークとゲーティングモジュールの両方において,優れたメタ初期化を共同で学習するための,連携型メタ学習手法を開発した。
論文 参考訳(メタデータ) (2020-11-25T04:26:23Z) - Dual-constrained Deep Semi-Supervised Coupled Factorization Network with
Enriched Prior [80.5637175255349]
本稿では、DS2CF-Netと呼ばれる、拡張された事前制約付きDual-Constrained Deep Semi-Supervised Coupled Factorization Networkを提案する。
隠れた深い特徴を抽出するために、DS2CF-Netは、深い構造と幾何学的な構造に制約のあるニューラルネットワークとしてモデル化される。
我々のネットワークは、表現学習とクラスタリングのための最先端の性能を得ることができる。
論文 参考訳(メタデータ) (2020-09-08T13:10:21Z) - Learning to Compose Hypercolumns for Visual Correspondence [57.93635236871264]
本稿では,画像に条件付けされた関連レイヤを活用することで,動的に効率的な特徴を構成する視覚対応手法を提案する。
提案手法はダイナミックハイパーピクセルフロー(Dynamic Hyperpixel Flow)と呼ばれ,深層畳み込みニューラルネットワークから少数の関連層を選択することにより,高速にハイパーカラム機能を構成することを学習する。
論文 参考訳(メタデータ) (2020-07-21T04:03:22Z) - Modality Compensation Network: Cross-Modal Adaptation for Action
Recognition [77.24983234113957]
異なるモダリティの関係を探索するためのモダリティ補償ネットワーク(MCN)を提案する。
我々のモデルは、適応表現学習を実現するために、モーダリティ適応ブロックによって、ソースおよび補助モーダリティからのデータをブリッジする。
実験の結果,MCNは4つの広く使用されている行動認識ベンチマークにおいて,最先端のアプローチよりも優れていることがわかった。
論文 参考訳(メタデータ) (2020-01-31T04:51:55Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。