論文の概要: PadChannel: Improving CNN Performance through Explicit Padding Encoding
- arxiv url: http://arxiv.org/abs/2311.07623v2
- Date: Thu, 16 Nov 2023 17:17:40 GMT
- ステータス: 処理完了
- システム内更新日: 2023-11-22 16:15:29.017789
- Title: PadChannel: Improving CNN Performance through Explicit Padding Encoding
- Title(参考訳): PadChannel: 明示的なパディングエンコーディングによるCNNのパフォーマンス向上
- Authors: Juho Kim
- Abstract要約: 畳み込みニューラルネットワーク(CNN)では、パディングは層全体の空間的次元を保存する上で重要な役割を果たす。
従来のパディング技術は、実際の画像内容とパッド領域を明確に区別するものではない。
本研究では,パディングステータスを付加的な入力チャネルとしてエンコードする新しいパディング手法PadChannelを提案する。
- 参考スコア(独自算出の注目度): 40.39759037668144
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: In convolutional neural networks (CNNs), padding plays a pivotal role in
preserving spatial dimensions throughout the layers. Traditional padding
techniques do not explicitly distinguish between the actual image content and
the padded regions, potentially causing CNNs to incorrectly interpret the
boundary pixels or regions that resemble boundaries. This ambiguity can lead to
suboptimal feature extraction. To address this, we propose PadChannel, a novel
padding method that encodes padding statuses as an additional input channel,
enabling CNNs to easily distinguish genuine pixels from padded ones. By
incorporating PadChannel into several prominent CNN architectures, we observed
small performance improvements and notable reductions in the variances on the
ImageNet-1K image classification task at marginal increases in the
computational cost. The source code is available at
https://github.com/AussieSeaweed/pad-channel
- Abstract(参考訳): 畳み込みニューラルネットワーク(cnns)では、パディングは層全体の空間次元を保存する上で重要な役割を果たす。
従来のパディング技術は、実際の画像の内容とパッド領域を明確に区別しないため、CNNが境界画素や境界に類似した領域を誤って解釈する可能性がある。
この曖昧さは、最適でない特徴抽出につながる可能性がある。
そこで本研究では,パディング状態を付加的な入力チャネルとしてエンコードする新しいパディング手法であるpadchannelを提案する。
padchannel をいくつかの著名な cnn アーキテクチャに組み込むことで,imagenet-1k 画像分類タスクのばらつきを計算コストの限界値に低減し,性能の向上がみられた。
ソースコードはhttps://github.com/AussieSeaweed/pad- channelで入手できる。
関連論文リスト
- MotionDeltaCNN: Sparse CNN Inference of Frame Differences in Moving
Camera Videos [16.865802182250857]
MotionDeltaCNNは、移動カメラをサポートするスパースCNN推論フレームワークである。
球状バッファとパッド状畳み込みを導入し、新しく公開された領域と前処理された領域のシームレスな融合を可能にする。
評価の結果,動画の移動ではDeltaCNNを最大90%上回りました。
論文 参考訳(メタデータ) (2022-10-18T14:23:05Z) - Localizing Semantic Patches for Accelerating Image Classification [12.250230630124758]
まず、AnchorNetと呼ばれる軽量パッチ提案ネットワークを用いて、入力画像上のタスク認識領域をピンポイントする。
次に、より小さな空間冗長性を持つ局所的なセマンティックパッチを一般的な分類ネットワークに供給する。
提案手法は,より少ない推論コストでSOTA動的推論手法より優れる。
論文 参考訳(メタデータ) (2022-06-07T15:01:54Z) - Context-aware Padding for Semantic Segmentation [82.37483350347559]
画像の拡張のためのコンテキスト認識(CA)パディング手法を提案する。
ResNetベースのセグメンテーションモデルでは、コンテキスト認識パディングを用いることで、従来のゼロパディングよりも高い平均断面積を達成できる。
論文 参考訳(メタデータ) (2021-09-16T10:33:21Z) - Shape-Tailored Deep Neural Networks [87.55487474723994]
ST-DNN(Shape-Tailored Deep Neural Networks)の紹介
ST-DNNは、固定形状(正方形)の近傍からデータを集約する畳み込みネットワーク(CNN)を拡張し、任意形状の領域で定義された記述子を計算する。
ST-DNNが3〜4桁小さく、CNNがセグメンテーションに使用されることを示しています。
論文 参考訳(メタデータ) (2021-02-16T23:32:14Z) - The Mind's Eye: Visualizing Class-Agnostic Features of CNNs [92.39082696657874]
本稿では,特定のレイヤの最も情報性の高い特徴を表現した対応する画像を作成することにより,画像の集合を視覚的に解釈する手法を提案する。
本手法では, 生成ネットワークを必要とせず, 元のモデルに変更を加えることなく, デュアルオブジェクトのアクティベーションと距離損失を利用する。
論文 参考訳(メタデータ) (2021-01-29T07:46:39Z) - Position, Padding and Predictions: A Deeper Look at Position Information
in CNNs [30.583407443282365]
一般に使われているCNNでは、絶対位置情報の驚くほどの情報が符号化されていることを示す。
ゼロパディングはCNNに内部表現の位置情報を符号化させるが、パディングの欠如は位置符号化を妨げていることを示す。
これにより、CNNにおける位置情報の役割に関するより深い疑問がもたらされる。
論文 参考訳(メタデータ) (2021-01-28T23:40:32Z) - Shape Defense Against Adversarial Attacks [47.64219291655723]
人間は物体を認識するために形状情報に大きく依存している。逆に、畳み込みニューラルネットワーク(CNN)はテクスチャに偏っている。
本稿では, 形状バイアスをCNNに組み込んで, 頑健性を向上させる方法について検討する。
2つのアルゴリズムが提案され、エッジが適度な知覚不能な摂動に不変であるという観測に基づいている。
論文 参考訳(メタデータ) (2020-08-31T03:23:59Z) - Patch-wise Attack for Fooling Deep Neural Network [153.59832333877543]
我々は,一般的な訓練と防御モデルに対するブラックボックス攻撃であるパッチワイド反復アルゴリズムを提案する。
我々は、防衛モデルで9.2%、通常訓練されたモデルで3.7%、成功率で著しく改善した。
論文 参考訳(メタデータ) (2020-07-14T01:50:22Z) - On Translation Invariance in CNNs: Convolutional Layers can Exploit
Absolute Spatial Location [18.932504899552494]
CNNは、特定の絶対位置にのみ応答するフィルタを学習することで、絶対空間位置を活用できることを示す。
現代のCNNフィルタは大きな受容場を持つため、これらの境界効果は画像境界から遠く離れている。
論文 参考訳(メタデータ) (2020-03-16T08:00:06Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。