論文の概要: Pixel to Binary Embedding Towards Robustness for CNNs
- arxiv url: http://arxiv.org/abs/2206.05898v1
- Date: Mon, 13 Jun 2022 04:06:12 GMT
- ステータス: 処理完了
- システム内更新日: 2022-06-14 14:24:44.315492
- Title: Pixel to Binary Embedding Towards Robustness for CNNs
- Title(参考訳): CNNのロバスト性に向けたPixelからバイナリへの埋め込み
- Authors: Ikki Kishida and Hideki Nakayama
- Abstract要約: CNNの堅牢性を向上させるために,Pixel to Binary Embedding (P2BE)を提案する。
P2BEは、従来の手書きバイナリ埋め込み法とは対照的に、学習可能なバイナリ埋め込み法である。
これは、訓練中に表示されない対向的摂動や視覚的腐敗に対する堅牢性において、他のバイナリ埋め込み手法よりも優れる。
- 参考スコア(独自算出の注目度): 25.418899358703378
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: There are several problems with the robustness of Convolutional Neural
Networks (CNNs). For example, the prediction of CNNs can be changed by adding a
small magnitude of noise to an input, and the performances of CNNs are degraded
when the distribution of input is shifted by a transformation never seen during
training (e.g., the blur effect). There are approaches to replace pixel values
with binary embeddings to tackle the problem of adversarial perturbations,
which successfully improve robustness. In this work, we propose Pixel to Binary
Embedding (P2BE) to improve the robustness of CNNs. P2BE is a learnable binary
embedding method as opposed to previous hand-coded binary embedding methods.
P2BE outperforms other binary embedding methods in robustness against
adversarial perturbations and visual corruptions that are not shown during
training.
- Abstract(参考訳): 畳み込みニューラルネットワーク(CNN)の堅牢性にはいくつかの問題がある。
例えば、入力に少量のノイズを加えることでCNNの予測を変更でき、トレーニング中に見られない変換(例えば、ぼやけた効果)によって入力の分布がシフトされたときにCNNのパフォーマンスが劣化する。
対向摂動問題に対処するため、画素値をバイナリ埋め込みで置き換えるアプローチがあり、堅牢性の向上に成功している。
本研究では,cnnのロバスト性を改善するために,p2beを提案する。
p2beは、以前の手書きバイナリ埋め込みメソッドとは対照的に学習可能なバイナリ埋め込みメソッドである。
P2BEは、訓練中に表示されない対向的摂動や視覚的腐敗に対する堅牢性において、他のバイナリ埋め込み方法よりも優れる。
関連論文リスト
- N2V2 -- Fixing Noise2Void Checkerboard Artifacts with Modified Sampling
Strategies and a Tweaked Network Architecture [66.03918859810022]
我々は,バニラN2V装置に2つの改良を加えて,不要なアーティファクトを大幅に削減する。
我々は、顕微鏡および自然画像データに基づいて、その修正を検証した。
論文 参考訳(メタデータ) (2022-11-15T21:12:09Z) - Multi-stage image denoising with the wavelet transform [125.2251438120701]
深部畳み込みニューラルネットワーク(Deep Convolutional Neural Network, CNN)は、正確な構造情報を自動マイニングすることで、画像の復調に使用される。
動的畳み込みブロック(DCB)、2つのカスケードウェーブレット変換および拡張ブロック(WEB)、残留ブロック(RB)の3段階を経由した、MWDCNNによるCNNの多段階化を提案する。
論文 参考訳(メタデータ) (2022-09-26T03:28:23Z) - Median Pixel Difference Convolutional Network for Robust Face
Recognition [8.636370632339785]
畳み込みニューラルネットワーク(CNN)に基づく既存の顔認識アルゴリズムは、ノイズに弱い。
ノイズ劣化した画像パターンは、偽のアクティベーションを引き起こし、ノイズのある状況下での顔認識精度を著しく低下させる。
本稿では,CNNに異なるレベルのノイズに頑健性を持たせるために,MeDiNet(Men Pixel Different Convolutional Network)を提案する。
論文 参考訳(メタデータ) (2022-05-30T13:15:49Z) - Towards Robust 2D Convolution for Reliable Visual Recognition [24.855333242794256]
2D畳み込み(Conv2d)は畳み込みニューラルネットワーク(CNN)の重要なモジュールの1つである
我々は,RConv-MKで表される新しいビルディングブロックを設計し,抽出した畳み込み特性の堅牢性を強化する。
本手法は,異なる大きさの学習可能なカーネルの集合を利用して,異なる周波数で特徴を抽出する。
論文 参考訳(メタデータ) (2022-03-18T08:13:56Z) - BreakingBED -- Breaking Binary and Efficient Deep Neural Networks by
Adversarial Attacks [65.2021953284622]
CNNのホワイトボックス攻撃やブラックボックス攻撃に対する堅牢性について検討する。
結果は、蒸留されたCNN、エージェントベースの最新のprunedモデル、およびバイナライズニューラルネットワークのために示されています。
論文 参考訳(メタデータ) (2021-03-14T20:43:19Z) - Homography Estimation with Convolutional Neural Networks Under
Conditions of Variance [0.0]
畳み込みニューラルネットワーク(CNN)を用いた最近の2つの手法の性能解析を行った。
CNNは、ノイズに対してより堅牢であるように訓練できるが、ノイズのないケースでは精度が低い。
我々は,CNNを特定の音の大きさに訓練すると,CNNが最高の性能を示す騒音レベルに対して,Goldilocks Zoneが生じることを示す。
論文 参考訳(メタデータ) (2020-10-02T15:11:25Z) - Encoding Robustness to Image Style via Adversarial Feature Perturbations [72.81911076841408]
我々は、画像画素ではなく特徴統計を直接摂動することで、頑健なモデルを生成することで、敵の訓練に適応する。
提案手法であるAdvBN(Adversarial Batch Normalization)は,トレーニング中に最悪の機能摂動を発生させる単一ネットワーク層である。
論文 参考訳(メタデータ) (2020-09-18T17:52:34Z) - Shape Defense Against Adversarial Attacks [47.64219291655723]
人間は物体を認識するために形状情報に大きく依存している。逆に、畳み込みニューラルネットワーク(CNN)はテクスチャに偏っている。
本稿では, 形状バイアスをCNNに組み込んで, 頑健性を向上させる方法について検討する。
2つのアルゴリズムが提案され、エッジが適度な知覚不能な摂動に不変であるという観測に基づいている。
論文 参考訳(メタデータ) (2020-08-31T03:23:59Z) - Temporal Distinct Representation Learning for Action Recognition [139.93983070642412]
2次元畳み込みニューラルネットワーク (2D CNN) はビデオの特徴付けに用いられる。
ビデオの異なるフレームは同じ2D CNNカーネルを共有しており、繰り返し、冗長な情報利用をもたらす可能性がある。
本稿では,異なるフレームからの特徴の識別チャネルを段階的にエキサイティングにするためのシーケンシャルチャネルフィルタリング機構を提案し,繰り返し情報抽出を回避する。
本手法は,ベンチマーク時相推論データセットを用いて評価し,それぞれ2.4%,1.3%の可視性向上を実現している。
論文 参考訳(メタデータ) (2020-07-15T11:30:40Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。