論文の概要: Improving the Energy Efficiency and Robustness of tinyML Computer Vision
using Log-Gradient Input Images
- arxiv url: http://arxiv.org/abs/2203.02571v1
- Date: Fri, 4 Mar 2022 21:04:41 GMT
- ステータス: 処理完了
- システム内更新日: 2022-03-10 10:25:14.128494
- Title: Improving the Energy Efficiency and Robustness of tinyML Computer Vision
using Log-Gradient Input Images
- Title(参考訳): ロググレード入力画像を用いたtinymlコンピュータビジョンのエネルギー効率とロバスト性の向上
- Authors: Qianyun Lu and Boris Murmann
- Abstract要約: 本稿では,マイクロMLコンピュータビジョン(CV)のための畳み込みニューラルネットワーク(CNN)にログ勾配入力画像を適用するメリットについて検討する。
i) 第一層入力の1.5ビットのアグレッシブ量子化、(ii) 潜在的なCNNリソースの削減、および(iii) 照明変化に固有のロバスト性を示す。
- 参考スコア(独自算出の注目度): 3.632177840361928
- License: http://creativecommons.org/licenses/by-sa/4.0/
- Abstract: This paper studies the merits of applying log-gradient input images to
convolutional neural networks (CNNs) for tinyML computer vision (CV). We show
that log gradients enable: (i) aggressive 1.5-bit quantization of first-layer
inputs, (ii) potential CNN resource reductions, and (iii) inherent robustness
to illumination changes (1.7% accuracy loss across 1/32...8 brightness
variation vs. up to 10% for JPEG). We establish these results using the PASCAL
RAW image data set and through a combination of experiments using neural
architecture search and a fixed three-layer network. The latter reveal that
training on log-gradient images leads to higher filter similarity, making the
CNN more prunable. The combined benefits of aggressive first-layer
quantization, CNN resource reductions, and operation without tight exposure
control and image signal processing (ISP) are helpful for pushing tinyML CV
toward its ultimate efficiency limits.
- Abstract(参考訳): 本稿では,マイクロMLコンピュータビジョン(CV)のための畳み込みニューラルネットワーク(CNN)にログ勾配入力画像を適用するメリットについて検討する。
ログ勾配が実現できることを示します
(i)第一層入力の1.5ビットアグレッシブ量子化
(ii)CNNリソース削減の可能性、及び
(3)照度変化に固有のロバスト性(1/32...8の明るさ変化に対して1.7%の精度損失)。
PASCAL RAW画像データセットを用いてこれらの結果を確立し、ニューラルアーキテクチャサーチと固定された3層ネットワークを用いて実験を行った。
後者は、ロググレードイメージのトレーニングがフィルタの類似度を高め、cnnをよりprunableにすることを示している。
攻撃的第一層量子化, cnn資源削減, および密接な露光制御や画像信号処理(isp)を伴わない操作の利点は, tinyml cvを究極の効率限界に向けて押し上げるのに有用である。
関連論文リスト
- Leveraging Neural Radiance Fields for Uncertainty-Aware Visual
Localization [56.95046107046027]
我々は,Neural Radiance Fields (NeRF) を用いてシーン座標回帰のためのトレーニングサンプルを生成することを提案する。
レンダリングにおけるNeRFの効率にもかかわらず、レンダリングされたデータの多くはアーティファクトによって汚染されるか、最小限の情報ゲインしか含まない。
論文 参考訳(メタデータ) (2023-10-10T20:11:13Z) - Deep Multi-Threshold Spiking-UNet for Image Processing [51.88730892920031]
本稿では,SNN(Spike Neural Networks)とU-Netアーキテクチャを組み合わせた,画像処理のためのスパイキング-UNetの概念を紹介する。
効率的なスパイキング-UNetを実現するためには,スパイクによる高忠実度情報伝播の確保と,効果的なトレーニング戦略の策定という2つの課題に直面する。
実験の結果,画像のセグメンテーションとデノイングにおいて,スパイキングUNetは非スパイキングと同等の性能を発揮することがわかった。
論文 参考訳(メタデータ) (2023-07-20T16:00:19Z) - Spherical CNN for Medical Imaging Applications: Importance of
Equivariance in image reconstruction and denoising [0.0]
同変ネットワークは、トモグラフィー応用のための効率的かつ高性能なアプローチである。
2次元および3次元の医療画像問題に対する同変球状CNNの有効性を評価した。
本稿では,従来の画像再構成ツールの補完としてSCNNを用いた新しい手法を提案する。
論文 参考訳(メタデータ) (2023-07-06T21:18:47Z) - Enabling ISP-less Low-Power Computer Vision [4.102254385058941]
汎用的な高レベル視覚タスクのための大規模ベンチマークの生版をリリースする。
ISPなしのCVシステムでは、生画像のトレーニングにより、テスト精度が7.1%向上する。
そこで本研究では,画素内CNN計算と組み合わせた,エネルギー効率のよいアナログインピクセル復号法を提案する。
論文 参考訳(メタデータ) (2022-10-11T13:47:30Z) - Multi-stage image denoising with the wavelet transform [125.2251438120701]
深部畳み込みニューラルネットワーク(Deep Convolutional Neural Network, CNN)は、正確な構造情報を自動マイニングすることで、画像の復調に使用される。
動的畳み込みブロック(DCB)、2つのカスケードウェーブレット変換および拡張ブロック(WEB)、残留ブロック(RB)の3段階を経由した、MWDCNNによるCNNの多段階化を提案する。
論文 参考訳(メタデータ) (2022-09-26T03:28:23Z) - Impact of Scaled Image on Robustness of Deep Neural Networks [0.0]
生画像のスケーリングはアウト・オブ・ディストリビューションデータを生成するため、ネットワークを騙すための敵攻撃の可能性がある。
本研究では,ImageNet Challengeデータセットのサブセットを複数でスケーリングすることで,Scaling-DistortionデータセットのImageNet-CSを提案する。
論文 参考訳(メタデータ) (2022-09-02T08:06:58Z) - GLEAM: Greedy Learning for Large-Scale Accelerated MRI Reconstruction [50.248694764703714]
アンロールされたニューラルネットワークは、最近最先端の加速MRI再構成を達成した。
これらのネットワークは、物理ベースの一貫性とニューラルネットワークベースの正規化を交互に組み合わせることで、反復最適化アルゴリズムをアンロールする。
我々は,高次元画像設定のための効率的なトレーニング戦略である加速度MRI再構成のためのグレディ・ラーニングを提案する。
論文 参考訳(メタデータ) (2022-07-18T06:01:29Z) - Reducing Redundancy in the Bottleneck Representation of the Autoencoders [98.78384185493624]
オートエンコーダは教師なしニューラルネットワークの一種であり、様々なタスクを解くのに使用できる。
本稿では,ボトルネック表現における特徴冗長性を明示的に罰する手法を提案する。
我々は,3つの異なるデータセットを用いた次元削減,MNISTデータセットを用いた画像圧縮,ファッションMNISTを用いた画像デノナイズという,さまざまなタスクにまたがってアプローチを検証した。
論文 参考訳(メタデータ) (2022-02-09T18:48:02Z) - Stain Normalized Breast Histopathology Image Recognition using
Convolutional Neural Networks for Cancer Detection [9.826027427965354]
近年の進歩により、畳み込みニューラルネットワーク(CNN)アーキテクチャは乳がん検出のためのコンピュータ支援診断(CAD)システムの設計に利用できることが示されている。
乳腺病理像の2値分類のためのCNNモデルについて検討した。
我々は,200倍,400倍に拡大した病理像に対して,トレーニング済みのCNNネットワークを利用可能なBreaKHisデータセットで検証した。
論文 参考訳(メタデータ) (2022-01-04T03:09:40Z) - New SAR target recognition based on YOLO and very deep multi-canonical
correlation analysis [0.1503974529275767]
本稿では,異なるCNN層から有効な特徴を適応的に融合させることにより,SAR画像ターゲット分類のためのロバストな特徴抽出手法を提案する。
MSTARデータセットの実験により,提案手法が最先端手法より優れていることが示された。
論文 参考訳(メタデータ) (2021-10-28T18:10:26Z) - BreakingBED -- Breaking Binary and Efficient Deep Neural Networks by
Adversarial Attacks [65.2021953284622]
CNNのホワイトボックス攻撃やブラックボックス攻撃に対する堅牢性について検討する。
結果は、蒸留されたCNN、エージェントベースの最新のprunedモデル、およびバイナライズニューラルネットワークのために示されています。
論文 参考訳(メタデータ) (2021-03-14T20:43:19Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。