論文の概要: Classification robustness to common optical aberrations
- arxiv url: http://arxiv.org/abs/2308.15499v1
- Date: Tue, 29 Aug 2023 08:36:00 GMT
- ステータス: 処理完了
- システム内更新日: 2023-08-31 16:03:24.308947
- Title: Classification robustness to common optical aberrations
- Title(参考訳): 共通光学収差に対する分類ロバスト性
- Authors: Patrick M\"uller, Alexander Braun, Margret Keuper
- Abstract要約: 本稿では,現実的かつ実用的な光ぼけ効果に対するロバスト性を調べるためのベンチマークである OpticsBench を提案する。
ImageNetの実験では、様々な訓練済みのDNNに対して、ディスク形状のカーネルと比較して、パフォーマンスが強いことが示されている。
我々は,光カーネルをデータ拡張として使用することにより,拡張可能なImageNet-100について述べる。
- 参考スコア(独自算出の注目度): 64.08840063305313
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Computer vision using deep neural networks (DNNs) has brought about seminal
changes in people's lives. Applications range from automotive, face recognition
in the security industry, to industrial process monitoring. In some cases, DNNs
infer even in safety-critical situations. Therefore, for practical
applications, DNNs have to behave in a robust way to disturbances such as
noise, pixelation, or blur. Blur directly impacts the performance of DNNs,
which are often approximated as a disk-shaped kernel to model defocus. However,
optics suggests that there are different kernel shapes depending on wavelength
and location caused by optical aberrations. In practice, as the optical quality
of a lens decreases, such aberrations increase. This paper proposes
OpticsBench, a benchmark for investigating robustness to realistic, practically
relevant optical blur effects. Each corruption represents an optical aberration
(coma, astigmatism, spherical, trefoil) derived from Zernike Polynomials.
Experiments on ImageNet show that for a variety of different pre-trained DNNs,
the performance varies strongly compared to disk-shaped kernels, indicating the
necessity of considering realistic image degradations. In addition, we show on
ImageNet-100 with OpticsAugment that robustness can be increased by using
optical kernels as data augmentation. Compared to a conventionally trained
ResNeXt50, training with OpticsAugment achieves an average performance gain of
21.7% points on OpticsBench and 6.8% points on 2D common corruptions.
- Abstract(参考訳): ディープニューラルネットワーク(DNN)を用いたコンピュータビジョンは、人々の生活にセミナルな変化をもたらした。
アプリケーションは自動車からセキュリティ業界の顔認識、産業プロセス監視まで多岐にわたる。
場合によっては、DNNは安全クリティカルな状況でも推測する。
したがって、実用的な用途では、DNNはノイズ、ピクセル化、ぼやけなどの乱れに対して頑丈に振る舞う必要がある。
BlurはDNNのパフォーマンスに直接影響を与え、デフォーカスをモデル化するためのディスク型カーネルとしてしばしば近似される。
しかし光学は、光収差による波長や位置によって異なるカーネル形状が存在することを示唆している。
実際、レンズの光学的品質が低下すると、そのような収差は増加する。
本稿では,現実的かつ実用的な光ぼけ効果に対するロバスト性を調べるためのベンチマークである OpticsBench を提案する。
各腐敗は、ツェルニケ多項式から派生した光学収差(coma, astigmatism, sphere, trefoil)を表す。
ImageNetの実験では、様々な訓練済みのDNNに対して、ディスク型カーネルと比較して性能が強く、現実的な画像劣化を考慮する必要があることを示している。
また,ImageNet-100 with OpticsAugmentでは,光カーネルをデータ拡張として使用することにより,ロバスト性を高めることができることを示す。
従来から訓練されていたresnext50と比較して、視機能訓練は、視機能ベンチマークで平均21.7%、共通の2次元腐敗で6.8%のパフォーマンス向上を達成している。
関連論文リスト
- Utilizing Generative Adversarial Networks for Image Data Augmentation and Classification of Semiconductor Wafer Dicing Induced Defects [0.21990652930491852]
半導体製造において、ウエハダイシングプロセスは中心的でありながら、収率を著しく損なう欠陥に対して脆弱である。
深層ニューラルネットワーク(Deep Neural Network)は、半自動視覚検査における最先端技術である。
本稿では, 半導体ウェハダイシングによる欠陥の画像データの増大と分類にGAN(Generative Adversarial Network)の適用について検討する。
論文 参考訳(メタデータ) (2024-07-24T20:44:16Z) - Impact of Light and Shadow on Robustness of Deep Neural Networks [5.015796849425367]
ディープニューラルネットワーク(DNN)は、画像分類、セグメンテーション、オブジェクト検出など、様々なコンピュータビジョンタスクにおいて顕著な進歩を遂げている。
近年の研究では、敵攻撃として知られる入力データの故意な操作に直面した先進的なDNNの脆弱性が明らかにされている。
我々は,イメージネットのサブセット内に,各画像に対して24種類の輝度レベルを組み込んだ輝度変化データセットを提案する。
論文 参考訳(メタデータ) (2023-05-23T15:30:56Z) - Physics-aware Roughness Optimization for Diffractive Optical Neural
Networks [15.397285424104469]
微分光学ニューラルネットワーク(DONN)は、従来のディープニューラルネットワークよりも有望な優位性を示している。
本稿では,数値モデリングと実運用における性能差を低減するために,物理対応の回折型光ニューラルネットワークトレーニングフレームワークを提案する。
論文 参考訳(メタデータ) (2023-04-04T03:19:36Z) - Deep Dynamic Scene Deblurring from Optical Flow [53.625999196063574]
汚れは視覚的により快適な写真を提供し、写真がより便利になる。
非均一な曖昧さを数学的にモデル化することは困難である。
我々は,難解な特徴から鮮明な画像を復元する畳み込みニューラルネットワーク(CNN)を開発した。
論文 参考訳(メタデータ) (2023-01-18T06:37:21Z) - LoCI: An Analysis of the Impact of Optical Loss and Crosstalk Noise in
Integrated Silicon-Photonic Neural Networks [8.930237478906266]
統合シリコンフォトニックニューラルネットワーク(SP-NN)は、新たな人工知能アプリケーションのために、より高速でエネルギー効率を約束する。
本稿では,SP-NNのための包括的かつ体系的な光損失とクロストークモデリングフレームワークを提案する。
論文 参考訳(メタデータ) (2022-04-08T04:22:39Z) - A Deep Variational Bayesian Framework for Blind Image Deblurring [46.585763459441154]
ブラインド画像の劣化は、低レベルの視覚において重要な問題であるが、非常に難しい問題である。
視覚障害者のための深い変分ベイズ的枠組みを提案する。
論文 参考訳(メタデータ) (2021-06-05T12:47:36Z) - Universal and Flexible Optical Aberration Correction Using Deep-Prior
Based Deconvolution [51.274657266928315]
そこで本研究では,収差画像とpsfマップを入力とし,レンズ固有深層プリエントを組み込んだ潜在高品質版を生成する,psf対応プラグイン・アンド・プレイ深層ネットワークを提案する。
具体的には、多彩なレンズの集合からベースモデルを事前訓練し、パラメータを迅速に精製して特定のレンズに適応させる。
論文 参考訳(メタデータ) (2021-04-07T12:00:38Z) - Improving robustness against common corruptions with frequency biased
models [112.65717928060195]
目に見えない画像の腐敗は 驚くほど大きなパフォーマンス低下を引き起こします
画像の破損タイプは周波数スペクトルで異なる特性を持ち、ターゲットタイプのデータ拡張の恩恵を受けます。
畳み込み特徴マップの総変動(TV)を最小限に抑え、高周波堅牢性を高める新しい正規化方式を提案する。
論文 参考訳(メタデータ) (2021-03-30T10:44:50Z) - Calibrating Deep Neural Networks using Focal Loss [77.92765139898906]
ミススキャリブレーション(Miscalibration)は、モデルの信頼性と正しさのミスマッチである。
焦点損失は、既に十分に校正されたモデルを学ぶことができることを示す。
ほぼすべてのケースにおいて精度を損なうことなく,最先端のキャリブレーションを達成できることを示す。
論文 参考訳(メタデータ) (2020-02-21T17:35:50Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。