論文の概要: Examining the Impact of Optical Aberrations to Image Classification and Object Detection Models
- arxiv url: http://arxiv.org/abs/2504.18510v1
- Date: Fri, 25 Apr 2025 17:23:47 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-05-02 19:15:53.856948
- Title: Examining the Impact of Optical Aberrations to Image Classification and Object Detection Models
- Title(参考訳): 光収差が画像分類・物体検出モデルに及ぼす影響の検討
- Authors: Patrick Müller, Alexander Braun, Margret Keuper,
- Abstract要約: 視覚モデルは、ノイズやぼやけなどの乱れに対して頑丈に振る舞う必要がある。
本稿では,OpticsBenchとLensCorruptionsという,ぼやけた汚職の2つのデータセットについて検討する。
ImageNet と MSCOCO における画像分類と物体検出の評価は,様々な事前学習モデルにおいて OpticsBench と LensCorruptions の性能が著しく異なることを示す。
- 参考スコア(独自算出の注目度): 58.98742597810023
- License: http://creativecommons.org/licenses/by-nc-nd/4.0/
- Abstract: Deep neural networks (DNNs) have proven to be successful in various computer vision applications such that models even infer in safety-critical situations. Therefore, vision models have to behave in a robust way to disturbances such as noise or blur. While seminal benchmarks exist to evaluate model robustness to diverse corruptions, blur is often approximated in an overly simplistic way to model defocus, while ignoring the different blur kernel shapes that result from optical systems. To study model robustness against realistic optical blur effects, this paper proposes two datasets of blur corruptions, which we denote OpticsBench and LensCorruptions. OpticsBench examines primary aberrations such as coma, defocus, and astigmatism, i.e. aberrations that can be represented by varying a single parameter of Zernike polynomials. To go beyond the principled but synthetic setting of primary aberrations, LensCorruptions samples linear combinations in the vector space spanned by Zernike polynomials, corresponding to 100 real lenses. Evaluations for image classification and object detection on ImageNet and MSCOCO show that for a variety of different pre-trained models, the performance on OpticsBench and LensCorruptions varies significantly, indicating the need to consider realistic image corruptions to evaluate a model's robustness against blur.
- Abstract(参考訳): ディープニューラルネットワーク(DNN)は、モデルが安全クリティカルな状況下でも推測するように、様々なコンピュータビジョンアプリケーションで成功していることが証明されている。
したがって、視覚モデルはノイズやぼやけなどの乱れに対して頑健に振る舞う必要がある。
様々な汚職に対するモデルロバスト性を評価するためのセミナルベンチマークが存在するが、光学系によって生じる異なる曖昧なカーネル形状を無視しながら、デフォーカスをモデル化するための過度に単純化された方法でボケが近似されることがしばしばある。
本稿では,現実的な光ぼかし効果に対するモデルロバスト性について検討するため,OpticsBenchとLensCorruptionsを表わした,ぼかしの2つのデータセットを提案する。
OpticsBenchは、コマ、デフォーカス、アシグマティズムなどの一次収差、すなわちゼルニケ多項式の1つのパラメータで表される収差を検証している。
一次収差の原理的だが合成的な設定を超えるために、LensCorruptionsは、100個の実レンズに対応するツェルニケ多項式からなるベクトル空間における線形結合をサンプリングする。
ImageNet と MSCOCO における画像分類とオブジェクト検出の評価は,様々な事前学習モデルにおいて OpticsBench と LensCorruptions のパフォーマンスが著しく異なることを示す。
関連論文リスト
- Reinforcing Pre-trained Models Using Counterfactual Images [54.26310919385808]
本稿では,言語誘導型生成対実画像を用いた分類モデル強化のための新しいフレームワークを提案する。
逆ファクト画像データセットを用いてモデルをテストすることにより、モデルの弱点を同定する。
我々は、分類モデルを微調整し強化するために、デファクトイメージを拡張データセットとして採用する。
論文 参考訳(メタデータ) (2024-06-19T08:07:14Z) - RANRAC: Robust Neural Scene Representations via Random Ray Consensus [12.161889666145127]
RANRAC(RANdom RAy Consensus)は、一貫性のないデータの影響を排除するための効率的な手法である。
我々はRANSACパラダイムのファジィ適応を定式化し、大規模モデルへの適用を可能にした。
その結果, 新規な視点合成のための最先端のロバストな手法と比較して, 顕著な改善が見られた。
論文 参考訳(メタデータ) (2023-12-15T13:33:09Z) - Learning Robust Multi-Scale Representation for Neural Radiance Fields
from Unposed Images [65.41966114373373]
コンピュータビジョンにおけるニューラルイメージベースのレンダリング問題に対する改善された解決策を提案する。
提案手法は,テスト時に新たな視点からシーンのリアルなイメージを合成することができる。
論文 参考訳(メタデータ) (2023-11-08T08:18:23Z) - Classification robustness to common optical aberrations [64.08840063305313]
本稿では,現実的かつ実用的な光ぼけ効果に対するロバスト性を調べるためのベンチマークである OpticsBench を提案する。
ImageNetの実験では、様々な訓練済みのDNNに対して、ディスク形状のカーネルと比較して、パフォーマンスが強いことが示されている。
我々は,光カーネルをデータ拡張として使用することにより,拡張可能なImageNet-100について述べる。
論文 参考訳(メタデータ) (2023-08-29T08:36:00Z) - Deep Learning-Based Defect Classification and Detection in SEM Images [1.9206693386750882]
特に、異なるResNet、VGGNetアーキテクチャをバックボーンとして使用するRetinaNetモデルをトレーニングする。
そこで本研究では,異なるモデルからの出力予測を組み合わせることで,欠陥の分類と検出に優れた性能を実現するための選好に基づくアンサンブル戦略を提案する。
論文 参考訳(メタデータ) (2022-06-20T16:34:11Z) - Light Lies: Optical Adversarial Attack [24.831391763610046]
本稿では, 画像センサに到達した光界情報を物理的に変化させて, 分類モデルが誤分類を生じさせる光学対向攻撃を提案する。
シミュレーションと実際のハードウェア光システムの両方に基づく実験を行い,提案手法の有効性を実証した。
論文 参考訳(メタデータ) (2021-06-18T04:20:49Z) - Improving robustness against common corruptions with frequency biased
models [112.65717928060195]
目に見えない画像の腐敗は 驚くほど大きなパフォーマンス低下を引き起こします
画像の破損タイプは周波数スペクトルで異なる特性を持ち、ターゲットタイプのデータ拡張の恩恵を受けます。
畳み込み特徴マップの総変動(TV)を最小限に抑え、高周波堅牢性を高める新しい正規化方式を提案する。
論文 参考訳(メタデータ) (2021-03-30T10:44:50Z) - SIR: Self-supervised Image Rectification via Seeing the Same Scene from
Multiple Different Lenses [82.56853587380168]
本稿では、異なるレンズからの同一シーンの歪み画像の補正結果が同一であるべきという重要な知見に基づいて、新しい自己監督画像補正法を提案する。
我々は、歪みパラメータから修正画像を生成し、再歪み画像を生成するために、微分可能なワープモジュールを利用する。
本手法は,教師付きベースライン法や代表的最先端手法と同等あるいはそれ以上の性能を実現する。
論文 参考訳(メタデータ) (2020-11-30T08:23:25Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。