論文の概要: Shape Bias and Robustness Evaluation via Cue Decomposition for Image Classification and Segmentation
- arxiv url: http://arxiv.org/abs/2503.12453v1
- Date: Sun, 16 Mar 2025 11:17:03 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-03-18 12:31:05.700057
- Title: Shape Bias and Robustness Evaluation via Cue Decomposition for Image Classification and Segmentation
- Title(参考訳): 画像分類と分割のためのキュー分解による形状バイアスとロバスト性評価
- Authors: Edgar Heinert, Thomas Gottwald, Annika Mütze, Matthias Rottmann,
- Abstract要約: 深層ニューラルネットワークは、テクスチャや形状などの異なる画像の手がかりに対するバイアスの観点から、画像の内容をどのように知覚するかを検討する。
1) 形状とテクスチャの手がかりを抽出する2つのAIフリーデータ前処理方法からなるキュー分解法からなる新しい評価手順を提案する。
アプリケーション目的のために、DNN w.r.t.画像破損のロバスト性を推定できる対応するキュー分解ロバスト性指標を導入する。
- 参考スコア(独自算出の注目度): 4.299840769087443
- License:
- Abstract: Previous works studied how deep neural networks (DNNs) perceive image content in terms of their biases towards different image cues, such as texture and shape. Previous methods to measure shape and texture biases are typically style-transfer-based and limited to DNNs for image classification. In this work, we provide a new evaluation procedure consisting of 1) a cue-decomposition method that comprises two AI-free data pre-processing methods extracting shape and texture cues, respectively, and 2) a novel cue-decomposition shape bias evaluation metric that leverages the cue-decomposition data. For application purposes we introduce a corresponding cue-decomposition robustness metric that allows for the estimation of the robustness of a DNN w.r.t. image corruptions. In our numerical experiments, our findings for biases in image classification DNNs align with those of previous evaluation metrics. However, our cue-decomposition robustness metric shows superior results in terms of estimating the robustness of DNNs. Furthermore, our results for DNNs on the semantic segmentation datasets Cityscapes and ADE20k for the first time shed light into the biases of semantic segmentation DNNs.
- Abstract(参考訳): これまでの研究は、ディープニューラルネットワーク(DNN)が、テクスチャや形状などの異なるイメージキューに対するバイアスの観点から、画像の内容をどのように知覚するかを研究してきた。
形状やテクスチャの偏りを計測する従来の手法はスタイル変換ベースであり、画像分類にはDNNに限られていた。
本研究では,新たな評価手順について述べる。
1) 形状とテクスチャの手がかりを抽出する2つのAIフリーデータ前処理方法からなるキュー分解方法。
2) クエ分解データを利用した新しいクエ分解形状バイアス評価指標について検討した。
アプリケーション目的のために、DNN w.r.t.画像破損のロバスト性を推定できる対応するキュー分解ロバスト性指標を導入する。
数値実験では, 画像分類DNNのバイアスは, 過去の評価指標と一致した。
しかし,DNNのロバスト性を推定する上で,我々のキュー分解ロバスト性測定は優れた結果を示す。
さらに, セマンティックセグメンテーションデータセットであるCityscapesとADE20kについて, セマンティックセグメンテーションDNNのバイアスに光を当てた。
関連論文リスト
- DeepDC: Deep Distance Correlation as a Perceptual Image Quality
Evaluator [53.57431705309919]
ImageNet Pre-trained Deep Neural Network (DNN)は、効果的な画像品質評価(IQA)モデルを構築するための顕著な転送性を示す。
我々は,事前学習DNN機能のみに基づく新しいフル参照IQA(FR-IQA)モデルを開発した。
5つの標準IQAデータセット上で,提案した品質モデルの優位性を示すため,包括的実験を行った。
論文 参考訳(メタデータ) (2022-11-09T14:57:27Z) - Decoupled Mixup for Generalized Visual Recognition [71.13734761715472]
視覚認識のためのCNNモデルを学習するための新しい「デカップリング・ミクスアップ」手法を提案する。
本手法は,各画像を識別領域と雑音発生領域に分離し,これらの領域を均一に組み合わせてCNNモデルを訓練する。
実験結果から,未知のコンテキストからなるデータに対する本手法の高一般化性能を示す。
論文 参考訳(メタデータ) (2022-10-26T15:21:39Z) - Invariant Content Synergistic Learning for Domain Generalization of
Medical Image Segmentation [13.708239594165061]
ディープ畳み込みニューラルネットワーク(DCNN)は、新しい分布とテストデータに直面すると、その堅牢性を維持することができないことが多い。
本稿では,DCNNの一般化能力を向上させるため,ICSL (Invariant Content Synergistic Learning) という手法を提案する。
論文 参考訳(メタデータ) (2022-05-05T08:13:17Z) - Action Recognition with Domain Invariant Features of Skeleton Image [25.519217340328442]
そこで本研究では,行動認識のための対人訓練のための新しいCNNベースの手法を提案する。
異なる視角や対象からスケルトン画像の特徴を整列させるために,2段階のドメイン対角学習を導入する。
最先端の手法と比較して、競争力のある結果が得られる。
論文 参考訳(メタデータ) (2021-11-19T08:05:54Z) - Image Quality Assessment using Contrastive Learning [50.265638572116984]
我々は、補助的な問題を解決するために、対照的な対の目的を用いて深層畳み込みニューラルネットワーク(CNN)を訓練する。
本研究では,最新のNR画像品質モデルと比較して,ContriQUEが競争性能を向上することを示す。
以上の結果から,大きなラベル付き主観的画像品質データセットを必要とせずに,知覚的関連性を持つ強力な品質表現が得られることが示唆された。
論文 参考訳(メタデータ) (2021-10-25T21:01:00Z) - Segmentation of Roads in Satellite Images using specially modified U-Net
CNNs [0.0]
本研究の目的は,道路画像の特定を行う都市景観の衛星画像の分類器を構築することである。
従来のコンピュータビジョンアルゴリズムとは異なり、畳み込みニューラルネットワーク(CNN)はこのタスクに対して正確で信頼性の高い結果を提供する。
論文 参考訳(メタデータ) (2021-09-29T19:08:32Z) - Consumer Image Quality Prediction using Recurrent Neural Networks for
Spatial Pooling [13.750624267664156]
本稿では、リカレントニューラルネットワーク(RNN)を用いて、人間の視覚系(HVS)の注意機構を模倣する画像品質モデルを提案する。
最近発表された2つの画像品質データセットの解像度の異なる画像を用いて行った実験により、提案手法の品質予測精度は、最先端技術を表すベンチマークモデルと競合することを示した。
論文 参考訳(メタデータ) (2021-06-02T03:31:44Z) - Image Restoration by Deep Projected GSURE [115.57142046076164]
Ill-posed inverse problem は、デブロアリングや超解像など、多くの画像処理アプリケーションに現れる。
本稿では,一般化されたSteinUnbiased Risk Estimator(GSURE)の「投影変換」とCNNによる潜在画像のパラメータ化を含む損失関数の最小化に基づく,新たな画像復元フレームワークを提案する。
論文 参考訳(メタデータ) (2021-02-04T08:52:46Z) - An Uncertainty-Driven GCN Refinement Strategy for Organ Segmentation [53.425900196763756]
本研究では,不確実性解析とグラフ畳み込みネットワークに基づくセグメンテーション改善手法を提案する。
半教師付きグラフ学習問題を定式化するために、特定の入力ボリュームにおける畳み込みネットワークの不確実性レベルを用いる。
本手法は膵臓で1%,脾臓で2%向上し,最先端のCRF改善法よりも優れていた。
論文 参考訳(メタデータ) (2020-12-06T18:55:07Z) - Data Consistent CT Reconstruction from Insufficient Data with Learned
Prior Images [70.13735569016752]
偽陰性病変と偽陽性病変を呈示し,CT画像再構成における深層学習の堅牢性について検討した。
本稿では,圧縮センシングと深層学習の利点を組み合わせた画像品質向上のためのデータ一貫性再構築手法を提案する。
提案手法の有効性は,円錐ビームCTにおいて,トランキャットデータ,リミテッドアングルデータ,スパースビューデータで示される。
論文 参考訳(メタデータ) (2020-05-20T13:30:49Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。