論文の概要: Validation and generalization of pixel-wise relevance in convolutional
neural networks trained for face classification
- arxiv url: http://arxiv.org/abs/2006.16795v1
- Date: Tue, 16 Jun 2020 23:20:40 GMT
- ステータス: 処理完了
- システム内更新日: 2022-11-20 18:51:38.520977
- Title: Validation and generalization of pixel-wise relevance in convolutional
neural networks trained for face classification
- Title(参考訳): 顔分類のための畳み込みニューラルネットワークにおける画素関連性の検証と一般化
- Authors: J\~nani Crawford, Eshed Margalit, Kalanit Grill-Spector, and Sonia
Poltoratski
- Abstract要約: 重要モデルのパラメータ間で、関連度がどう異なるかを示し、一般化する。
関連性に基づく画像マスキングにより、顔分類の関連マップは一般に安定であることが判明した。
モデル間の関係写像の詳細な解析により、選択パラメータの特定の利点を示す一般化における非対称性が明らかになった。
- 参考スコア(独自算出の注目度): 0.0
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: The increased use of convolutional neural networks for face recognition in
science, governance, and broader society has created an acute need for methods
that can show how these 'black box' decisions are made. To be interpretable and
useful to humans, such a method should convey a model's learned classification
strategy in a way that is robust to random initializations or spurious
correlations in input data. To this end, we applied the decompositional
pixel-wise attribution method of layer-wise relevance propagation (LRP) to
resolve the decisions of several classes of VGG-16 models trained for face
recognition. We then quantified how these relevance measures vary with and
generalize across key model parameters, such as the pretraining dataset
(ImageNet or VGGFace), the finetuning task (gender or identity classification),
and random initializations of model weights. Using relevance-based image
masking, we find that relevance maps for face classification prove generally
stable across random initializations, and can generalize across finetuning
tasks. However, there is markedly less generalization across pretraining
datasets, indicating that ImageNet- and VGGFace-trained models sample face
information differently even as they achieve comparably high classification
performance. Fine-grained analyses of relevance maps across models revealed
asymmetries in generalization that point to specific benefits of choice
parameters, and suggest that it may be possible to find an underlying set of
important face image pixels that drive decisions across convolutional neural
networks and tasks. Finally, we evaluated model decision weighting against
human measures of similarity, providing a novel framework for interpreting face
recognition decisions across human and machine.
- Abstract(参考訳): 科学、ガバナンス、そしてより広い社会における顔認識における畳み込みニューラルネットワークの利用の増加は、これらの「ブラックボックス」決定がどのようになされるかを示す方法の急激な必要性を生み出した。
人間が理解し有用であるためには、入力データのランダムな初期化や素早い相関に頑健な方法でモデルの学習した分類戦略を伝える必要がある。
そこで本研究では,層間相関伝播法(lrp)の分解的画素分割法を適用し,顔認識のためのvgg-16モデルの複数のクラスの決定を解いた。
次に,事前学習データセット(imagenetまたはvggface)や微調整タスク(生成者または識別分類),モデル重みのランダム初期化など,キーモデルパラメータ間の関係尺度の差異と一般化を定量化した。
相関に基づく画像マスキングを用いることで、顔分類の関連マップはランダム初期化において一般的に安定であり、微調整タスクをまたいで一般化できることがわかった。
しかし、事前学習データセットの一般化は著しく少なく、ImageNetとVGGFaceで訓練されたモデルは、比較可能な高い分類性能を達成できたとしても、異なる顔情報をサンプリングすることを示している。
モデル間の関連マップのきめ細かい分析により、選択パラメータの特定の利点を示す一般化の非対称性が明らかとなり、畳み込みニューラルネットワークやタスク間の決定を駆動する重要な顔画像ピクセルの下位セットを見つけることが可能である可能性が示唆された。
最後に,類似性の尺度に対するモデル決定重み付けの評価を行い,人間と機械間での顔認識決定を解釈するための新しい枠組みを提案する。
関連論文リスト
- InfoDisent: Explainability of Image Classification Models by Information Disentanglement [9.380255522558294]
両アプローチの利点を組み合わせたハイブリッドモデルであるInfoDisentを紹介します。
InfoDisentは、情報ボトルネックを利用することで、事前訓練されたディープネットワークの最終層にある情報をアンハングルする。
我々は、ImageNet、CUB-200-2011、Stanford Cars、Stanford Dogsなどのベンチマークデータセットに対するInfoDisentの有効性を検証する。
論文 参考訳(メタデータ) (2024-09-16T14:39:15Z) - Reinforcing Pre-trained Models Using Counterfactual Images [54.26310919385808]
本稿では,言語誘導型生成対実画像を用いた分類モデル強化のための新しいフレームワークを提案する。
逆ファクト画像データセットを用いてモデルをテストすることにより、モデルの弱点を同定する。
我々は、分類モデルを微調整し強化するために、デファクトイメージを拡張データセットとして採用する。
論文 参考訳(メタデータ) (2024-06-19T08:07:14Z) - Neural Clustering based Visual Representation Learning [61.72646814537163]
クラスタリングは、機械学習とデータ分析における最も古典的なアプローチの1つである。
本稿では,特徴抽出をデータから代表者を選択するプロセスとみなすクラスタリング(FEC)による特徴抽出を提案する。
FECは、個々のクラスタにピクセルをグループ化して抽象的な代表を配置し、現在の代表とピクセルの深い特徴を更新する。
論文 参考訳(メタデータ) (2024-03-26T06:04:50Z) - Appearance Debiased Gaze Estimation via Stochastic Subject-Wise
Adversarial Learning [33.55397868171977]
外観に基づく視線推定はコンピュータビジョンにおいて注目されており、様々な深層学習技術を用いて顕著な改善が達成されている。
本稿では,被験者の外観を一般化するネットワークを訓練する,SAZE学習という新しい枠組みを提案する。
実験の結果,MPIIGazeデータセットとEyeDiapデータセットの3.89と4.42をそれぞれ達成した。
論文 参考訳(メタデータ) (2024-01-25T00:23:21Z) - Extending CAM-based XAI methods for Remote Sensing Imagery Segmentation [7.735470452949379]
我々は,モデルの不確実性を測定するために,「エントロピー」に基づく新しいXAI評価手法とメトリクスを導入する。
本研究では,Entropyを用いて,対象クラス内の画素のセグメンテーションにおけるモデル不確実性を監視することがより適切であることを示す。
論文 参考訳(メタデータ) (2023-10-03T07:01:23Z) - Fine-grained Recognition with Learnable Semantic Data Augmentation [68.48892326854494]
きめ細かい画像認識は、長年続くコンピュータビジョンの課題である。
本稿では,識別領域損失問題を軽減するため,特徴レベルのトレーニングデータを多様化することを提案する。
本手法は,いくつかの人気分類ネットワーク上での一般化性能を著しく向上させる。
論文 参考訳(メタデータ) (2023-09-01T11:15:50Z) - Learning Contrastive Representation for Semantic Correspondence [150.29135856909477]
セマンティックマッチングのためのマルチレベルコントラスト学習手法を提案する。
画像レベルのコントラスト学習は、畳み込み特徴が類似したオブジェクト間の対応を見出すための鍵となる要素であることを示す。
論文 参考訳(メタデータ) (2021-09-22T18:34:14Z) - Visual Recognition with Deep Learning from Biased Image Datasets [6.10183951877597]
視覚認知の文脈において、バイアスモデルがどのように治療問題に適用できるかを示す。
作業中のバイアス機構に関する(近似的な)知識に基づいて、我々のアプローチは観察を再重み付けする。
本稿では,画像データベース間で共有される低次元画像表現を提案する。
論文 参考訳(メタデータ) (2021-09-06T10:56:58Z) - Texture image classification based on a pseudo-parabolic diffusion model [0.0]
提案手法は、確立されたベンチマークテクスチャデータベースの分類と、植物種認識の実践的な課題について検証する。
画像の同種領域内では、擬似放物的演算子が、うる限りノイズの多い詳細を滑らかにすることができることで、優れた性能を大いに正当化することができる。
論文 参考訳(メタデータ) (2020-11-14T00:04:07Z) - Learning to Learn Parameterized Classification Networks for Scalable
Input Images [76.44375136492827]
畳み込みニューラルネットワーク(CNN)は、入力解像度の変化に関して予測可能な認識動作を持たない。
我々はメタラーナーを用いて、様々な入力スケールのメインネットワークの畳み込み重みを生成する。
さらに、異なる入力解像度に基づいて、モデル予測よりもフライでの知識蒸留を利用する。
論文 参考訳(メタデータ) (2020-07-13T04:27:25Z) - Pre-Trained Models for Heterogeneous Information Networks [57.78194356302626]
異種情報ネットワークの特徴を捉えるための自己教師付き事前学習・微調整フレームワークPF-HINを提案する。
PF-HINは4つのデータセットにおいて、各タスクにおける最先端の代替よりも一貫して、大幅に優れています。
論文 参考訳(メタデータ) (2020-07-07T03:36:28Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。