論文の概要: Non-identifiability of Explanations from Model Behavior in Deep Networks of Image Authenticity Judgments
- arxiv url: http://arxiv.org/abs/2604.07254v1
- Date: Wed, 08 Apr 2026 16:15:08 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-04-09 17:30:51.629563
- Title: Non-identifiability of Explanations from Model Behavior in Deep Networks of Image Authenticity Judgments
- Title(参考訳): 画像認証判断の深部ネットワークにおけるモデル行動からの説明の非識別性
- Authors: Icaro Re Depaolini, Uri Hasson,
- Abstract要約: ディープニューラルネットワークは人間の判断を予測できるが、これは人間のような情報に依存したり、それらの判断の根底にある手がかりを明らかにすることを意味するものではない。
我々は、人間の信頼性評価を予測するモデルが、アーキテクチャ内およびアーキテクチャ間で一貫した説明をもたらすかどうかを検証した。
深層ネットワークは人間の正当性判断を適切に予測できるが、それらの判断に対して識別可能な説明は得られない、と結論付けている。
- 参考スコア(独自算出の注目度): 0.07161783472741748
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Deep neural networks can predict human judgments, but this does not imply that they rely on human-like information or reveal the cues underlying those judgments. Prior work has addressed this issue using attribution heatmaps, but their explanatory value in itself depends on robustness. Here we tested the robustness of such explanations by evaluating whether models that predict human authenticity ratings also produce consistent explanations within and across architectures. We fit lightweight regression heads to multiple frozen pretrained vision models and generated attribution maps using Grad-CAM, LIME, and multiscale pixel masking. Several architectures predicted ratings well, reaching about 80% of the noise ceiling. VGG models achieved this by tracking image quality rather than authenticity-specific variance, limiting the relevance of their attributions. Among the remaining models, attribution maps were generally stable across random seeds within an architecture, especially for EfficientNetB3 and Barlow Twins, and consistency was higher for images judged as more authentic. Crucially, agreement in attribution across architectures was weak even when predictive performance was similar. To address this, we combined models in ensembles, which improved prediction of human authenticity judgments and enabled image-level attribution via pixel masking. We conclude that while deep networks can predict human authenticity judgments well, they do not produce identifiable explanations for those judgments. More broadly, our findings suggest that post hoc explanations from successful models of behavior should be treated as weak evidence for cognitive mechanism.
- Abstract(参考訳): ディープニューラルネットワークは人間の判断を予測できるが、これは人間のような情報に依存したり、その判断の根底にある手がかりを明らかにするという意味ではない。
以前の研究は、帰属ヒートマップを使ってこの問題に対処してきたが、その説明的価値自体は堅牢性に依存している。
ここでは、人間の真正性評価を予測するモデルが、アーキテクチャ内およびアーキテクチャ間で一貫した説明を生成するかどうかを評価することによって、そのような説明の堅牢性を検証する。
我々は、軽量回帰ヘッドを複数の凍結事前学習された視覚モデルに適合させ、Grad-CAM、LIME、マルチスケールピクセルマスキングを用いて属性マップを生成する。
いくつかの建築は評価を良く予測し、騒音天井の約80%に到達した。
VGGモデルは、真性固有のばらつきではなく、画像の品質を追跡し、それらの属性の関連性を制限することでこれを達成した。
残りのモデルでは、属性マップは一般的にアーキテクチャ内のランダムなシード、特にEfficientNetB3やBarlow Twinsでは安定しており、より真正であると判断された画像では一貫性が高かった。
重要なことに、予測性能が類似した場合でも、アーキテクチャ間の貢献に関する合意は弱かった。
そこで我々は,人間の正当性判断の予測を改善し,画素マスキングによる画像レベルの帰属を可能にするアンサンブルモデルを組み合わせた。
深層ネットワークは人間の正当性判断を適切に予測できるが、それらの判断に対して識別可能な説明は得られない、と結論付けている。
より広範に、行動モデルの成功例から得られたホックな説明は、認知メカニズムの弱い証拠として扱われるべきである。
関連論文リスト
- A Meaningful Perturbation Metric for Evaluating Explainability Methods [55.09730499143998]
本稿では,画像生成モデルを用いて標的摂動を行う新しい手法を提案する。
具体的には,画像の忠実さを保ちながら,入力画像の高関連画素のみを塗布し,モデルの予測を変更することに焦点を当てる。
これは、しばしばアウト・オブ・ディストリビューションの修正を生み出し、信頼できない結果をもたらす既存のアプローチとは対照的である。
論文 参考訳(メタデータ) (2025-04-09T11:46:41Z) - Counterfactual Image Generation for adversarially robust and
interpretable Classifiers [1.3859669037499769]
本稿では,GAN(Generative Adrial Networks)を基盤として,画像から画像への変換を利用した統合フレームワークを提案する。
これは、分類器と識別器を1つのモデルに組み合わせて、実際の画像をそれぞれのクラスに属性付け、生成されたイメージを「フェイク」として生成することで達成される。
モデルが敵攻撃に対するロバスト性の向上を示すことを示すとともに,判別器の「フェイクネス」値が予測の不確かさの指標となることを示す。
論文 参考訳(メタデータ) (2023-10-01T18:50:29Z) - Uncertainty in AI: Evaluating Deep Neural Networks on
Out-of-Distribution Images [0.0]
本稿では、摂動データを扱う際に、ResNet-50、VGG16、DenseNet121、AlexNet、GoogleNetなど様々なディープニューラルネットワークの不確実性について検討する。
ResNet-50はOODイメージの最も正確なシングルモデルであったが、アンサンブルはより良く、すべてのイメージを正しく分類した。
論文 参考訳(メタデータ) (2023-09-04T22:46:59Z) - Masked Images Are Counterfactual Samples for Robust Fine-tuning [77.82348472169335]
微調整の深層学習モデルは、分布内(ID)性能と分布外(OOD)堅牢性の間のトレードオフにつながる可能性がある。
そこで本研究では,マスク付き画像を対物サンプルとして用いて,ファインチューニングモデルのロバスト性を向上させる新しいファインチューニング手法を提案する。
論文 参考訳(メタデータ) (2023-03-06T11:51:28Z) - Who Explains the Explanation? Quantitatively Assessing Feature
Attribution Methods [0.0]
本稿では,説明の忠実度を定量化するための新しい評価指標であるフォーカス(Focus)を提案する。
ランダム化実験によって測定値のロバスト性を示し、次にFocusを用いて3つの一般的な説明可能性手法を評価し比較する。
実験の結果,LRPとGradCAMは一貫性があり信頼性が高いことがわかった。
論文 参考訳(メタデータ) (2021-09-28T07:10:24Z) - Scene Uncertainty and the Wellington Posterior of Deterministic Image
Classifiers [68.9065881270224]
Wellington Posteriorは、同じシーンで生成された可能性のあるデータに応答して得られるであろう結果の分布である。
We we explore the use of data augmentation, dropout, ensembling, single-view reconstruction and model linearization to compute a Wellington Posterior。
他にも、生成逆数ネットワーク、ニューラルレイディアンスフィールド、条件付き事前ネットワークなどの条件付き生成モデルの使用がある。
論文 参考訳(メタデータ) (2021-06-25T20:10:00Z) - Modeling Object Dissimilarity for Deep Saliency Prediction [86.14710352178967]
本稿では,複数の物体間の差分をモデル化する検出誘導サリエンシー予測ネットワークについて紹介する。
私たちのアプローチは一般的であり、深いサリエンシー予測ネットワークから抽出された特徴とオブジェクトの不類似性を融合させることができます。
論文 参考訳(メタデータ) (2021-04-08T16:10:37Z) - Contemplating real-world object classification [53.10151901863263]
Barbuらが最近提案したObjectNetデータセットを再分析した。
日常の状況に物を含むこと。
分離されたオブジェクトにディープモデルを適用すると、元の論文のようにシーン全体ではなく、約20~30%の性能改善が得られます。
論文 参考訳(メタデータ) (2021-03-08T23:29:59Z) - Overinterpretation reveals image classification model pathologies [15.950659318117694]
人気のあるベンチマーク上の畳み込みニューラルネットワーク(CNN)は、意味論的に健全な特徴がなくても高い精度を示すことができるような、厄介な病理を示す。
我々は、CIFAR-10とImageNetでトレーニングされたニューラルネットワークが過剰解釈に悩まされていることを実証した。
これらのパターンは、現実のデプロイメントにおける潜在的なモデルの脆弱性を補うものだが、実際には、ベンチマークの統計的パターンとして、高いテスト精度を達成するのに十分である。
論文 参考訳(メタデータ) (2020-03-19T17:12:23Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。