Fugu-MT 論文翻訳(概要): AGOP as Explanation: From Feature Learning to Per-Sample Attribution in Image Classifiers

論文の概要: AGOP as Explanation: From Feature Learning to Per-Sample Attribution in Image Classifiers

arxiv url: http://arxiv.org/abs/2605.12816v1
Date: Tue, 12 May 2026 23:15:47 GMT
ステータス: 翻訳完了
システム内更新日: 2026-05-14 23:30:27.72394
Title: AGOP as Explanation: From Feature Learning to Per-Sample Attribution in Image Classifiers
Title（参考訳）: 説明としてのAGOP:画像分類における特徴学習からサンプル単位の属性へ
Authors: Raj Kiran Gupta Katakam,
Abstract要約: サンプルごとの勾配を sqrt(diag(M) / max diag(M) で乗算する新しい属性法 AGOP-Weighted を導入する。我々は,AGOP属性を統合グラディエント(IG),SmoothGrad,GradCAM,VanillaGradに対して厳密に比較した。 AGOP-Global は IG よりも 44% 高い mIoU を達成する; AGOP-Global は IG よりも 7倍高い mIoU を達成する。
参考スコア（独自算出の注目度）: 0.0
License: http://creativecommons.org/licenses/by/4.0/
Abstract: The Average Gradient Outer Product (AGOP) governs feature learning in neural networks: the Neural Feature Ansatz states that weight Gram matrices at each layer align with the corresponding AGOP matrices computed over the training distribution. We ask a complementary question: can this same quantity serve as a post-hoc attribution method for explaining individual predictions? We introduce AGOP-Weighted: a novel attribution method that multiplies the per-sample gradient by sqrt(diag(M) / max diag(M)), a training-distribution prior that suppresses gradient noise and amplifies consistently important pixels -- a combination not present in any prior attribution method. We formalise two companion variants -- AGOP-Local (per-sample gradient, equivalent to VanillaGrad) and AGOP-Global (diag(M) directly as a zero-cost saliency map) -- and implement an efficient training-time accumulation hook; AGOP-Global then requires zero inference cost (disk lookup) while AGOP-Weighted requires only a single gradient pass. We conduct the first rigorous comparison of AGOP attribution against Integrated Gradients (IG), SmoothGrad, GradCAM, and VanillaGrad across two benchmarks with pixel-level ground truth: (i) the synthetic XAI-TRIS benchmark (four classification scenarios, 8x8 images, CNN8by8) and (ii) the photorealistic CLEVR-XAI benchmark (ResNet-18 fine-tuned from ImageNet). AGOP-Weighted achieves 44% higher mIoU than IG on linear tasks; AGOP-Global achieves 7x higher mIoU than IG on multiplicative tasks (where IG falls below random) at zero inference cost. Both findings generalise to ResNet-18 on CLEVR-XAI (+18% and +37% respectively). We further show that GradCAM fails on small-resolution images due to spatial resolution collapse, and that diag(M) quality improves monotonically throughout training even after classification accuracy has plateaued.
Abstract（参考訳）: Neural Feature Ansatz氏は、各レイヤの重量グラム行列は、トレーニング分布上で計算された対応するAGOP行列と一致している、と述べている。同じ量が個人の予測を説明するためのポストホック帰属法として機能するのか? AGOP-Weighted: sqrt(diag(M) / max diag(M)) でサンプルごとの勾配を乗算し、勾配ノイズを抑え、一貫した重要な画素を増幅するトレーニング-ディストリビューション ―― 任意の先行帰属法に存在しない組み合わせ ―― 我々は、AGOP-Local(vanillaGradと同等のサンプルごとの勾配)とAGOP-Global(diag(M)を直接ゼロコストのサリエンシマップとして)という2つの共役変種を定式化し、効率的なトレーニング時集積フックを実装し、AGOP-Globalは、単一の勾配のみを必要とする。我々は,IG,SmoothGrad,GradCAM,VanillaGradに対するAGOP属性の最初の厳密な比較を行った。 (i)合成XAI-TRISベンチマーク(4つの分類シナリオ、8x8画像、CNN8by8) (II)フォトリアリスティックCLEVR-XAIベンチマーク(ImageNetによるResNet-18の微調整)。 AGOP-GlobalはIGよりも7倍高いmIoUを乗算タスク(IGがランダム以下になる)でゼロ推論コストで達成する。いずれもCLEVR-XAIのResNet-18(+18%,+37%)に一般化した。また,空間分解能の低下によりGradCAMは低解像度画像ではフェールし,分類精度が低下しても,Dag(M)の品質はトレーニングを通して単調に向上することを示した。

関連論文リスト

Global Convergence of Gradient EM for Over-Parameterized Gaussian Mixtures [53.51230405648361]
勾配EMの力学を考察し, テンソル分解を用いて幾何的景観を特徴付ける。これは、m=2$という特別な場合を超えるEMや勾配EMに対する最初の大域収束と回復の結果である。
論文参考訳（メタデータ） (2025-06-06T23:32:38Z)
Generalized and Efficient 2D Gaussian Splatting for Arbitrary-scale Super-Resolution [10.074968164380314]
Inlicit Neural Representations (INR) は任意スケール超解法 (ASR) に成功しているしかし、INRベースのモデルは多層パーセプトロンモジュールを何度もクエリし、各クエリにピクセルを描画する必要がある。 GSは、3Dタスクの視覚的品質とレンダリング速度の両方においてINRよりも利点を示しており、GSがASRタスクに使えるかどうかを探求する動機となっている。
論文参考訳（メタデータ） (2025-01-12T15:14:58Z)
Gradient-Free Classifier Guidance for Diffusion Model Sampling [4.450496470631169]
Gradient-free Guidance (GFCG) 法はクラス予測精度を一貫して改善する。 ImageNet 512$times$512では、記録的な$FD_textDINOv2$23.09を達成すると同時に、ATG (90.2%) と比較して高い分類精度 (94.3%) を達成する。
論文参考訳（メタデータ） (2024-11-23T00:22:21Z)
MGDA Converges under Generalized Smoothness, Provably [27.87166415148172]
多目的最適化(MOO)はマルチタスク学習など様々な分野で注目を集めている。最近の研究は、理論解析を伴う効果的なアルゴリズムを提供しているが、それらは標準の$L$-smoothあるいは有界勾配仮定によって制限されている。一般化された$ell$-smooth損失関数のより一般的で現実的なクラスについて研究し、$ell$は勾配ノルムの一般非減少関数である。
論文参考訳（メタデータ） (2024-05-29T18:36:59Z)
Cap2Aug: Caption guided Image to Image data Augmentation [41.53127698828463]
Cap2Augは、画像キャプションをテキストプロンプトとして使用する画像から画像への拡散モデルに基づくデータ拡張戦略である。限られた訓練画像からキャプションを生成し,これらのキャプションを用いて画像間安定拡散モデルを用いてトレーニング画像を編集する。この戦略は、トレーニング画像に似た画像の拡張バージョンを生成するが、サンプル全体にわたって意味的な多様性を提供する。
論文参考訳（メタデータ） (2022-12-11T04:37:43Z)
Noise Self-Regression: A New Learning Paradigm to Enhance Low-Light Images Without Task-Related Data [86.68013790656762]
タスク関連のデータにアクセスせずにノイズ自己回帰(NoiSER)を提案する。 NoiSERは品質向上に非常に競争力があるが、モデルのサイズははるかに小さく、トレーニングや推論のコストもはるかに低い。
論文参考訳（メタデータ） (2022-11-09T06:18:18Z)
Semi-Supervised Domain Adaptation with Prototypical Alignment and Consistency Learning [86.6929930921905]
本稿では,いくつかの対象サンプルがラベル付けされていれば,ドメインシフトに対処するのにどの程度役立つか検討する。ランドマークの可能性を最大限に追求するために、ランドマークから各クラスのターゲットプロトタイプを計算するプロトタイプアライメント(PA)モジュールを組み込んでいます。具体的には,ラベル付き画像に深刻な摂動を生じさせ,PAを非自明にし,モデル一般化性を促進する。
論文参考訳（メタデータ） (2021-04-19T08:46:08Z)
Permuted AdaIN: Reducing the Bias Towards Global Statistics in Image Classification [97.81205777897043]
近年の研究では、畳み込みニューラルネットワーク分類器は形状を犠牲にしてテクスチャを過度に依存していることが示されている。一方、形状と局所像の区別は類似しているが異なるが、一方、グローバル画像統計は異なる。提案手法は,pAdaIN (Permuted Adaptive Instance Normalization) と呼ばれ,画像分類器の隠蔽層におけるグローバル統計の表現を減少させる。
論文参考訳（メタデータ） (2020-10-09T16:38:38Z)
Towards Better Understanding of Adaptive Gradient Algorithms in Generative Adversarial Nets [71.05306664267832]
適応アルゴリズムは勾配の歴史を用いて勾配を更新し、深層ニューラルネットワークのトレーニングにおいてユビキタスである。本稿では,非コンケーブ最小値問題に対するOptimisticOAアルゴリズムの変種を解析する。実験の結果,適応型GAN非適応勾配アルゴリズムは経験的に観測可能であることがわかった。
論文参考訳（メタデータ） (2019-12-26T22:10:10Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。