論文の概要: H-Sets: Hessian-Guided Discovery of Set-Level Feature Interactions in Image Classifiers
- arxiv url: http://arxiv.org/abs/2604.22045v1
- Date: Thu, 23 Apr 2026 20:03:17 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-04-27 15:36:26.257493
- Title: H-Sets: Hessian-Guided Discovery of Set-Level Feature Interactions in Image Classifiers
- Title(参考訳): H-Sets:画像分類器におけるセットレベル特徴相互作用のヘシアンガイドによる発見
- Authors: Ayushi Mehrotra, Dipkamal Bhusal, Michael Clifford, Nidhi Rastogi,
- Abstract要約: H-Setsは画像分類器における高次特徴相互作用の発見と寄与のための新しいフレームワークである。
我々は、各セットに、画素空間パスに沿った方向勾配を統合する統合方向勾配のセットレベル拡張であるIDG-Visを属性とする。
VGG、ResNet、DenseNet、MobileNetの各モデルに対するImageNetおよびCUBデータセットの評価は、H-Setsがより解釈可能で忠実な唾液マップを生成することを示している。
- 参考スコア(独自算出の注目度): 2.7415651415305597
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Feature attribution methods explain the predictions of deep neural networks by assigning importance scores to individual input features. However, most existing methods focus solely on marginal effects, overlooking feature interactions, where groups of features jointly influence model output. Such interactions are especially important in image classification tasks, where semantic meaning often arises from pixel interdependencies rather than isolated features. Existing interaction-based methods for images are either coarse (e.g., superpixel-only) or, fail to satisfy core interpretability axioms. In this work, we introduce H-Sets, a novel two-stage framework for discovering and attributing higher-order feature interactions in image classifiers. First, we detect locally interacting pairs via input Hessians and recursively merge them into semantically coherent sets; segmentation from Segment Anything (SAM) is used as a spatial grouping prior but can be replaced by other segmentations. Second, we attribute each set with IDG-Vis, a set-level extension of Integrated Directional Gradients that integrates directional gradients along pixel-space paths and aggregates them with Harsanyi dividends. While Hessians introduce additional compute at the detection stage, this targeted cost consistently yields saliency maps that are sparser and more faithful. Evaluations across VGG, ResNet, DenseNet and MobileNet models on ImageNet and CUB datasets show that H-Sets generate more interpretable and faithful saliency maps compared to existing methods.
- Abstract(参考訳): 特徴属性法は、個々の入力特徴に重要なスコアを割り当てることで、ディープニューラルネットワークの予測を説明する。
しかし、既存のほとんどの手法は、特徴の群がモデル出力に共同的に影響を及ぼす特徴の相互作用を見渡すことで、限界効果にのみ焦点をあてている。
このような相互作用は画像分類タスクにおいて特に重要であり、セマンティックな意味は孤立した特徴よりもピクセル間依存性から生じることが多い。
既存の画像の相互作用に基づく手法は粗い(例:スーパーピクセルのみ)か、コアの解釈可能性の公理を満たさない。
本研究では,画像分類器における高次特徴相互作用の発見と寄与のための新しい2段階フレームワークであるH-Setsを紹介する。
まず、入力ヘッセンを用いて局所的に相互作用するペアを検出し、それらを意味的に一貫性のある集合に再帰的にマージし、Segment Anything (SAM) からのセグメンテーションを空間的グルーピングとして使用するが、他のセグメンテーションに置き換えることができる。
第2に、各セットにIDG-Visという、画素空間の経路に沿って方向勾配を積分し、Harsanyi配位子でそれらを集約する統合方向勾配のセットレベル拡張を割り当てる。
Hessianは検出段階でさらなる計算を導入するが、このターゲットコストは、スペーサーでより忠実なサリエンシマップを一貫して生成する。
VGG、ResNet、DenseNet、MobileNetの各モデルにおけるImageNetおよびCUBデータセットの評価は、H-Setsが既存の方法よりも解釈可能で忠実な唾液マップを生成することを示している。
関連論文リスト
- Multi-label Classification with Panoptic Context Aggregation Networks [61.82285737410154]
本稿では,多次幾何学的文脈を階層的に統合する新しいアプローチであるDeep Panoptic Context Aggregation Network(PanCAN)を紹介する。
PanCANは、ランダムウォークとアテンションメカニズムを組み合わせることで、各スケールで複数階の近傍関係を学習する。
NUS-WIDE、PASCAL VOC、2007、MS-COCOベンチマークの実験は、PanCANが一貫して競争結果を達成することを示した。
論文 参考訳(メタデータ) (2025-12-29T14:16:21Z) - Hierarchical Graph Interaction Transformer with Dynamic Token Clustering for Camouflaged Object Detection [57.883265488038134]
本稿では,HGINetと呼ばれる階層的なグラフ相互作用ネットワークを提案する。
このネットワークは、階層的トークン化機能間の効果的なグラフ相互作用を通じて、知覚不能なオブジェクトを発見することができる。
本実験は,既存の最先端手法と比較して,HGINetの優れた性能を示すものである。
論文 参考訳(メタデータ) (2024-08-27T12:53:25Z) - Auxiliary Tasks Enhanced Dual-affinity Learning for Weakly Supervised
Semantic Segmentation [79.05949524349005]
AuxSegNet+は、サリエンシマップから豊富な情報を探索する弱教師付き補助学習フレームワークである。
また,サリエンシとセグメンテーションの特徴マップから画素レベルの親和性を学習するためのクロスタスク親和性学習機構を提案する。
論文 参考訳(メタデータ) (2024-03-02T10:03:21Z) - FuseNet: Self-Supervised Dual-Path Network for Medical Image
Segmentation [3.485615723221064]
FuseNetは、自己教師型セマンティックセグメンテーションのためのデュアルストリームフレームワークである。
クロスモーダル融合技術は、テキストデータを拡張画像に置き換えることで、CLIPの原理を拡張している。
皮膚病変と肺分画データセットの実験により, 本手法の有効性が示された。
論文 参考訳(メタデータ) (2023-11-22T00:03:16Z) - Framework-agnostic Semantically-aware Global Reasoning for Segmentation [29.69187816377079]
本稿では,画像特徴を潜在表現に投影し,それら間の関係を推論するコンポーネントを提案する。
我々の設計では、活性化領域が空間的に不整合であることを保証することにより、潜在領域が意味概念を表現することを奨励している。
潜在トークンはセマンティックに解釈可能で多様性があり、下流タスクに転送可能な豊富な機能セットを提供します。
論文 参考訳(メタデータ) (2022-12-06T21:42:05Z) - Two-Stream Graph Convolutional Network for Intra-oral Scanner Image
Segmentation [133.02190910009384]
本稿では,2ストリームグラフ畳み込みネットワーク(TSGCN)を提案する。
TSGCNは3次元歯(表面)セグメンテーションにおいて最先端の方法よりも優れています。
論文 参考訳(メタデータ) (2022-04-19T10:41:09Z) - Mining Cross-Image Semantics for Weakly Supervised Semantic Segmentation [128.03739769844736]
2つのニューラルコアテンションを分類器に組み込んで、画像間のセマンティックな類似点と相違点をキャプチャする。
オブジェクトパターン学習の強化に加えて、コアテンションは他の関連する画像からのコンテキストを活用して、ローカライズマップの推論を改善することができる。
提案アルゴリズムは,これらすべての設定に対して新たな最先端性を設定し,その有効性と一般化性を示す。
論文 参考訳(メタデータ) (2020-07-03T21:53:46Z) - Unsupervised segmentation via semantic-apparent feature fusion [21.75371777263847]
本研究では,意味親和性特徴融合(SAFF)に基づく教師なし前景セグメンテーション手法を提案する。
前景オブジェクトのキー領域はセマンティック機能によって正確に応答できる。
意味的特徴と明らかな特徴を融合させ、画像内適応的特徴量学習と画像間共通特徴学習のモジュールをカスケードすることにより、ベースラインをはるかに超える性能を達成する。
論文 参考訳(メタデータ) (2020-05-21T08:28:49Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。