Fugu-MT 論文翻訳(概要): Latent Anomaly Knowledge Excavation: Unveiling Sparse Sensitive Neurons in Vision-Language Models

論文の概要: Latent Anomaly Knowledge Excavation: Unveiling Sparse Sensitive Neurons in Vision-Language Models

arxiv url: http://arxiv.org/abs/2604.07802v1
Date: Thu, 09 Apr 2026 04:54:25 GMT
ステータス: 翻訳完了
システム内更新日: 2026-04-10 18:34:05.701918
Title: Latent Anomaly Knowledge Excavation: Unveiling Sparse Sensitive Neurons in Vision-Language Models
Title（参考訳）: 潜在異常知識発掘:視覚・言語モデルにおけるスパース感覚ニューロンの発見
Authors: Shaotian Li, Shangze Li, Chuancheng Shi, Wenhua Wu, Yanqiu Wu, Xiaohan Yu, Fei Shen, Tat-Seng Chua,
Abstract要約: 我々は、異常知識は本質的に訓練済みモデルに埋め込まれているが、潜伏し、未活性化状態のままであると主張している。本稿では、これらの重要な神経信号を特定し、引き起こす訓練不要のフレームワークである潜在異常知識発掘(LAKE)を提案する。我々の研究は、未熟な事前学習知識の標的的活性化として異常検出を再定義するパラダイムシフトを提唱している。
参考スコア（独自算出の注目度）: 40.6282934670186
License: http://creativecommons.org/licenses/by/4.0/
Abstract: Large-scale vision-language models (VLMs) exhibit remarkable zero-shot capabilities, yet the internal mechanisms driving their anomaly detection (AD) performance remain poorly understood. Current methods predominantly treat VLMs as black-box feature extractors, assuming that anomaly-specific knowledge must be acquired through external adapters or memory banks. In this paper, we challenge this assumption by arguing that anomaly knowledge is intrinsically embedded within pre-trained models but remains latent and under-activated. We hypothesize that this knowledge is concentrated within a sparse subset of anomaly-sensitive neurons. To validate this, we propose latent anomaly knowledge excavation (LAKE), a training-free framework that identifies and elicits these critical neuronal signals using only a minimal set of normal samples. By isolating these sensitive neurons, LAKE constructs a highly compact normality representation that integrates visual structural deviations with cross-modal semantic activations. Extensive experiments on industrial AD benchmarks demonstrate that LAKE achieves state-of-the-art performance while providing intrinsic, neuron-level interpretability. Ultimately, our work advocates for a paradigm shift: redefining anomaly detection as the targeted activation of latent pre-trained knowledge rather than the acquisition of a downstream task.
Abstract（参考訳）: 大規模視覚言語モデル(VLM)は、優れたゼロショット能力を示すが、それらの異常検出(AD)性能を駆動する内部メカニズムはよく分かっていない。現在の方法では、外部アダプタやメモリバンクを通じて異常固有の知識を取得する必要があると仮定して、VLMをブラックボックスの特徴抽出器として扱う。本稿では、異常知識は本質的に事前学習されたモデルに埋め込まれるが、潜伏状態であり、未活性化状態にあることを論じて、この仮定に挑戦する。我々は、この知識が異常感受性ニューロンのスパースサブセットに集中していると仮定する。これを検証するために,最小限のサンプルのみを用いて,これらの臨界ニューロン信号を特定し,引き起こす訓練自由フレームワークである潜在異常知識発掘(LAKE)を提案する。これらの繊細なニューロンを分離することにより、LAKEは視覚的構造的偏差とクロスモーダルなセマンティックアクティベーションを統合する、非常にコンパクトな正規性表現を構築する。産業用ADベンチマークの大規模な実験により、LAKEは内在的、ニューロンレベルの解釈可能性を提供しながら最先端のパフォーマンスを達成することが示された。最終的に、我々の研究はパラダイムシフトを提唱している。異常検出を再定義することは、下流タスクの獲得ではなく、潜在事前訓練された知識の活性化を目標とするものである。

関連論文リスト

Neuro-Symbolic Process Anomaly Detection [2.8547732086436306]
本稿では、ドメイン知識を神経異常検出に統合するニューロシンボリックアプローチを提案する。我々は,Declare制約を学習プロセス内のソフト論理的ガイドレールとして符号化し,異常な動作と稀だが整合性のある動作を区別する。提案手法は10個の適合トレースが存在する場合でもF1スコアを改善する。
論文参考訳（メタデータ） (2026-03-27T14:30:30Z)
Anatomy of a Lie: A Multi-Stage Diagnostic Framework for Tracing Hallucinations in Vision-Language Models [62.932580559941414]
VLM(Vision-Language Models)は、しばしば「ハロシン化(hallucinate)」する。本稿では,静的な出力誤差からモデル計算認知の動的病理へ再キャストし,幻覚を診断するための新しいパラダイムを提案する。
論文参考訳（メタデータ） (2026-03-16T17:20:38Z)
DNA: Uncovering Universal Latent Forgery Knowledge [39.19379714306656]
フォージェリ検出機能は、すでにトレーニング済みのモデル内にエンコードされている。 DNAフレームワークは粗大な発掘機構を採用している。 Hifi-Genは、最新のモデルの上に構築された高忠実度合成ベンチマークである。
論文参考訳（メタデータ） (2026-01-30T03:48:30Z)
NOBLE -- Neural Operator with Biologically-informed Latent Embeddings to Capture Experimental Variability in Biological Neuron Models [63.592664795493725]
NOBLEは、解釈可能なニューロンの特徴を連続周波数変調した埋め込みから電流注入によって誘導されるソマティック電圧応答へのマッピングを学ぶ神経オペレーターフレームワークである。内在的な実験変数を考慮したニューラルダイナミクスの分布を予測する。 NOBLEは、その一般化を実際の実験データで検証する最初の大規模ディープラーニングフレームワークである。
論文参考訳（メタデータ） (2025-06-05T01:01:18Z)
Video Anomaly Detection via Spatio-Temporal Pseudo-Anomaly Generation : A Unified Approach [49.995833831087175]
本研究は,画像のマスキング領域にペンキを塗布することにより,汎用的な映像時間PAを生成する手法を提案する。さらに,OCC設定下での現実世界の異常を検出するための単純な統合フレームワークを提案する。提案手法は,OCC設定下での既存のPAs生成および再構築手法と同等に動作する。
論文参考訳（メタデータ） (2023-11-27T13:14:06Z)
Understanding the Feature Norm for Out-of-Distribution Detection [16.40441221109391]
分類データセットに基づいてトレーニングされたニューラルネットワークは、インディストリビューション(ID)サンプルに対して、隠蔽層の特徴のより高いベクトルノルムを示すことが多い。隠れた層ニューロンの活性化と不活性化の傾向を捉えることができる新規な負認識ノルム(NAN)を提案する。
論文参考訳（メタデータ） (2023-10-09T00:17:20Z)
Neuro-symbolic model for cantilever beams damage detection [0.0]
本稿では,新しい認知アーキテクチャに基づくカンチレバービームの損傷検出のためのニューロシンボリックモデルを提案する。ハイブリッド識別モデルはLogic Convolutional Neural Regressorという名称で導入されている。
論文参考訳（メタデータ） (2023-05-04T13:12:39Z)
Self-Supervised Masked Convolutional Transformer Block for Anomaly Detection [122.4894940892536]
本稿では, 自己監督型マスク型畳み込み変圧器ブロック (SSMCTB) について述べる。本研究では,従来の自己教師型予測畳み込み抑止ブロック(SSPCAB)を3次元マスク付き畳み込み層,チャンネルワイドアテンション用トランスフォーマー,およびハマーロスに基づく新たな自己教師型目標を用いて拡張する。
論文参考訳（メタデータ） (2022-09-25T04:56:10Z)
A Robust Backpropagation-Free Framework for Images [47.97322346441165]
画像データに対するエラーカーネル駆動型アクティベーションアライメントアルゴリズムを提案する。 EKDAAは、ローカルに派生したエラー送信カーネルとエラーマップを導入することで達成される。結果は、識別不能なアクティベーション機能を利用するEKDAAトレーニングCNNに対して提示される。
論文参考訳（メタデータ） (2022-06-03T21:14:10Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。