論文の概要: Symbolic Rule Extraction from Attention-Guided Sparse Representations in Vision Transformers
- arxiv url: http://arxiv.org/abs/2505.06745v1
- Date: Sat, 10 May 2025 19:45:15 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-05-13 20:21:49.021413
- Title: Symbolic Rule Extraction from Attention-Guided Sparse Representations in Vision Transformers
- Title(参考訳): 視覚変換器における注意誘導スパース表現からの記号規則抽出
- Authors: Parth Padalkar, Gopal Gupta,
- Abstract要約: 最近のニューロシンボリックアプローチは、解釈可能性を高めるためにCNNベースのモデルからシンボリック・ルールセットを抽出することに成功している。
本稿では、スパースオートエンコーダ(SAE)にインスパイアされたスパース概念層を導入し、視覚変換器(ViT)からシンボルルールを抽出するフレームワークを提案する。
本手法は,記号的推論が可能でありながら,標準のViTよりも5.14%の精度で分類できる。
- 参考スコア(独自算出の注目度): 1.3812010983144802
- License: http://creativecommons.org/licenses/by-nc-nd/4.0/
- Abstract: Recent neuro-symbolic approaches have successfully extracted symbolic rule-sets from CNN-based models to enhance interpretability. However, applying similar techniques to Vision Transformers (ViTs) remains challenging due to their lack of modular concept detectors and reliance on global self-attention mechanisms. We propose a framework for symbolic rule extraction from ViTs by introducing a sparse concept layer inspired by Sparse Autoencoders (SAEs). This linear layer operates on attention-weighted patch representations and learns a disentangled, binarized representation in which individual neurons activate for high-level visual concepts. To encourage interpretability, we apply a combination of L1 sparsity, entropy minimization, and supervised contrastive loss. These binarized concept activations are used as input to the FOLD-SE-M algorithm, which generates a rule-set in the form of logic programs. Our method achieves a 5.14% better classification accuracy than the standard ViT while enabling symbolic reasoning. Crucially, the extracted rule-set is not merely post-hoc but acts as a logic-based decision layer that operates directly on the sparse concept representations. The resulting programs are concise and semantically meaningful. This work is the first to extract executable logic programs from ViTs using sparse symbolic representations. It bridges the gap between transformer-based vision models and symbolic logic programming, providing a step forward in interpretable and verifiable neuro-symbolic AI.
- Abstract(参考訳): 最近のニューロシンボリックアプローチは、解釈可能性を高めるためにCNNベースのモデルからシンボリック・ルールセットを抽出することに成功している。
しかし、視覚変換器(ViT)に同様の手法を適用することは、モジュール型概念検出器の欠如と、グローバルな自己認識機構に依存しているため、依然として困難である。
本稿では,Sparse Autoencoders (SAEs) にインスパイアされたスパース概念層を導入することで,ViTsからシンボルルールを抽出するフレームワークを提案する。
この線形層は、注意重み付けされたパッチ表現で動作し、個々のニューロンが高レベルな視覚概念のために活性化する二項化表現を学習する。
解釈可能性を高めるために,L1間隔,エントロピー最小化,教師付きコントラスト損失の組合せを適用した。
これらの二項化概念アクティベーションは、論理プログラムの形式でルールセットを生成するFOLD-SE-Mアルゴリズムの入力として使用される。
本手法は,記号的推論が可能でありながら,標準のViTよりも5.14%の精度で分類できる。
重要なことは、抽出されたルールセットは単なるポストホックではなく、スパースの概念表現を直接操作する論理ベースの決定層として機能する。
結果として得られるプログラムは簡潔で意味論的に意味がある。
この研究は、スパース記号表現を用いてViTから実行可能な論理プログラムを抽出した最初のものである。
トランスフォーマーベースのビジョンモデルとシンボリックロジックプログラミングのギャップを埋め、解釈可能で検証可能なニューラルシンボリックAIの一歩となる。
関連論文リスト
- Neuro-Symbolic Synergy for Interactive World Modeling [20.07686289460334]
本稿では,大規模言語モデルの確率論的セマンティクスを,実行可能な記号規則と統合するフレームワークNeuro-Symbolic Synergyを提案する。
NeSySは2つのモデル間のトレーニングを相互に交互に行う。
論文 参考訳(メタデータ) (2026-02-11T03:36:18Z) - Beyond Pixels: Visual Metaphor Transfer via Schema-Driven Agentic Reasoning [56.24016465596292]
視覚的メタファーは、抽象概念をインパクトのある視覚的レトリックに変換するために、クロスドメインなセマンティックフュージョンを用いて、人間の創造性の高階形式を構成する。
本稿では,参照画像から「創造的本質」を自律的に分離し,その抽象論理をユーザ特定対象に再物質化する,視覚メタファー伝達(VMT)の課題を紹介する。
提案手法は, メタファーの整合性, アナロジーの適切性, 視覚的創造性においてSOTAのベースラインを著しく上回り, 広告・メディアにおける高度にインパクトのある創造的アプリケーションを自動化するための道を開いた。
論文 参考訳(メタデータ) (2026-02-01T17:01:36Z) - ResTok: Learning Hierarchical Residuals in 1D Visual Tokenizers for Autoregressive Image Generation [64.84095852784714]
Residual Tokenizer (ResTok)は、画像トークンと潜在トークンの両方の階層的残基を構築する1Dビジュアルトークンライザである。
視覚的トークン化における階層的残差の復元はAR画像生成を著しく改善し,ImageNet-256ではわずか9ステップで2.34gFIDを達成した。
論文 参考訳(メタデータ) (2026-01-07T14:09:18Z) - Attention as Binding: A Vector-Symbolic Perspective on Transformer Reasoning [0.0]
トランスフォーマーベースの言語モデルは、印象的な推論のような振る舞いを示すが、安定した記号操作を必要とするタスクには脆弱なままである。
本稿では,VSA(Vector Symbolic Architecture)の実装として,自己意図と残留ストリームを解釈することで,これらの現象を統一的に考察する。
この観点では、クエリとキーはロール空間を定義し、値はフィラーをエンコードし、アテンションウェイトはソフトアンバインドを行い、残余接続は多くの有界構造の重ね合わせを実現する。
論文 参考訳(メタデータ) (2025-12-08T05:38:24Z) - Hierarchical Process Reward Models are Symbolic Vision Learners [56.94353087007494]
記号型コンピュータビジョンは、明示的な論理規則と構造化された表現を通して図を表現し、機械ビジョンの解釈可能な理解を可能にする。
これは、ピクセルベースのビジュアルモデルと根本的に異なる学習パラダイムを必要とする。
本稿では, インプットダイアグラムをプリミティブにエンコードし, インプットダイアグラムを再構築する自己教師型オートエンコーダを提案する。
論文 参考訳(メタデータ) (2025-12-02T18:46:40Z) - Concept-RuleNet: Grounded Multi-Agent Neurosymbolic Reasoning in Vision Language Models [41.6338086518055]
Concept-RuleNetは、透明な推論を維持しながら視覚的なグラウンドを再構築するマルチエージェントシステムである。
我々のシステムは、最先端のニューロシンボリックベースラインを平均5%増加させ、また、ルールにおける幻覚シンボルの発生を最大50%減少させる。
論文 参考訳(メタデータ) (2025-11-13T18:13:56Z) - VL-SAE: Interpreting and Enhancing Vision-Language Alignment with a Unified Concept Set [80.50996301430108]
視覚言語表現のアライメントは、強いマルチモーダル推論能力を持つ現在のビジョン言語モデルを実現する。
視覚言語表現をその隠れアクティベーションにエンコードするスパースオートエンコーダVL-SAEを提案する。
解釈において、視覚と言語表現のアライメントは、意味論と概念を比較することで理解することができる。
論文 参考訳(メタデータ) (2025-10-24T10:29:31Z) - Current Practices for Building LLM-Powered Reasoning Tools Are Ad Hoc -- and We Can Do Better [0.0]
ニューロシンボリック・トランジション・システム(Neurosymbolic transition Systems)は,ニューロシンボリック・ARツール構築の基盤となる計算モデルである。
このモデルでは、記号状態は直観と組み合わせられ、状態遷移はシンボルと直観を並行して操作する。
この新しいパラダイムが、象徴的アルゴリズムの強い保証を維持しながら、現在の能力を超えて論理的推論をスケールできる理由を論じます。
論文 参考訳(メタデータ) (2025-07-08T11:19:09Z) - Pre-Training Meta-Rule Selection Policy for Visual Generative Abductive Learning [24.92602845948049]
本稿では,視覚生成学習アプローチAbdGenのためのメタルール選択ポリシーの事前学習手法を提案する。
事前学習プロセスは、純粋なシンボルデータに基づいて行われ、生の視覚入力のシンボル接地学習は含まない。
本手法は,視覚的帰納学習におけるメタルール選択問題に効果的に対処でき,視覚的帰納学習の効率を高めることができる。
論文 参考訳(メタデータ) (2025-03-09T03:41:11Z) - Compositional Generalization Across Distributional Shifts with Sparse Tree Operations [77.5742801509364]
我々は、微分可能木機械と呼ばれる統合されたニューロシンボリックアーキテクチャを導入する。
シンボル構造の疎ベクトル表現を用いることで,モデルの効率を大幅に向上する。
より一般的なseq2seq問題に制限されたtree2tree問題以外の適用を可能にする。
論文 参考訳(メタデータ) (2024-12-18T17:20:19Z) - Mechanisms of Symbol Processing for In-Context Learning in Transformer Networks [78.54913566111198]
大規模言語モデル(LLM)は、文脈内学習(ICL)によるシンボル処理における印象的な能力を示した。
トランスネットワークにおけるロバストなシンボル処理を実現するメカニズムの解明を目指す。
複雑で抽象的なシンボル処理を行うための記号プログラムを記述できる高レベル言語 PSL を開発した。
論文 参考訳(メタデータ) (2024-10-23T01:38:10Z) - Interpretable end-to-end Neurosymbolic Reinforcement Learning agents [20.034972354302788]
この研究は、ニューラルネットワークの強みとシンボリックAIを融合した、ニューロシンボリックAIパラダイムの中に自分自身を置く。
本稿では,異なるAtariゲーム上で,各コンポーネントを個別に評価するエンドツーエンド学習型SCoBotの実装について述べる。
論文 参考訳(メタデータ) (2024-10-18T10:59:13Z) - LOGICSEG: Parsing Visual Semantics with Neural Logic Learning and
Reasoning [73.98142349171552]
LOGICSEGは、神経誘導学習と論理推論をリッチデータとシンボリック知識の両方に統合する、全体論的視覚意味論である。
ファジィ論理に基づく連続的な緩和の間、論理式はデータとニューラルな計算グラフに基礎を置いており、論理によるネットワークトレーニングを可能にする。
これらの設計によりLOGICSEGは、既存のセグメンテーションモデルに容易に統合できる汎用的でコンパクトなニューラル論理マシンとなる。
論文 参考訳(メタデータ) (2023-09-24T05:43:19Z) - Symbolic Visual Reinforcement Learning: A Scalable Framework with
Object-Level Abstraction and Differentiable Expression Search [63.3745291252038]
DiffSESは、離散的なシンボルポリシーを発見する新しいシンボリック学習手法である。
生のピクセルレベルの入力の代わりにオブジェクトレベルの抽象化を使用することで、DiffSESはシンボリック表現の単純さとスケーラビリティの利点を活用することができる。
我々の実験は、DiffSESが最先端のシンボルRL法よりもシンプルでスケーラブルなシンボリックポリシーを生成することができることを示した。
論文 参考訳(メタデータ) (2022-12-30T17:50:54Z) - Neuro-Symbolic Inductive Logic Programming with Logical Neural Networks [65.23508422635862]
我々は最近提案された論理ニューラルネットワーク(LNN)を用いた学習規則を提案する。
他のものと比較して、LNNは古典的なブール論理と強く結びついている。
標準ベンチマークタスクの実験では、LNNルールが極めて解釈可能であることを確認した。
論文 参考訳(メタデータ) (2021-12-06T19:38:30Z) - Rule Extraction from Binary Neural Networks with Convolutional Rules for
Model Validation [16.956140135868733]
本稿では,畳み込みニューラルネットワーク(CNN)を用いて抽出可能な論理則である一階畳み込み規則について紹介する。
提案手法は,ローカルサーチを用いたバイナリニューラルネットワークからのルール抽出に基づいている。
実験の結果,提案手法はニューラルネットワークの機能をモデル化できると同時に,解釈可能な論理ルールを生成できることがわかった。
論文 参考訳(メタデータ) (2020-12-15T17:55:53Z) - Closed Loop Neural-Symbolic Learning via Integrating Neural Perception,
Grammar Parsing, and Symbolic Reasoning [134.77207192945053]
従来の手法は強化学習アプローチを用いてニューラルシンボリックモデルを学ぶ。
我々は,脳神経知覚と記号的推論を橋渡しする前に,textbfgrammarモデルをテキストシンボリックとして導入する。
本稿では,トップダウンのヒューマンライクな学習手順を模倣して誤りを伝播する新しいtextbfback-searchアルゴリズムを提案する。
論文 参考訳(メタデータ) (2020-06-11T17:42:49Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。