論文の概要: Safety, Security, and Cognitive Risks in Neuro-Symbolic AI
- arxiv url: http://arxiv.org/abs/2606.17223v1
- Date: Mon, 15 Jun 2026 19:11:55 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-06-17 17:15:32.113752
- Title: Safety, Security, and Cognitive Risks in Neuro-Symbolic AI
- Title(参考訳): ニューロシンボリックAIの安全性・セキュリティ・認知リスク
- Authors: Manoj Parmar,
- Abstract要約: ニューロシンボリックAI(NeSy)は、ニューラルネットワークとシンボリック推論をペアリングする。
NeSyは、ニューラルネットワーク、シンボリックナレッジベース、推論エンジン、エージェントオーケストレーション、データストアの5つのレイヤを攻撃している。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by-nc-nd/4.0/
- Abstract: Neuro-symbolic AI (NeSy) pairs neural perception with symbolic reasoning, making it attractive for high-stakes domains where explainability and structured inference are required. However, this hybrid architecture introduces an enlarged attack surface spanning five layers: neural perception, symbolic knowledge bases, reasoning engines, agentic orchestration, and data stores -- each exploitable in ways absent from purely neural systems. This paper makes six contributions: (1) formal definitions of NeSy Attack Surface, Symbolic Integrity Violation (SIV), and Cross-Layer Amplification Ratio $\mathcal{X}$, decomposed into neural-caused and autonomous symbolic sensitivity components; (2) a unified threat model extending MITRE ATLAS with 11 NeSy-specific tactic extensions and a five-profile attacker taxonomy; (3) a symbolic-layer threat catalogue covering knowledge graph (KG) poisoning, ontology-merging, and inference-engine subversion; (4) analysis of cognitive risks -- automation bias, authority bias, and sycophantic reinforcement -- structurally amplified by NeSy's explicit logical explanations relative to black-box neural outputs; (5) interdisciplinary mitigations with measurable acceptance criteria aligned to NIST AI 600-1 and the EU AI Act; (6) three empirical benchmarks: (E1) targeted KG poisoning achieves break-even SIV at injection budget $B=5$ on a 205-entity medical KG, with a KG-specific stealth/SIV trade-off; (E2) PGD-10 at $\varepsilon=0.01$ yields $\mathcal{X}=5.884$ (95% CI $[4.64,\, 8.00]$, $p<0.0001$), confirmed adversarially specific by a matched-random baseline ($E^{R}_{\mathrm{rand}}=0$), on a DistilBERT+ProbLog pipeline; (E3) single-axiom OWL edits achieve 93.3% SIV success with 100% Pellet-consistency stealth, but held-out STIX detection fails at 50% (random-guessing level), an open problem.
- Abstract(参考訳): ニューロシンボリックAI(NeSy)は、ニューラルネットワークとシンボリック推論をペアリングすることで、説明可能性と構造化推論を必要とするハイテイク領域を魅力的にする。
しかしながら、このハイブリッドアーキテクチャでは、ニューラルネットワーク、シンボリックナレッジベース、推論エンジン、エージェントオーケストレーション、データストアという、5つのレイヤにまたがる攻撃面が拡大されている。
1)NeSyアタックサーフェス,シンボリックインテリティー・ヴァイオレーション(SIV),およびクロスレイ・アンプリフィケーション(Cross-Layer Amplification Ratio $\mathcal{X}$,分解されたニューラルネットワークおよび自律的シンボリック・センシティブなコンポーネント,(2)NeSy固有の戦術拡張と5つの攻撃分類を備えたMITRE ATLASを拡張した統合脅威モデル,(3)ナレッジグラフ(KG)の有毒化,オントロジー・マージ,推論・エンジニアリング・サブバージョンを含むシンボル層脅威カタログ,(4)自動化バイアス,権威バイアス,サイコファンティック・リレーションといった認知リスクの分析,(4)NeSyのブラックボックスに対する論理的論理的説明によって構造的に増幅された,(5)AII(AI)によるインテリジェンス・インテリジェンス・インテリジェンス・インテリジェンス・インテリジェンス・インテリジェンス・インテリジェンス・インテリジェンス・インテリジェンス・インテリジェンス・インテインテリジェンスメント,(5)AI(AI)によるインテリジェンス・インテリジェンス・インテインテリジェンス・インテインテリジェンス・インテリジェンスメント,(4)。
関連論文リスト
- The Deterministic Horizon: When Extended Reasoning Fails and Tool Delegation Becomes Necessary [13.891522069967507]
拡張連鎖推論は決定論的状態追跡タスクのパフォーマンスを低下させる。
ツール統合推論がニューラル・チェーン・オブ・シントを一貫して上回ることを示す。
本研究は, エージェントシステムにおいて, 純粋なニューラル推論がハイブリッドアプローチにいつ適用されるべきかについて, 基本的ガイダンスを提供する。
論文 参考訳(メタデータ) (2026-05-29T21:35:23Z) - What Do EEG Foundation Models Capture from Human Brain Signals? [64.48249643001402]
現代の脳波基礎モデルは、自己教師付き事前訓練を通じて生信号から直接学習する。
我々は3つのサブクエストに分解する: モデルが何を学習するか、モデルを何に使用するのか、そしてどのように説明できるのか。
3つの基礎モデル(CSBrain, CBraMod, LaBraM),5つの臨床タスク(MDD, Stress, ISRUC-Sleep, TUSL, Siena)と6ファミリー63機能レキシコンを含む。
論文 参考訳(メタデータ) (2026-05-12T01:57:53Z) - TRUST: A Framework for Decentralized AI Service v.0.1 [47.384270414446604]
大規模推論モデル (LRM) とマルチエージェントシステム (MAS) は, 信頼性の高い検証を必要とする。
TRUST(Transparent, Robust, and Unified Services for Trustworthy AI)は,3つのイノベーションを備えた分散フレームワークである。
我々は、悪質な俳優が損失を被っている間、正直な監査人の利益を確実に確保する安全利益理論を証明する。
論文 参考訳(メタデータ) (2026-04-29T19:32:58Z) - Safety, Security, and Cognitive Risks in State-Space Models: A Systematic Threat Analysis with Spectral, Stateful, and Capacity Attacks [0.0]
State-Space Models (SSM) は、安全クリティカルな長期研究アプリケーションにデプロイされる。
本報告では,SSMの安全性,安全性,認知リスクに関する最初の体系的治療について述べる。
論文 参考訳(メタデータ) (2026-04-04T13:08:38Z) - Fundamental Limits of Neural Network Sparsification: Evidence from Catastrophic Interpretability Collapse [7.167095059974211]
本研究では, 可変オートエンコーダ-スパースオートエンコーダアーキテクチャにおける重大容量制約下での機能生存について検討する。
本稿では,活動ニューロンを500から50以上の訓練エポックに段階的に減少させる適応的空間性スケジューリングフレームワークを提案する。
グローバルな表現の質は安定しているが、局所的な特徴解釈可能性は体系的に崩壊する。
論文 参考訳(メタデータ) (2026-03-18T00:16:38Z) - NeuroShield: A Neuro-Symbolic Framework for Adversarial Robustness [2.3049380625910945]
アドリヤ脆弱性と解釈可能性の欠如は、ディープニューラルネットワークの重要な制限である。
本稿では,ニューラルネットワークに象徴的なルール管理を統合する,ニューロシンボリックなフレームワークであるDesignIIを紹介する。
論文 参考訳(メタデータ) (2026-01-19T15:39:24Z) - Graph-Symbolic Policy Enforcement and Control (G-SPEC): A Neuro-Symbolic Framework for Safe Agentic AI in 5G Autonomous Networks [0.0]
Graph-Symbolic Policy Enforcement and Control (G-SPEC)は、確率的計画と決定論的検証を制約する神経象徴的なフレームワークである。
G-SPECは安全違反をゼロとし、94.1%の修復成功率を達成し、82.4%のベースラインをはるかに上回っている。
処理オーバーヘッドは142msであり、G-SPECはSMO層演算に有効である。
論文 参考訳(メタデータ) (2025-12-23T11:27:17Z) - Exact Certification of (Graph) Neural Networks Against Label Poisoning [50.87615167799367]
グラフニューラルネットワーク(GNN)におけるラベルフリップの正確な認証手法を提案する。
本稿では,ノード分類タスクにおける広範囲なGNNアーキテクチャの認証に本手法を適用した。
私たちの研究は、ニューラルネットワークによって引き起こされた毒殺攻撃に対する最初の正確な認証を提示します。
論文 参考訳(メタデータ) (2024-11-30T17:05:12Z) - Robustness Certificates for Implicit Neural Networks: A Mixed Monotone
Contractive Approach [60.67748036747221]
暗黙のニューラルネットワークは、競合性能とメモリ消費の削減を提供する。
入力逆流の摂動に関して、それらは不安定なままである。
本稿では,暗黙的ニューラルネットワークのロバスト性検証のための理論的および計算的枠組みを提案する。
論文 参考訳(メタデータ) (2021-12-10T03:08:55Z) - Scalable Lipschitz Residual Networks with Convex Potential Flows [120.27516256281359]
残差ネットワーク勾配流における凸ポテンシャルを用いることで,1ドルのLipschitz変換が組み込まれていることを示す。
CIFAR-10の包括的な実験は、アーキテクチャのスケーラビリティと、証明可能な防御に$ell$のアプローチの利点を実証している。
論文 参考訳(メタデータ) (2021-10-25T07:12:53Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。