論文の概要: Adversarial Vulnerabilities in Neural Operator Digital Twins: Gradient-Free Attacks on Nuclear Thermal-Hydraulic Surrogates
- arxiv url: http://arxiv.org/abs/2603.22525v1
- Date: Mon, 23 Mar 2026 19:35:17 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-03-25 19:53:37.170719
- Title: Adversarial Vulnerabilities in Neural Operator Digital Twins: Gradient-Free Attacks on Nuclear Thermal-Hydraulic Surrogates
- Title(参考訳): ニューラルオペレーターデジタル双生児の対向性脆弱性:核熱水性サロゲートに対するグラディエントフリー攻撃
- Authors: Samrendra Roy, Kazuma Kobayashi, Souvik Chakraborty, Rizwan-uddin, Syed Bahauddin Alam,
- Abstract要約: 運用者学習モデルは、原子力とエネルギーシステムのためのデジタルツインの予測コアとして浮上している。
神経オペレーターは、境界条件に対する感受性を生かした極端にスパースな摂動に対して非常に脆弱であることを示す。
本研究は,演算子学習モデルにおいてこれまで見過ごされていた攻撃面を明らかにし,これらのモデルが標準検証以上の保証を必要とすることを確かめるものである。
- 参考スコア(独自算出の注目度): 4.190153363488523
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Operator learning models are rapidly emerging as the predictive core of digital twins for nuclear and energy systems, promising real-time field reconstruction from sparse sensor measurements. Yet their robustness to adversarial perturbations remains uncharacterized, a critical gap for deployment in safety-critical systems. Here we show that neural operators are acutely vulnerable to extremely sparse (fewer than 1% of inputs), physically plausible perturbations that exploit their sensitivity to boundary conditions. Using gradient-free differential evolution across four operator architectures, we demonstrate that minimal modifications trigger catastrophic prediction failures, increasing relative $L_2$ error from $\sim$1.5% (validated accuracy) to 37-63% while remaining completely undetectable by standard validation metrics. Notably, 100% of successful single-point attacks pass z-score anomaly detection. We introduce the effective perturbation dimension $d_{\text{eff}}$, a Jacobian-based diagnostic that, together with sensitivity magnitude, yields a two-factor vulnerability model explaining why architectures with extreme sensitivity concentration (POD-DeepONet, $d_{\text{eff}} \approx 1$) are not necessarily the most exploitable, since low-rank output projections cap maximum error, while moderate concentration with sufficient amplification (S-DeepONet, $d_{\text{eff}} \approx 4$) produces the highest attack success. Gradient-free search outperforms gradient-based alternatives (PGD) on architectures with gradient pathologies, while random perturbations of equal magnitude achieve near-zero success rates, confirming that the discovered vulnerabilities are structural. Our findings expose a previously overlooked attack surface in operator learning models and establish that these models require robustness guarantees beyond standard validation before deployment.
- Abstract(参考訳): 演算子学習モデルは、核とエネルギーシステムのためのデジタルツインの予測コアとして急速に発展し、スパースセンサー測定によるリアルタイムなフィールド再構築を約束している。
しかし、敵の摂動に対する頑健さは、安全クリティカルなシステムへの展開において重要なギャップである、不特なままである。
ここでは、神経オペレーターは、非常にスパース(入力の1%未満)に対して非常に脆弱であり、境界条件に対する感受性を生かした物理的にもっともらしい摂動を示す。
4つの演算子アーキテクチャ間の勾配のない微分進化を用いることで、最小限の変更が破滅的な予測失敗を引き起こし、相対的な$L_2$エラーを$\sim$1.5%から37-63%まで増加させ、標準検証基準で完全に検出不能なままであることを示した。
特に、成功したシングルポイント攻撃の100%は、zスコア異常検出をパスする。
低ランクな出力プロジェクションが最大誤差を抑えるのに対し、十分な増幅率(S-DeepONet, $d_{\text{eff}} \approx 4$)が最高の攻撃成功をもたらすのに対し、極端に感度の高いアーキテクチャ(POD-DeepONet, $d_{\text{eff}} \approx 1$)が必ずしも最も有効ではない理由を説明する2要素の脆弱性モデルを生成する。
グラディエントフリーサーチは、勾配病理を持つアーキテクチャ上の勾配に基づく代替(PGD)よりも優れ、一方、等等度のランダムな摂動は、ほぼゼロの成功率を達成し、発見された脆弱性が構造的であることを確認した。
本研究は,操作者学習モデルにおいてこれまで見過ごされていた攻撃面を明らかにし,これらのモデルが展開前に標準的な検証以上の堅牢性を保証する必要があることを確かめるものである。
関連論文リスト
- BadCLIP++: Stealthy and Persistent Backdoors in Multimodal Contrastive Learning [73.46118996284888]
マルチモーダル・コントラスト学習モデルに対するバックドア攻撃の研究は、ステルスネスと永続性という2つの大きな課題に直面している。
両課題に対処する統合フレームワークであるBadCLIP++を提案する。
ステルスネスのために,タスク関連領域付近に知覚不可能なパターンを埋め込むセマンティックフュージョンQRマイクロトリガーを導入する。
持続性については、半径縮小とセントロイドアライメントによるトリガ埋め込みを安定化する。
論文 参考訳(メタデータ) (2026-02-19T08:31:16Z) - The Eminence in Shadow: Exploiting Feature Boundary Ambiguity for Robust Backdoor Attacks [51.468144272905135]
深層ニューラルネットワーク(DNN)は、バックドア攻撃に対して脆弱なままでも重要なアプリケーションを支える。
バックドア攻撃を標的とした理論的解析を行い,不均質なモデル操作を実現するための疎い決定境界に着目した。
エミネンス(Eminence)は、理論的な保証と固有なステルス特性を持つ、説明可能で堅牢なブラックボックスバックドアフレームワークである。
論文 参考訳(メタデータ) (2025-12-11T08:09:07Z) - Towards Adversarial Robustness and Uncertainty Quantification in DINOv2-based Few-Shot Anomaly Detection [6.288045889067255]
DINOv2のような基礎モデルは、数発の異常検出において強い性能を示している。
本研究は, 敵攻撃と不確実性評価に関する最初の体系的研究である。
生の異常スコアは校正が不十分で、信頼性と正しさのギャップが明らかになり、安全クリティカルな使用が制限されることがわかりました。
論文 参考訳(メタデータ) (2025-10-15T15:06:45Z) - A Few Large Shifts: Layer-Inconsistency Based Minimal Overhead Adversarial Example Detection [13.109309606764754]
我々は、ターゲットモデル自体の内部の階層的不整合を利用するプラグイン検出フレームワークを導入する。
本手法は計算オーバーヘッドを無視して最先端検出性能を実現する。
論文 参考訳(メタデータ) (2025-05-19T00:48:53Z) - FaultGuard: A Generative Approach to Resilient Fault Prediction in Smart Electrical Grids [53.2306792009435]
FaultGuardは、障害タイプとゾーン分類のための最初のフレームワークであり、敵攻撃に耐性がある。
本稿では,ロバスト性を高めるために,低複雑性故障予測モデルとオンライン逆行訓練手法を提案する。
本モデルでは,耐故障予測ベンチマークの最先端を最大0.958の精度で上回っている。
論文 参考訳(メタデータ) (2024-03-26T08:51:23Z) - Industrial Anomaly Detection and Localization Using Weakly-Supervised Residual Transformers [44.344548601242444]
Weakly-supervised RESidual Transformer (WeakREST) という新しいフレームワークを導入し,高い異常検出精度を実現する。
画素単位の異常局所化タスクをブロック単位の分類問題に再構成する。
弱いラベルと残差に基づく表現との相互作用を処理できるResMixMatchアルゴリズムを開発した。
論文 参考訳(メタデータ) (2023-06-06T08:19:30Z) - Uncertainty-Aware Deep Calibrated Salient Object Detection [74.58153220370527]
既存のディープニューラルネットワークに基づくサルエントオブジェクト検出(SOD)手法は主に高いネットワーク精度の追求に重点を置いている。
これらの手法は、信頼不均衡問題として知られるネットワーク精度と予測信頼の間のギャップを見落としている。
我々は,不確実性を考慮した深部SODネットワークを導入し,深部SODネットワークの過信を防止するための2つの戦略を提案する。
論文 参考訳(メタデータ) (2020-12-10T23:28:36Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。