論文の概要: Enhancing and Reporting Robustness Boundary of Neural Code Models for Intelligent Code Understanding
- arxiv url: http://arxiv.org/abs/2603.24119v1
- Date: Wed, 25 Mar 2026 09:31:20 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-03-26 21:06:11.227262
- Title: Enhancing and Reporting Robustness Boundary of Neural Code Models for Intelligent Code Understanding
- Title(参考訳): インテリジェントコード理解のためのニューラルネットワークモデルのロバスト性境界の強化と報告
- Authors: Tingxu Han, Wei Song, Weisong Sun, Hao Wu, Chunrong Fang, Yuan Xiao, Xiaofang Zhang, Zhenyu Chen, Yang Liu,
- Abstract要約: 我々は,新しいブラックボックス・トレーニングフリーで軽量な敵防衛であるENBECOMEを提案する。
ENBECOMEは推論時にのみ動作し、入力コードスニペットにランダムなセマンティクス保存の摂動を導入する。
その結果,ENBECOMEは高い精度を維持しながら攻撃成功率を大幅に低下させることがわかった。
- 参考スコア(独自算出の注目度): 21.582594699123277
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: With the development of deep learning, Neural Code Models (NCMs) such as CodeBERT and CodeLlama are widely used for code understanding tasks, including defect detection and code classification. However, recent studies have revealed that NCMs are vulnerable to adversarial examples, inputs with subtle perturbations that induce incorrect predictions while remaining difficult to detect. Existing defenses address this issue via data augmentation to empirically improve robustness, but they are costly, offer no theoretical robustness guarantees, and typically require white-box access to model internals, such as gradients. To address the above challenges, we propose ENBECOME, a novel black-box training-free and lightweight adversarial defense. ENBECOME is designed to both enhance empirical robustness and report certified robustness boundaries for NCMs. ENBECOME operates solely during inference, introducing random, semantics-preserving perturbations to input code snippets to smooth the NCM's decision boundaries. This smoothing enables ENBECOME to formally certify a robustness radius within which adversarial examples can never induce misclassification, a property known as certified robustness. We conduct comprehensive experiments across multiple NCM architectures and tasks. Results show that ENBECOME significantly reduces attack success rates while maintaining high accuracy. For example, in defect detection, it reduces the average ASR from 42.43% to 9.74% with only a 0.29% drop in accuracy. Results show that ENBECOME significantly reduces attack success rates while maintaining high accuracy. For example, in defect detection, it reduces the average ASR from 42.43% to 9.74% with only a 0.29% drop in accuracy. Furthermore, ENBECOME achieves an average certified robustness radius of 1.63, meaning that adversarial modifications to no more than 1.63 identifiers are provably ineffective.
- Abstract(参考訳): ディープラーニングの開発に伴い、CodeBERTやCodeLlamaといったニューラルコードモデル(NCM)が、欠陥検出やコード分類などのコード理解タスクに広く使用されている。
しかし、最近の研究では、NCMは敵の例に弱いことが判明し、微妙な摂動を伴う入力は誤った予測を誘発するが、検出は困難である。
既存の防衛はデータ拡張を通じてこの問題に対処し、ロバスト性を実証的に改善するが、コストがかかり、理論的に堅牢性を保証することはなく、グラデーションのようなモデル内部へのホワイトボックスアクセスを必要とする。
上記の課題に対処するために,新しいブラックボックス・トレーニングフリーで軽量な敵防衛であるENBECOMEを提案する。
ENBECOMEは、実証的ロバスト性の向上と、NCMに対する認証されたロバスト性境界の報告の両方を目的として設計されている。
ENBECOMEは推論時にのみ動作し、NCMの決定境界を円滑にするために入力コードスニペットにランダムな意味保存の摂動を導入する。
この平滑化により、ENBECOMEは、敵の例が決して誤分類を起こさないようなロバストネス半径を正式に証明することができる。
我々は、複数のNCMアーキテクチャとタスクにわたる包括的な実験を行います。
その結果,ENBECOMEは高い精度を維持しながら攻撃成功率を大幅に低下させることがわかった。
例えば、欠陥検出では、平均的なASRを0.29%の精度で42.43%から9.74%に下げる。
その結果,ENBECOMEは高い精度を維持しながら攻撃成功率を大幅に低下させることがわかった。
例えば、欠陥検出では、平均的なASRを0.29%の精度で42.43%から9.74%に下げる。
さらに、ENBECOME は認証されたロバスト性半径 1.63 を達成するため、1.63 以上の識別子に対する敵対的な修正は証明不可能である。
関連論文リスト
- Adversarial Vulnerabilities in Neural Operator Digital Twins: Gradient-Free Attacks on Nuclear Thermal-Hydraulic Surrogates [4.190153363488523]
運用者学習モデルは、原子力とエネルギーシステムのためのデジタルツインの予測コアとして浮上している。
神経オペレーターは、境界条件に対する感受性を生かした極端にスパースな摂動に対して非常に脆弱であることを示す。
本研究は,演算子学習モデルにおいてこれまで見過ごされていた攻撃面を明らかにし,これらのモデルが標準検証以上の保証を必要とすることを確かめるものである。
論文 参考訳(メタデータ) (2026-03-23T19:35:17Z) - BadCLIP++: Stealthy and Persistent Backdoors in Multimodal Contrastive Learning [73.46118996284888]
マルチモーダル・コントラスト学習モデルに対するバックドア攻撃の研究は、ステルスネスと永続性という2つの大きな課題に直面している。
両課題に対処する統合フレームワークであるBadCLIP++を提案する。
ステルスネスのために,タスク関連領域付近に知覚不可能なパターンを埋め込むセマンティックフュージョンQRマイクロトリガーを導入する。
持続性については、半径縮小とセントロイドアライメントによるトリガ埋め込みを安定化する。
論文 参考訳(メタデータ) (2026-02-19T08:31:16Z) - A Few Large Shifts: Layer-Inconsistency Based Minimal Overhead Adversarial Example Detection [13.109309606764754]
我々は、ターゲットモデル自体の内部の階層的不整合を利用するプラグイン検出フレームワークを導入する。
本手法は計算オーバーヘッドを無視して最先端検出性能を実現する。
論文 参考訳(メタデータ) (2025-05-19T00:48:53Z) - StagedVulBERT: Multi-Granular Vulnerability Detection with a Novel Pre-trained Code Model [13.67394549308693]
本研究では,新たな脆弱性検出フレームワークStagedVulBERTを紹介する。
CodeBERT-HLSコンポーネントはトークンレベルとステートメントレベルの両方でセマンティクスを同時にキャプチャするために設計されている。
粗粒度の脆弱性検出では、StagedVulBERTは92.26%のF1スコアを獲得し、最高のパフォーマンスメソッドよりも6.58%改善している。
論文 参考訳(メタデータ) (2024-10-08T07:46:35Z) - Global Context Aggregation Network for Lightweight Saliency Detection of
Surface Defects [70.48554424894728]
我々は,エンコーダ・デコーダ構造上の表面欠陥を簡易に検出するためのGCANet(Global Context Aggregation Network)を開発した。
まず、軽量バックボーンの上部層に新しいトランスフォーマーエンコーダを導入し、DSA(Depth-wise Self-Attention)モジュールを通じてグローバルなコンテキスト情報をキャプチャする。
3つの公開欠陥データセットの実験結果から,提案したネットワークは,他の17の最先端手法と比較して,精度と実行効率のトレードオフを良好に達成できることが示された。
論文 参考訳(メタデータ) (2023-09-22T06:19:11Z) - Can pruning improve certified robustness of neural networks? [106.03070538582222]
ニューラルネット・プルーニングはディープ・ニューラル・ネットワーク(NN)の実証的ロバスト性を向上させることができることを示す。
実験の結果,NNを適切に刈り取ることで,その精度を8.2%まで向上させることができることがわかった。
さらに,認証された宝くじの存在が,従来の密集モデルの標準および認証された堅牢な精度に一致することを観察する。
論文 参考訳(メタデータ) (2022-06-15T05:48:51Z) - Fast and Accurate Error Simulation for CNNs against Soft Errors [64.54260986994163]
本稿では,誤りシミュレーションエンジンを用いて,コナールニューラルネットワーク(CNN)の信頼性解析のためのフレームワークを提案する。
これらの誤差モデルは、故障によって誘導されるCNN演算子の出力の破損パターンに基づいて定義される。
提案手法は,SASSIFIの欠陥効果の約99%の精度と,限定的なエラーモデルのみを実装した44倍から63倍までのスピードアップを実現する。
論文 参考訳(メタデータ) (2022-06-04T19:45:02Z) - Uncertainty-Aware Deep Calibrated Salient Object Detection [74.58153220370527]
既存のディープニューラルネットワークに基づくサルエントオブジェクト検出(SOD)手法は主に高いネットワーク精度の追求に重点を置いている。
これらの手法は、信頼不均衡問題として知られるネットワーク精度と予測信頼の間のギャップを見落としている。
我々は,不確実性を考慮した深部SODネットワークを導入し,深部SODネットワークの過信を防止するための2つの戦略を提案する。
論文 参考訳(メタデータ) (2020-12-10T23:28:36Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。