論文の概要: Early Comparative Evaluation of Transformer Models for Multilingual Software Vulnerability Detection
- arxiv url: http://arxiv.org/abs/2606.10925v1
- Date: Tue, 09 Jun 2026 14:33:34 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-06-11 16:42:38.048404
- Title: Early Comparative Evaluation of Transformer Models for Multilingual Software Vulnerability Detection
- Title(参考訳): 多言語ソフトウェア脆弱性検出のためのトランスフォーマーモデルの早期比較評価
- Authors: Fiza Naseer, Javad Khan, Muhammad Yaqoob, Alexios Mylonas,
- Abstract要約: 本稿では,HTML,Python,JavaScript,PHPを対象としたバイナリ脆弱性検出のためのBERT,RoBERTa,CodeBERTの早期比較評価を行う。
結果から,言語間での性能差が明らかとなり,多言語による脆弱性検出には言語認識と頑健なトランスフォーマーに基づくモデリング戦略が必要であることが示唆された。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Software vulnerability detection is increasingly important as modern applications combine multiple programming languages. This paper presents an early comparative evaluation of BERT, RoBERTa, and CodeBERT for binary vulnerability detection across HTML, Python, JavaScript, and PHP using the CVEFixes dataset and language-wise three-fold stratified cross-validation. The results show clear performance differences across languages, indicating that multilingual vulnerability detection requires more language-aware and robust transformer-based modelling strategies.
- Abstract(参考訳): 現代のアプリケーションが複数のプログラミング言語を組み合わせているため、ソフトウェア脆弱性の検出はますます重要になっている。
本稿では,HTML,Python,JavaScript,PHPにおけるバイナリ脆弱性検出のためのBERT,RoBERTa,CodeBERTの早期比較評価について,CVEFixesデータセットと言語レベルでの3次元層間検証を用いて述べる。
その結果,言語間での性能差が明らかとなり,多言語による脆弱性検出には言語認識と頑健なトランスフォーマーに基づくモデリング戦略が必要であることが示唆された。
関連論文リスト
- Parallel Universes, Parallel Languages: A Comprehensive Study on LLM-based Multilingual Counterfactual Example Generation [49.2073409243885]
大規模言語モデル(LLM)は、英語の対物生成に優れ、多言語習熟度を示す。
対象言語における直接生成された反事実と6言語間の英訳によって導出されるものの両方について自動評価を行う。
言語間で生成した偽物に一貫して現れる4つの主要なエラーを識別し分類する。
論文 参考訳(メタデータ) (2026-01-01T08:53:49Z) - Asm2SrcEval: Evaluating Large Language Models for Assembly-to-Source Code Translation [4.45354703148321]
アセンブリ・トゥ・ソースのコード翻訳はリバースエンジニアリング、サイバーセキュリティ、ソフトウェアメンテナンスにおいて重要なタスクである。
本稿では,アセンブリ・トゥ・ソース・トランスフォーメーションにおける5つの最先端大規模言語モデルの包括的評価について述べる。
論文 参考訳(メタデータ) (2025-11-28T12:40:30Z) - MulVuln: Enhancing Pre-trained LMs with Shared and Language-Specific Knowledge for Multilingual Vulnerability Detection [22.197550174544627]
MULVULNは、複数の言語にわたるソースコードから学習する、新しい多言語脆弱性検出アプローチである。
現実世界の多言語ソフトウェアシステムにおいて、より堅牢で効果的な脆弱性検出を実現する。
特に、MULVULNはF1スコアがかなり高く、ベースライン法に比べて1.45%から23.59%改善されている。
論文 参考訳(メタデータ) (2025-10-05T23:33:26Z) - Enhancing Large Language Models with Faster Code Preprocessing for Vulnerability Detection [0.0]
既存のSCoPEフレームワーク上に構築し、パフォーマンスを改善した拡張バージョンであるSCoPE2を導入します。
SCoPE2による処理時間を97.3%削減し,脆弱性検出のためのLarge Language Model(LLM)のF1スコアを改良した。
論文 参考訳(メタデータ) (2025-05-08T19:00:11Z) - Investigating and Scaling up Code-Switching for Multilingual Language Model Pre-Training [58.696660064190475]
コンテクスト内の異なる言語間を交互に交換するコードスイッチの存在が、多言語機能の鍵であることに気付きました。
事前学習における言語アライメントのためのコードスイッチングのパワーをよりよく探求するために,合成コードスイッチングの戦略について検討する。
論文 参考訳(メタデータ) (2025-04-02T15:09:58Z) - Vulnerability Detection in Popular Programming Languages with Language Models [2.048226951354646]
本稿では,JavaScript,Java,Python,PHP,Goの脆弱性検出における言語モデル(LM)の有効性について検討する。
C/C++と比較して、JavaScriptは最高のパフォーマンスを示し、より優れた、より実用的な検出能力を持っています。
論文 参考訳(メタデータ) (2024-12-20T13:57:27Z) - AdaCCD: Adaptive Semantic Contrasts Discovery Based Cross Lingual
Adaptation for Code Clone Detection [69.79627042058048]
AdaCCDは、その言語でアノテーションを使わずに、新しい言語のクローンコードを検出する新しい言語間適応手法である。
5つのプログラミング言語からなる多言語コードクローン検出ベンチマークを構築し,AdaCCDの言語間適応性を評価する。
論文 参考訳(メタデータ) (2023-11-13T12:20:48Z) - InfoBERT: Improving Robustness of Language Models from An Information
Theoretic Perspective [84.78604733927887]
BERTのような大規模言語モデルは、幅広いNLPタスクで最先端のパフォーマンスを実現している。
近年の研究では、このようなBERTベースのモデルが、テキストの敵対的攻撃の脅威に直面していることが示されている。
本稿では,事前学習した言語モデルの堅牢な微調整のための新しい学習フレームワークであるInfoBERTを提案する。
論文 参考訳(メタデータ) (2020-10-05T20:49:26Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。