論文の概要: XGen-Q: An Explainable Domain-Adaptive LLM Framework with Retrieval-Augmented Generation for Software Security
- arxiv url: http://arxiv.org/abs/2510.19006v1
- Date: Tue, 21 Oct 2025 18:35:38 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-10-25 03:08:14.445928
- Title: XGen-Q: An Explainable Domain-Adaptive LLM Framework with Retrieval-Augmented Generation for Software Security
- Title(参考訳): XGen-Q: ソフトウェアセキュリティのための検索拡張生成を備えた説明可能なドメイン適応型LLMフレームワーク
- Authors: Hamed Jelodar, Mohammad Meymani, Roozbeh Razavi-Far, Ali A. Ghorbani,
- Abstract要約: ジェネレーティブAIと大規模言語モデル(LLM)は、コード理解において強力な能力を示しているが、サイバーセキュリティにおける使用は限られている。
我々は、Qwen-Coderアーキテクチャ上に構築され、100万以上のマルウェアサンプルからなる大規模コーパスで事前訓練されたドメイン適応型LLMであるXGen-Qを紹介する。
XGen-Qは、検索拡張世代(RAG)と組み合わせたマルチステージプロンプト戦略を使用して、信頼性の高いマルウェア識別と詳細な法医学的報告を提供する。
- 参考スコア(独自算出の注目度): 5.062812514858075
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Generative AI and large language models (LLMs) have shown strong capabilities in code understanding, but their use in cybersecurity, particularly for malware detection and analysis, remains limited. Existing detection systems often fail to generalize to obfuscated or previously unseen threats, underscoring the need for more adaptable and explainable models. To address this challenge, we introduce XGen-Q, a domain-adapted LLM built on the Qwen-Coder architecture and pretrained on a large-scale corpus of over one million malware samples, spanning both source and assembly code. XGen-Q uses a multi-stage prompt strategy combined with retrieval-augmented generation (RAG) to deliver reliable malware identification and detailed forensic reporting, even in the presence of complex code obfuscation. To further enhance generalization, we design a training pipeline that systematically exposes the model to diverse obfuscation patterns. Experimental results show that XGen-Q achieves significantly lower perplexity than competitive baselines and exhibits strong performance on novel malware samples, demonstrating the promise of LLM-based approaches for interpretable and robust malware analysis.
- Abstract(参考訳): ジェネレーティブAIと大規模言語モデル(LLM)は、コード理解において強力な能力を示しているが、サイバーセキュリティ、特にマルウェアの検出と分析に使われているのは、依然として限られている。
既存の検知システムは、しばしば難読化または以前は見えなかった脅威に一般化することができず、より適応的で説明可能なモデルの必要性を強調している。
この課題に対処するため,我々は,Qwen-Coderアーキテクチャ上に構築され,100万以上のマルウェアサンプルからなる大規模コーパス上に事前トレーニングされたドメイン適応LLMであるXGen-Qを紹介した。
XGen-Qは、複雑なコード難読化が存在する場合でも、信頼できるマルウェア識別と詳細な法医学的報告を提供するために、検索拡張世代(RAG)と組み合わされたマルチステージプロンプト戦略を使用する。
一般化をさらに促進するために,様々な難読化パターンにモデルを体系的に公開する訓練パイプラインを設計する。
実験の結果、XGen-Qは競合するベースラインよりも難易度が著しく低く、新しいマルウェアサンプルに強い性能を示し、LLMベースのマルウェア解析の可能性を実証した。
関連論文リスト
- ThinkFake: Reasoning in Multimodal Large Language Models for AI-Generated Image Detection [51.93101033997245]
AI生成画像のリアリズムの増大は、誤情報やプライバシー侵害に対する深刻な懸念を引き起こしている。
我々は、AI生成画像検出のための新しい推論に基づく一般化可能なフレームワークThinkFakeを提案する。
我々は、ThinkFakeがGenImageベンチマークで最先端の手法より優れており、挑戦的なLOKIベンチマークで強力なゼロショットの一般化を示すことを示す。
論文 参考訳(メタデータ) (2025-09-24T07:34:09Z) - Learning from Few Samples: A Novel Approach for High-Quality Malcode Generation [47.76793060077816]
侵入検知システム(IDS)は,ネットワークセキュリティ防衛において重要な役割を担っている。
検出モデルのトレーニングにおけるIDSの重要な課題は、適切にラベル付けされた悪意のあるサンプルが不足していることである。
本稿では、GAN(Generative Adrial Networks)とLLM(Large Language Models)を統合した、新しい半教師付きフレームワーク textbfGANGRL-LLMを提案する。
論文 参考訳(メタデータ) (2025-08-25T15:55:17Z) - White-Basilisk: A Hybrid Model for Code Vulnerability Detection [45.03594130075282]
我々は、優れた性能を示す脆弱性検出の新しいアプローチであるWhite-Basiliskを紹介する。
White-Basiliskは、パラメータ数2億の脆弱性検出タスクで結果を得る。
この研究は、コードセキュリティにおける新しいベンチマークを確立し、コンパクトで効率的に設計されたモデルが、特定のタスクにおいてより大きなベンチマークよりも優れているという実証的な証拠を提供する。
論文 参考訳(メタデータ) (2025-07-11T12:39:25Z) - Training Language Models to Generate Quality Code with Program Analysis Feedback [66.0854002147103]
大規模言語モデル(LLM)によるコード生成は、ますます本番環境で採用されているが、コード品質の保証には失敗している。
実運用品質のコードを生成するためにLLMにインセンティブを与える強化学習フレームワークであるREALを提案する。
論文 参考訳(メタデータ) (2025-05-28T17:57:47Z) - The Code Barrier: What LLMs Actually Understand? [7.407441962359689]
本研究では,言語モデルの意味理解能力を評価するために,コード難読化を構造化テストフレームワークとして利用する。
難読化の複雑さが増加するにつれて、統計的に顕著な性能低下が見られる。
本研究では,言語モデルにおけるコード理解を評価するための新しい評価手法を提案する。
論文 参考訳(メタデータ) (2025-04-14T14:11:26Z) - SynerGen-VL: Towards Synergistic Image Understanding and Generation with Vision Experts and Token Folding [66.74446220401296]
画像の理解と生成の両方が可能なシンプルだが強力なエンコーダのないMLLMであるSynerGen-VLを提案する。
トークンの折り畳み機構と,高分解能画像理解を効果的に支援するビジョンエキスパートベースのプログレッシブアライメント事前学習戦略を導入する。
コードとモデルはリリースされます。
論文 参考訳(メタデータ) (2024-12-12T18:59:26Z) - EnStack: An Ensemble Stacking Framework of Large Language Models for Enhanced Vulnerability Detection in Source Code [1.9374282535132379]
本稿では,自然言語処理(NLP)技術を用いた脆弱性検出を支援する,新たなアンサンブルスタックフレームワークであるEnStackを紹介する。
本手法は,コード理解に特化した複数の事前学習型大規模言語モデル(LLM)を相乗化する。
メタ分類器はそれぞれのLSMの強度を集約し、微妙で複雑な脆弱性を検知する包括的なモデルをもたらす。
論文 参考訳(メタデータ) (2024-11-25T16:47:10Z) - A Lean Transformer Model for Dynamic Malware Analysis and Detection [0.0]
マルウェアは現代のコンピューティングの世界にとって急速に成長する脅威であり、既存の防衛線はこの問題に対処するのに十分な効率性を持っていない。
これまでの研究では、実行レポートから抽出したニューラルネットワークとAPI呼び出しシーケンスを活用することに成功した。
本稿では,悪意のあるファイルを検出するために,Transformersアーキテクチャに基づくエミュレーションオンリーモデルを設計する。
論文 参考訳(メタデータ) (2024-08-05T08:46:46Z) - Transfer Learning in Pre-Trained Large Language Models for Malware Detection Based on System Calls [3.5698678013121334]
本研究は,システムコールデータに基づいてマルウェアを分類するために,大規模言語モデル(LLM)を利用した新しいフレームワークを提案する。
1TBを超えるシステムコールのデータセットによる実験では、BigBirdやLongformerのようなより大きなコンテキストサイズを持つモデルの方が精度が良く、F1スコアは約0.86である。
このアプローチは、ハイテイク環境におけるリアルタイム検出の大きな可能性を示し、サイバー脅威の進化に対する堅牢なソリューションを提供する。
論文 参考訳(メタデータ) (2024-05-15T13:19:43Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。