論文の概要: Evaluating Retrieval-Augmented Generation for Explainable Malware Analysis
- arxiv url: http://arxiv.org/abs/2605.03140v1
- Date: Mon, 04 May 2026 20:29:38 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-05-06 19:35:43.643556
- Title: Evaluating Retrieval-Augmented Generation for Explainable Malware Analysis
- Title(参考訳): 説明可能なマルウェア解析のための検索強化ジェネレーションの評価
- Authors: Jayson Ng, Amin Milani Fard,
- Abstract要約: 一般的な前提は、検索拡張生成(RAG)は外部のセキュリティ知識を注入することで、説明品質を改善することである。
本研究では, VirusTotal レポートを構造化入力として用いたマルウェア説明におけるこの仮定を実証的に評価する。
RAGは、注意をそらす、あるいは弱く関連するコンテキストを導入し、物語のノイズや汎用的な書き込みを追加することで、説明品質を劣化させることが多い。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Large Language Models (LLMs) are increasingly being used as security engineering tools to summarize and explain malware behavior to analysts. A common assumption is that Retrieval-Augmented Generation (RAG) improves explanation quality by injecting external security knowledge. In this work, we empirically evaluate this assumption for malware explanation using VirusTotal reports as structured input. Across multiple LLMs, we find that RAG frequently degrades explanation quality by introducing distracting or weakly related context and adding narrative noise or generic write-ups. Our results highlight a practical risk in security-critical pipelines for malware explanation that RAG can be counterproductive when structured security evidence is already sufficient. We argue that malware explanation is primarily a signal-extraction task, not a knowledge-retrieval problem, and outline design recommendations for secure development workflows.
- Abstract(参考訳): 大規模言語モデル(LLM)は、セキュリティエンジニアリングツールとして、分析者に対してマルウェアの振る舞いを要約し、説明するために、ますます使われている。
一般的な前提として、検索拡張生成(RAG)は外部のセキュリティ知識を注入することで説明品質を向上させる。
本研究では, VirusTotal レポートを構造化入力として用いたマルウェア説明におけるこの仮定を実証的に評価する。
複数の LLM にまたがって、RAG は、注意をそらしたり、弱い関係のコンテキストを導入し、物語のノイズや一般的な書き込みを追加することで、説明品質を劣化させることが多い。
以上の結果から,RAGが構築されたセキュリティ証拠がすでに十分である場合には,RAGは非生産的になり得るという,マルウェア説明のためのセキュリティクリティカルパイプラインの実践的リスクが浮かび上がっている。
マルウェアの説明は、主に信号抽出作業であり、知識検索の問題ではないと論じ、セキュアな開発ワークフローの設計勧告を概説する。
関連論文リスト
- DeepSight: An All-in-One LM Safety Toolkit [49.27916339801296]
我々は,新たな安全性評価・診断統合パラダイムを実践する,オープンソースのプロジェクトであるDeepSightを提案する。
DeepSightは低コストで再現性があり、効率的で、スケーラブルな大規模モデル安全性評価プロジェクトであり、評価ツールキットDeepSafeと診断ツールキットDeepScanで構成されている。
タスクとデータプロトコルを統一することにより、2つのステージ間の接続を構築し、安全評価をブラックボックスからホワイトボックスのインサイトに変換する。
論文 参考訳(メタデータ) (2026-02-12T15:43:14Z) - ReAG: Reasoning-Augmented Generation for Knowledge-based Visual Question Answering [54.72902502486611]
ReAG(Reasoning-Augmented Multimodal RAG)は、粗い部分ときめ細かい部分の検索と、無関係な通路をフィルタリングする批評家モデルを組み合わせた手法である。
ReAGは従来の手法よりも優れており、解答精度が向上し、検索された証拠に根ざした解釈可能な推論を提供する。
論文 参考訳(メタデータ) (2025-11-27T19:01:02Z) - When Models Outthink Their Safety: Mitigating Self-Jailbreak in Large Reasoning Models with Chain-of-Guardrails [74.63933201261595]
大規模推論モデル(LRM)は複雑な推論タスクにおいて顕著な能力を示す。
LRMは、有害なコンテンツ生成やジェイルブレイク攻撃など、深刻な安全リスクに弱いままである。
安全でない推論ステップを再構成またはバックトラックするトレーニングフレームワークであるChain-of-Guardrail(CoG)を提案する。
論文 参考訳(メタデータ) (2025-10-24T09:32:25Z) - Automated Vulnerability Validation and Verification: A Large Language Model Approach [7.482522010482827]
本稿では、生成AI、特に大規模言語モデル(LLM)を利用したエンドツーエンド多段階パイプラインを提案する。
本手法は,国立脆弱性データベース(National Vulnerability Database)のCVE開示情報から抽出する。
これは、Retrieval-Augmented Generation (RAG)を使用して、外部の公開知識(例えば、脅威アドバイザリ、コードスニペット)で拡張する。
パイプラインは生成されたアーティファクトを反復的に洗練し、テストケースでのアタック成功を検証し、複雑なマルチコンテナセットアップをサポートする。
論文 参考訳(メタデータ) (2025-09-28T19:16:12Z) - MGC: A Compiler Framework Exploiting Compositional Blindness in Aligned LLMs for Malware Generation [22.29476520010842]
大規模言語モデル(LLM)はソフトウェア開発を民主化し、複雑なアプリケーションをプログラミングする際の専門知識の障壁を減らした。
このアクセシビリティは、悪意のあるソフトウェア開発にまで拡張され、重大なセキュリティ上の懸念がもたらされる。
本稿では,モジュール分解とアライメント回避生成を通じて,この脆弱性を活用する新しいフレームワークであるMalware Generation Compiler(MGC)を紹介する。
論文 参考訳(メタデータ) (2025-07-02T18:00:49Z) - Exploring Large Language Models for Semantic Analysis and Categorization of Android Malware [0.0]
mspは、階層的な階層化チェーンと戦略的プロンプトエンジニアリングを通じて、Androidのマルウェア分析を強化するように設計されている。
mspは、関数、クラス、パッケージレベルで非常に堅牢な要約を提供しながら、最大77%の分類精度を達成することができる。
論文 参考訳(メタデータ) (2025-01-08T21:22:45Z) - When Backdoors Speak: Understanding LLM Backdoor Attacks Through Model-Generated Explanations [58.27927090394458]
大規模言語モデル(LLM)は、バックドア攻撃に弱いことが知られている。
本稿では,自然言語説明の新しいレンズによるバックドア攻撃について検討する。
以上の結果から,バックドアモデルではクリーンな入力に対してコヒーレントな説明が得られたが,有毒なデータに対して多様かつ論理的に欠陥のある説明が得られた。
論文 参考訳(メタデータ) (2024-11-19T18:11:36Z) - Explainable Malware Detection with Tailored Logic Explained Networks [9.506820624395447]
マルウェア検出は、新しい攻撃技術が急速に発達しているため、サイバーセキュリティにおいて恒常的な課題である。
従来のシグネチャベースのアプローチは、大量のマルウェアサンプルとペースを維持するのに苦労している。
マシンラーニングは有望なソリューションを提供するが、見つからないサンプルへの一般化と、マルウェアとして特定されたインスタンスの説明の欠如という問題に直面している。
論文 参考訳(メタデータ) (2024-05-05T17:36:02Z) - FINER: Enhancing State-of-the-art Classifiers with Feature Attribution
to Facilitate Security Analysis [29.248807069227205]
FINERはリスク検出分類器のための最初のフレームワークであり、高忠実で高知能な説明を生成する。
忠実度を向上させるために、説明誘導型マルチタスク学習戦略を用いて分類器を微調整する。
そこで我々は,FA手法の調整とアンサンブルを行うために,タスク知識を取り入れた。
論文 参考訳(メタデータ) (2023-08-10T06:10:49Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。