論文の概要: MASCOT: Analyzing Malware Evolution Through A Well-Curated Source Code Dataset
- arxiv url: http://arxiv.org/abs/2512.00741v1
- Date: Sun, 30 Nov 2025 05:26:23 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-12-02 19:46:34.391002
- Title: MASCOT: Analyzing Malware Evolution Through A Well-Curated Source Code Dataset
- Title(参考訳): MASCOT: 十分に最適化されたソースコードデータセットを通じて、マルウェアの進化を分析する
- Authors: Bojing Li, Duo Zhong, Dharani Nadendla, Gabriel Terceros, Prajna Bhandar, Raguvir S, Charles Nicholas,
- Abstract要約: 本稿では,6032検体を含む手作業によるマルウェアソースコードデータセットについて紹介する。
総合的に見て、この分析は標本とカテゴリ間の接続の強さと方向を定量化する。
詳細な見方では、個々の標本の進化の歴史を辿る。
- 参考スコア(独自算出の注目度): 1.4287348604206223
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: In recent years, the explosion of malware and extensive code reuse have formed complex evolutionary connections among malware specimens. The rapid pace of development makes it challenging for existing studies to characterize recent evolutionary trends. In addition, intuitive tools to untangle these intricate connections between malware specimens or categories are urgently needed. This paper introduces a manually-reviewed malware source code dataset containing 6032 specimens. Building on and extending current research from a software engineering perspective, we systematically evaluate the scale, development costs, code quality, as well as security and dependencies of modern malware. We further introduce a multi-view genealogy analysis to clarify malware connections: at an overall view, this analysis quantifies the strength and direction of connections among specimens and categories; at a detailed view, it traces the evolutionary histories of individual specimens. Experimental results indicate that, despite persistent shortcomings in code quality, malware specimens exhibit an increasing complexity and standardization, in step with the development of mainstream software engineering practices. Meanwhile, our genealogy analysis intuitively reveals lineage expansion and evolution driven by code reuse, providing new evidence and tools for understanding the formation and evolution of the malware ecosystem.
- Abstract(参考訳): 近年、マルウェアの爆発とコード再利用が、マルウェアの標本間で複雑な進化的なつながりを形成している。
急速な発展のペースは、既存の研究が最近の進化の傾向を特徴づけるのを困難にしている。
さらに、これらのマルウェアの検体やカテゴリー間の複雑な接続を解き放つための直感的なツールが緊急に必要である。
本稿では,6032検体を含む手作業によるマルウェアソースコードデータセットについて紹介する。
ソフトウェア工学の観点から現在の研究を構築、拡張し、我々は、現代のマルウェアのセキュリティと依存関係だけでなく、スケール、開発コスト、コード品質を体系的に評価する。
さらに,多視点系譜解析を導入して,マルウェア間の関係を明らかにする。全体としては,個体群と分類群間の関係の強さと方向を定量化し,詳細な観点からは個々の個体群の進化史を辿る。
実験結果から, コード品質の持続的欠陥にもかかわらず, マルウェアの検体は複雑さと標準化が増し, 主流のソフトウェア工学の実践が進んだことが示唆された。
一方,我々の系譜解析は,コード再利用による系統拡張と進化を直感的に明らかにし,マルウェアエコシステムの形成と進化を理解するための新たな証拠とツールを提供する。
関連論文リスト
- XGen-Q: An Explainable Domain-Adaptive LLM Framework with Retrieval-Augmented Generation for Software Security [5.062812514858075]
ジェネレーティブAIと大規模言語モデル(LLM)は、コード理解において強力な能力を示しているが、サイバーセキュリティにおける使用は限られている。
我々は、Qwen-Coderアーキテクチャ上に構築され、100万以上のマルウェアサンプルからなる大規模コーパスで事前訓練されたドメイン適応型LLMであるXGen-Qを紹介する。
XGen-Qは、検索拡張世代(RAG)と組み合わせたマルチステージプロンプト戦略を使用して、信頼性の高いマルウェア識別と詳細な法医学的報告を提供する。
論文 参考訳(メタデータ) (2025-10-21T18:35:38Z) - Recent Advances in Malware Detection: Graph Learning and Explainability [2.5824213547618067]
この調査は、グラフ学習と説明可能性の間の相互作用に焦点を当てている。
これらのコンポーネントを統合することで、グラフ学習と説明可能性が堅牢で解釈可能でスケーラブルなマルウェア検出システムの構築にどのように貢献するかを示す。
論文 参考訳(メタデータ) (2025-02-14T21:10:03Z) - Exploring Large Language Models for Semantic Analysis and Categorization of Android Malware [0.0]
mspは、階層的な階層化チェーンと戦略的プロンプトエンジニアリングを通じて、Androidのマルウェア分析を強化するように設計されている。
mspは、関数、クラス、パッケージレベルで非常に堅牢な要約を提供しながら、最大77%の分類精度を達成することができる。
論文 参考訳(メタデータ) (2025-01-08T21:22:45Z) - A Survey of Neural Code Intelligence: Paradigms, Advances and Beyond [84.95530356322621]
この調査は、コードインテリジェンスの発展に関する体系的なレビューを示す。
50以上の代表モデルとその変種、20以上のタスクのカテゴリ、および680以上の関連する広範な研究をカバーしている。
発達軌道の考察に基づいて、コードインテリジェンスとより広範なマシンインテリジェンスとの間の新たな相乗効果について検討する。
論文 参考訳(メタデータ) (2024-03-21T08:54:56Z) - SimSCOOD: Systematic Analysis of Out-of-Distribution Generalization in
Fine-tuned Source Code Models [58.78043959556283]
本研究は,Low-Rank Adaptation (LoRA)ファインチューニング手法を含む,異なる微調整手法によるモデルの挙動について検討する。
解析の結果、LoRAファインチューニングは様々なシナリオにおけるフルファインチューニングよりも、OODの一般化性能が大幅に向上していることが判明した。
論文 参考訳(メタデータ) (2022-10-10T16:07:24Z) - Critical Learning Periods for Multisensory Integration in Deep Networks [112.40005682521638]
ニューラルネットワークが様々な情報源からの情報を統合する能力は、トレーニングの初期段階において、適切な相関した信号に晒されることに批判的になることを示す。
臨界周期は、訓練されたシステムとその学習された表現の最終性能を決定づける、複雑で不安定な初期過渡的ダイナミクスから生じることを示す。
論文 参考訳(メタデータ) (2022-10-06T23:50:38Z) - Software Vulnerability Detection via Deep Learning over Disaggregated
Code Graph Representation [57.92972327649165]
この研究は、コードコーパスから安全でないパターンを自動的に学習するためのディープラーニングアプローチを探求する。
コードには解析を伴うグラフ構造が自然に認められるため,プログラムの意味的文脈と構造的規則性の両方を利用する新しいグラフニューラルネットワーク(GNN)を開発する。
論文 参考訳(メタデータ) (2021-09-07T21:24:36Z) - Machine Learning for Malware Evolution Detection [4.111899441919165]
我々は、マルウェアの進化がいつ起こるかを決定するために、かなりの数のマルウェアファミリーで実験を行う。
隠れマルコフモデル (HMM) と単語埋め込み技術 HMM2Vec と Word2Vec に基づく解析について考察する。
論文 参考訳(メタデータ) (2021-07-04T13:47:06Z) - Word Embedding Techniques for Malware Evolution Detection [4.111899441919165]
マルウェアファミリーが進化する可能性のある時点でのポイントの検出を目的とした,さまざまな実験を行う。
いくつかのマルウェアファミリーが分析され、それぞれが長期間にわたって収集された多数のサンプルを含んでいる。
実験は, 単語埋め込み技術に基づく機能工学を用いて, 改良結果を得たことを示す。
論文 参考訳(メタデータ) (2021-03-07T14:55:32Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。