論文の概要: MARD: A Multi-Agent Framework for Robust Android Malware Detection
- arxiv url: http://arxiv.org/abs/2604.25264v1
- Date: Tue, 28 Apr 2026 06:21:49 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-04-29 16:49:17.731279
- Title: MARD: A Multi-Agent Framework for Robust Android Malware Detection
- Title(参考訳): MARD:ロバストなAndroidマルウェア検出のためのマルチエージェントフレームワーク
- Authors: Xueying Zeng, Youquan Xian, Sihao Liu, Xudong Mou, Yanze Li, Lei Cui, Bo Li,
- Abstract要約: MARDは、堅牢なAndroidマルウェア検出のためのマルチエージェントフレームワークである。
LLMの意味的理解と従来の静的解析のギャップを埋める。
F1スコアは93.46%で、ドメイン固有の微調整はない。
- 参考スコア(独自算出の注目度): 9.71096001926758
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: With the rapid evolution of Android applications, traditional machine learning-based detection models suffer from concept drift. Additionally, they are constrained by shallow features, lacking deep semantic understanding and interpretability of decisions. Although Large Language Models (LLMs) demonstrate remarkable semantic reasoning capabilities, directly processing massive raw code incurs prohibitive token overhead. Moreover, this approach fails to fully unleash the deep logical reasoning potential of LLMs within complex contexts. To address these limitations, we propose MARD, a multi-agent framework for robust Android malware detection. This framework effectively bridges the gap between the semantic understanding of LLMs and traditional static analysis. It treats underlying deterministic analysis engines as on-demand execution tools, while utilizing the LLM to orchestrate the entire decision-making process. By designing an autonomous multi-agent interaction mechanism based on the ReAct paradigm, MARD constructs a highly interpretable evidentiary chain for conviction. Furthermore, we radically reduce the total cost of conducting a deep analysis of a single complex APK to under $0.10. Evaluations demonstrate that, without any domain-specific fine-tuning, MARD achieves an F1 score of 93.46%. It not only outperforms continual learning baselines but also exhibits robustness against concept drift and strong cross-domain generalization capabilities in evaluations spanning up to five years.
- Abstract(参考訳): Androidアプリケーションの急速な進化により、従来の機械学習ベースの検出モデルはコンセプトドリフトに悩まされる。
さらに、浅い特徴に制約され、深い意味的理解と決定の解釈可能性が欠如している。
大きな言語モデル(LLM)は目覚ましいセマンティック推論機能を示しているが、大量の生コードを直接処理するとトークンのオーバーヘッドが禁じられる。
さらに、このアプローチは複雑な文脈において LLM の深い論理的推論ポテンシャルを完全に解けない。
これらの制限に対処するため、我々はAndroidの堅牢なマルウェア検出のためのマルチエージェントフレームワークであるMARDを提案する。
このフレームワークは、LLMの意味的理解と従来の静的解析のギャップを効果的に埋める。
根底にある決定論的分析エンジンをオンデマンド実行ツールとして扱い、LCMを使用して意思決定プロセス全体を編成する。
ReActパラダイムに基づいた自律的マルチエージェントインタラクション機構を設計することにより、MARDは確信のための高度に解釈可能な顕在鎖を構築する。
さらに、1つの複素APKの深い分析を行うための総コストを0.10ドル以下に劇的に削減する。
評価の結果、ドメイン固有の微調整がなければ、MARDのF1スコアは93.46%に達する。
連続的な学習ベースラインを上回るだけでなく、最大5年間にわたる評価において、コンセプトドリフトと強力なドメイン間一般化能力に対して堅牢性を示す。
関連論文リスト
- ExAI5G: A Logic-Based Explainable AI Framework for Intrusion Detection in 5G Networks [0.0]
5Gネットワークの侵入検知システム(IDS)は複雑な高ボリュームトラフィックを処理しなければならない。
我々は、TransformerベースのディープラーニングIDSと論理ベースの説明可能なAI(XAI)技術を統合することで、解釈可能性の優先順位付けを行うフレームワークであるExAI5Gを提案する。
5G IoT侵入データセットでは, 99.9%の精度, 0.854のマクロF1スコアを実現し, 高い性能を示した。
論文 参考訳(メタデータ) (2026-04-20T10:19:57Z) - Dynamic analysis enhances issue resolution [53.50448142467294]
DAIRA(Dynamic Analysis-enhanced Issue Resolution Agent)は、エージェントの推論サイクルに動的解析を組み込む自動修復フレームワークである。
テストトレース駆動の方法論によって駆動されるDAIRAは、軽量モニタを使用して重要なランタイムデータを抽出する。
Gemini 3 Flash Previewを使用すると、DAIRAは新たな最先端(SOTA)パフォーマンスを確立し、SWE-bench Verifiedデータセットで79.4%の解像度を達成する。
論文 参考訳(メタデータ) (2026-03-23T14:48:54Z) - Refer-Agent: A Collaborative Multi-Agent System with Reasoning and Reflection for Referring Video Object Segmentation [50.22481337087162]
Referring Video Object (RVOS) は、テキストクエリに基づくビデオ内のオブジェクトのセグメンテーションを目的としている。
Refer-Agent (Refer-Agent) は、共用多エージェントシステムである。
論文 参考訳(メタデータ) (2026-02-03T14:48:12Z) - On Generalization in Agentic Tool Calling: CoreThink Agentic Reasoner and MAVEN Dataset [16.921428284844684]
エージェントツールコール環境間の一般化は、信頼できる推論システムを開発する上で重要な未解決課題である。
本稿では、構造化分解と適応ツールオーケストレーションのための軽量なシンボリック推論層を用いて、大規模言語モデルを強化するフレームワークを提案する。
論文 参考訳(メタデータ) (2025-10-27T00:58:48Z) - Computational Reasoning of Large Language Models [51.629694188014064]
textbfTuring Machine Benchは,Large Language Models(LLM)による推論プロセスの実行能力を評価するベンチマークである。
TMBenchには、自己完結型および知識に依存しない推論、最小主義的な多段階構造、制御可能な難易度、チューリングマシンに基づく理論的基礎の4つの重要な特徴が組み込まれている。
論文 参考訳(メタデータ) (2025-04-29T13:52:47Z) - LAMD: Context-driven Android Malware Detection and Classification with LLMs [8.582859303611881]
大きな言語モデル(LLM)は、ゼロショット推論と推論機能を備えた有望な代替手段を提供する。
LLMベースのAndroidマルウェア検出を実現するための現実的なコンテキスト駆動型フレームワークであるLAMDを提案する。
論文 参考訳(メタデータ) (2025-02-18T17:01:37Z) - MR-Ben: A Meta-Reasoning Benchmark for Evaluating System-2 Thinking in LLMs [55.20845457594977]
大規模言語モデル(LLM)は、問題解決と意思決定の能力の向上を示している。
本稿ではメタ推論技術を必要とするプロセスベースのベンチマークMR-Benを提案する。
メタ推論のパラダイムは,システム2のスロー思考に特に適しています。
論文 参考訳(メタデータ) (2024-06-20T03:50:23Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。