論文の概要: Machine Learning-Based Detection of MCP Attacks
- arxiv url: http://arxiv.org/abs/2604.10534v1
- Date: Sun, 12 Apr 2026 08:54:58 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-04-14 20:13:16.08296
- Title: Machine Learning-Based Detection of MCP Attacks
- Title(参考訳): 機械学習によるMPP攻撃の検出
- Authors: Tobias Mattsson, Samuel Nyberg, Anton Borg, Ricardo Britto,
- Abstract要約: Model Context Protocol(MCP)は、大規模言語モデルの機能を拡張した、新しく新しい技術である。
いくつかの研究は関連するセキュリティ上の欠陥を強調しているが、CP攻撃の検出は未調査のままである。
本研究は,従来の学習モデルとディープラーニングモデルの両方を含む,さまざまな教師付き機械学習アプローチを開発し,評価する。
- 参考スコア(独自算出の注目度): 1.6034709235899625
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: The Model Context Protocol (MCP) is a new and emerging technology that extends the functionality of large language models, improving workflows but also exposing users to a new attack surface. Several studies have highlighted related security flaws, but MCP attack detection remains underexplored. To address this research gap, this study develops and evaluates a range of supervised machine learning approaches, including both traditional and deep-learning models. We evaluated the systems on the detection of malicious MCP tool descriptions in two scenarios: (1) a binary classification task distinguishing malicious from benign tools, and (2) a multiclass classification task identifying the attack type while separating benign from malicious tools. In addition to the machine learning models, we compared a rule-based approach that serves as a baseline. The results indicate that several of the developed models achieved 100\% F1-score on the binary classification task. In the multiclass scenario, the SVC and BERT models performed best, achieving F1 scores of 90.56\% and 88.33\%, respectively. Confusion matrices were also used to visualize the full distribution of predictions often missed by traditional metrics, providing additional insight for selecting the best-fitting solution in real-world scenarios. This study presents an addition to the MCP defence area, showing that machine learning models can perform exceptionally well in separating malicious and benign data points. To apply the solution in a live environment, a middleware was developed to classify which MCP tools are safe to use before execution, and block the ones that are not safe. Furthermore, the study shows that these models can outperform traditional rule-based solutions currently in use in the field.
- Abstract(参考訳): Model Context Protocol(MCP)は、大規模言語モデルの機能を拡張し、ワークフローを改善し、新たな攻撃面にユーザをさらけ出す新しい新興技術である。
いくつかの研究は関連するセキュリティ上の欠陥を強調しているが、CP攻撃の検出は未調査のままである。
この研究ギャップに対処するため、従来の機械学習モデルとディープラーニングモデルの両方を含む、さまざまな教師付き機械学習アプローチを開発し、評価する。
筆者らは,悪意のあるMPPツール記述の検出システムについて,(1)悪質なツールと悪質なツールを区別するバイナリ分類タスク,(2)悪質なツールと悪質なツールを区別しながら攻撃タイプを識別するマルチクラス分類タスクの2つのシナリオで評価した。
機械学習モデルに加えて、ベースラインとして機能するルールベースのアプローチを比較した。
その結果, 2進分類タスクにおいてF1スコア100\%を達成するモデルがいくつか存在することがわかった。
マルチクラスのシナリオでは、SVCとBERTのモデルが最も良く、それぞれ90.56\%と88.33\%のスコアを得た。
コンフュージョン行列は、しばしば伝統的なメトリクスによって見逃される予測の完全な分布を可視化するためにも使われ、現実世界のシナリオで最適なソリューションを選択するための追加の洞察を提供する。
そこで本研究では,悪意のあるデータポイントと良心的なデータポイントの分離において,機械学習モデルが極めて優れた性能を発揮することを示す。
このソリューションを実環境に適用するために、実行前にどのMPPツールが安全なのかを分類し、安全でないツールをブロックするミドルウェアを開発した。
さらに、この研究は、これらのモデルが、この分野で現在使われている従来のルールベースのソリューションより優れていることを示している。
関連論文リスト
- LLM Unlearning Under the Microscope: A Full-Stack View on Methods and Metrics [10.638045151201084]
本稿では,近年のステートフル・アンラーニング法12の原則的分類について述べる。
未学習効果(UE)、実用性維持(UT)、堅牢性(Rob)の評価を再考する。
分析の結果,Multiple-choice question (MCQ) の精度に支配される現在の評価は,狭い視点しか示さないことがわかった。
論文 参考訳(メタデータ) (2025-10-08T23:47:05Z) - Towards Lifecycle Unlearning Commitment Management: Measuring Sample-level Unlearning Completeness [30.596695293390415]
補間近似測定(Interpolated Approximate Measurement, IAM)は、非学習推論用に設計されたフレームワークである。
IAMは、クエリされたサンプルに対するモデルの一般化適合行動ギャップを補間することにより、サンプルレベルの未学習完全性を定量化する。
IAMを最近の近似アンラーニングアルゴリズムに適用し、オーバーアンラーニングとアンダーアンラーニングの両方のリスクを明らかにする。
論文 参考訳(メタデータ) (2025-06-06T14:22:18Z) - An Efficient Security Model for Industrial Internet of Things (IIoT) System Based on Machine Learning Principles [0.0]
本稿では、エッジデバイスが様々な内部および外部の脅威に対して防御するためのセキュリティパラダイムを提案する。
提案したセキュリティパラダイムは、様々な内部および外部の脅威に対して有効であり、低コストのシングルボードコンピュータに適用可能である。
論文 参考訳(メタデータ) (2025-02-10T14:20:13Z) - Toward Multi-class Anomaly Detection: Exploring Class-aware Unified Model against Inter-class Interference [67.36605226797887]
統一型異常検出(MINT-AD)のためのマルチクラスインプリシトニューラル表現変換器を提案する。
マルチクラス分布を学習することにより、モデルが変換器デコーダのクラス対応クエリ埋め込みを生成する。
MINT-ADは、カテゴリと位置情報を特徴埋め込み空間に投影することができ、さらに分類と事前確率損失関数によって監督される。
論文 参考訳(メタデータ) (2024-03-21T08:08:31Z) - A Generative Framework for Low-Cost Result Validation of Machine Learning-as-a-Service Inference [4.478182379059458]
FidesはML-as-a-Service(ML)推論のリアルタイム整合性検証のための新しいフレームワークである。
Fidesは、統計的分析とばらつき測定を使用して、サービスモデルが攻撃を受けている場合、高い確率で識別するクライアント側攻撃検出モデルを備えている。
攻撃検出と再分類モデルの訓練のための生成的逆ネットワークフレームワークを考案した。
論文 参考訳(メタデータ) (2023-03-31T19:17:30Z) - Self-Destructing Models: Increasing the Costs of Harmful Dual Uses of
Foundation Models [103.71308117592963]
本稿ではメタラーニングと逆学習の技法を活用した自己破壊モデルの学習アルゴリズムを提案する。
小規模な実験では、MLACは、BERTスタイルのモデルが性別識別を行うために再目的化されることをほとんど防ぐことができることを示す。
論文 参考訳(メタデータ) (2022-11-27T21:43:45Z) - Generalization Properties of Retrieval-based Models [50.35325326050263]
検索ベースの機械学習手法は、幅広い問題で成功をおさめた。
これらのモデルの約束を示す文献が増えているにもかかわらず、そのようなモデルの理論的基盤はいまだに解明されていない。
本稿では,その一般化能力を特徴付けるために,検索ベースモデルの形式的処理を行う。
論文 参考訳(メタデータ) (2022-10-06T00:33:01Z) - Incremental Online Learning Algorithms Comparison for Gesture and Visual
Smart Sensors [68.8204255655161]
本稿では,加速度センサデータに基づくジェスチャー認識と画像分類の2つの実例として,最先端の4つのアルゴリズムを比較した。
以上の結果から,これらのシステムの信頼性と小型メモリMCUへのデプロイの可能性が確認された。
論文 参考訳(メタデータ) (2022-09-01T17:05:20Z) - Anomaly Detection in Cybersecurity: Unsupervised, Graph-Based and
Supervised Learning Methods in Adversarial Environments [63.942632088208505]
現在の運用環境に固有ののは、敵対的機械学習の実践である。
本研究では,教師なし学習とグラフに基づく異常検出の可能性を検討する。
我々は,教師付きモデルの訓練時に,現実的な対人訓練機構を組み込んで,対人環境における強力な分類性能を実現する。
論文 参考訳(メタデータ) (2021-05-14T10:05:10Z) - ALT-MAS: A Data-Efficient Framework for Active Testing of Machine
Learning Algorithms [58.684954492439424]
少量のラベル付きテストデータのみを用いて機械学習モデルを効率的にテストする新しいフレームワークを提案する。
ベイズニューラルネットワーク(bnn)を用いたモデルアンダーテストの関心指標の推定が目的である。
論文 参考訳(メタデータ) (2021-04-11T12:14:04Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。