論文の概要: Malicious ML Model Detection by Learning Dynamic Behaviors
- arxiv url: http://arxiv.org/abs/2604.19438v1
- Date: Tue, 21 Apr 2026 13:12:42 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-04-22 22:41:49.779916
- Title: Malicious ML Model Detection by Learning Dynamic Behaviors
- Title(参考訳): 学習動作による悪性MLモデル検出
- Authors: Sarang Nambiar, Dhruv Pradhan, Ezekiel Soremekun,
- Abstract要約: 悪意のある攻撃は、例えばモデルローディング中に、信頼されたユーザー環境上で任意のコードを実行することができる。
動的解析と機械学習(ML)を用いて良性PTMの挙動を学習し、悪意のあるPTMを検出する新しい手法を提案する。
我々は,Hugging FaceやMalHugなど,さまざまなソースから25,000以上の良性および悪意のあるPTMを用いてDynaHugを評価する。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by-nc-sa/4.0/
- Abstract: Pre-trained machine learning models (PTMs) are commonly provided via Model Hubs (e.g., Hugging Face) in standard formats like Pickles to facilitate accessibility and reuse. However, this ML supply chain setting is susceptible to malicious attacks that are capable of executing arbitrary code on trusted user environments, e.g., during model loading. To detect malicious PTMs, state-of-the-art detectors (e.g., PickleScan) rely on rules, heuristics, or static analysis, but ignore runtime model behaviors. Consequently, they either miss malicious models due to under-approximation (blacklisting) or miscategorize benign models due to over-approximation (static analysis or whitelisting). To address this challenge, we propose a novel technique (DynaHug) which detects malicious PTMs by learning the behavior of benign PTMs using dynamic analysis and machine learning (ML). DynaHug trains an ML classifier (one-class SVM (OCSVM)) on the runtime behaviours of task-specific benign models. We evaluate DynaHug using over 25,000 benign and malicious PTMs from different sources including Hugging Face and MalHug. We also compare DynaHug to several state-of-the-art detectors including static, dynamic and LLM-based detectors. Results show that DynaHug is up to 44% more effective than existing baselines in terms of F1-score. Our ablation study demonstrates that our design decisions (dynamic analysis, OCSVM, clustering) contribute positively to DynaHug's effectiveness.
- Abstract(参考訳): 事前トレーニングされた機械学習モデル(PTM)は一般的に、アクセシビリティと再利用を容易にするために、Picklesのような標準フォーマットのモデルハブ(例えばHugging Face)を介して提供される。
しかし、このMLサプライチェーン設定は、モデルローディング中に信頼できるユーザ環境、例えば、任意のコードを実行できる悪意のある攻撃に影響を受けやすい。
悪意のあるPTMを検出するために、最先端の検出器(例えばPickleScan)はルールやヒューリスティック、静的解析に依存しているが、実行時のモデル動作は無視する。
その結果、過度な近似(ブラックリスト)のために悪意あるモデルを見逃すか、過度な近似(静的分析またはホワイトリスト)のために良質なモデルを誤分類する。
この課題に対処するために、動的解析と機械学習(ML)を用いて良性PTMの振る舞いを学習し、悪意のあるPTMを検出する新しい手法(DynaHug)を提案する。
DynaHugはタスク固有の良性モデルの実行時の振る舞いに基づいてML分類器(一級SVM(OCSVM))をトレーニングする。
我々は,Hugging FaceやMalHugなど,さまざまなソースから25,000以上の良性および悪意のあるPTMを用いてDynaHugを評価する。
また、DynaHugを静的、動的、LLMベースの検出器を含む最先端の検出器と比較する。
その結果、DynaHugはF1スコアの点で既存のベースラインよりも最大44%有効であることがわかった。
我々のアブレーション調査は、設計決定(動的解析、OCSVM、クラスタリング)がDynaHugの有効性に肯定的な貢献をすることを示している。
関連論文リスト
- Machine Learning-Based Detection of MCP Attacks [1.6034709235899625]
Model Context Protocol(MCP)は、大規模言語モデルの機能を拡張した、新しく新しい技術である。
いくつかの研究は関連するセキュリティ上の欠陥を強調しているが、CP攻撃の検出は未調査のままである。
本研究は,従来の学習モデルとディープラーニングモデルの両方を含む,さまざまな教師付き機械学習アプローチを開発し,評価する。
論文 参考訳(メタデータ) (2026-04-12T08:54:58Z) - Reshaping Action Error Distributions for Reliable Vision-Language-Action Models [69.38615670891038]
ロボット操作において、視覚言語アクション(VLA)モデルは、一般化可能でスケーラブルなロボットポリシーを学ぶための有望なパラダイムとして登場した。
連続動作型VLAモデルに焦点をあて、トレーニング中の動作誤差分布を再構成することにより、従来のMSEベースの回帰を超越する。
複数の代表的VLAアーキテクチャ上で、標準、少数ショット、ノイズの多い設定にまたがるアプローチを評価します。
論文 参考訳(メタデータ) (2026-02-04T05:37:09Z) - Adversarially Robust and Interpretable Magecart Malware Detection [1.3266402517619371]
Magecartのスキミング攻撃は、オンライン決済システムにおけるクライアント側のセキュリティとユーザ信頼に対する重大な脅威として浮上している。
本稿では,実世界のデータセットを用いた機械学習(ML)モデルの比較研究を通じて,Magecart攻撃の堅牢かつ説明可能な検出を実現するという課題に対処する。
論文 参考訳(メタデータ) (2025-11-06T15:13:29Z) - Predictable MDP Abstraction for Unsupervised Model-Based RL [93.91375268580806]
予測可能なMDP抽象化(PMA)を提案する。
元のMDPで予測モデルを訓練する代わりに、学習されたアクション空間を持つ変換MDPでモデルを訓練する。
我々はPMAを理論的に解析し、PMAが以前の教師なしモデルベースRLアプローチよりも大幅に改善することを示す。
論文 参考訳(メタデータ) (2023-02-08T07:37:51Z) - Model Monitoring and Robustness of In-Use Machine Learning Models:
Quantifying Data Distribution Shifts Using Population Stability Index [2.578242050187029]
我々は、自律運転に関連するコンピュータビジョンの例に注目し、画像にノイズを加えることによって発生するシフトを検出することを目的としている。
人口安定指数 (PSI) を, シフトの有無, および実験結果の指標として用いた。
論文 参考訳(メタデータ) (2023-02-01T22:06:31Z) - Learning continuous models for continuous physics [94.42705784823997]
本研究では,科学技術応用のための機械学習モデルを検証する数値解析理論に基づくテストを開発する。
本研究は,従来のMLトレーニング/テスト手法と一体化して,科学・工学分野におけるモデルの検証を行う方法である。
論文 参考訳(メタデータ) (2022-02-17T07:56:46Z) - Momentum Pseudo-Labeling for Semi-Supervised Speech Recognition [55.362258027878966]
本稿では,半教師付き音声認識のための簡易かつ効果的な手法として,モーメント擬似ラベル(MPL)を提案する。
MPLは、平均的な教師メソッドにインスパイアされて、相互に相互作用し、学習するオンラインとオフラインの2つのモデルで構成されている。
実験の結果,MPLはベースモデルよりも効果的に改善され,様々な半教師付きシナリオに拡張可能であることが示された。
論文 参考訳(メタデータ) (2021-06-16T16:24:55Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。