論文の概要: Using Malware Detection Techniques for HPC Application Classification
- arxiv url: http://arxiv.org/abs/2411.18327v1
- Date: Wed, 27 Nov 2024 13:28:43 GMT
- ステータス: 翻訳完了
- システム内更新日: 2024-11-28 15:24:55.450021
- Title: Using Malware Detection Techniques for HPC Application Classification
- Title(参考訳): HPCアプリケーション分類におけるマルウェア検出手法の利用
- Authors: Thomas Jakobsche, Florina M. Ciorba,
- Abstract要約: ジョブ名やリソース使用量に基づいてアプリケーションを分類する既存の方法は、しばしば信頼できないか、異なる入力やシステムノイズによって異なる振る舞いを持つアプリケーションをキャプチャできない。
本研究では,HPCアプリケーション実行ファイルの分類に類似性保存ファジィハッシュを用いる手法を提案する。
- 参考スコア(独自算出の注目度): 1.3812010983144802
- License:
- Abstract: HPC systems face security and compliance challenges, particularly in preventing waste and misuse of computational resources by unauthorized or malicious software that deviates from allocation purpose. Existing methods to classify applications based on job names or resource usage are often unreliable or fail to capture applications that have different behavior due to different inputs or system noise. This research proposes an approach that uses similarity-preserving fuzzy hashes to classify HPC application executables. By comparing the similarity of SSDeep fuzzy hashes, a Random Forest Classifier can accurately label applications executing on HPC systems including unknown samples. We evaluate the Fuzzy Hash Classifier on a dataset of 92 application classes and 5333 distinct application samples. The proposed method achieved a macro f1-score of 90% (micro f1-score: 89%, weighted f1-score: 90%). Our approach addresses the critical need for more effective application classification in HPC environments, minimizing resource waste, and enhancing security and compliance.
- Abstract(参考訳): HPCシステムは、特に割り当て目的から逸脱する不正または悪意のあるソフトウェアによって、計算資源の無駄や誤用を防止するために、セキュリティとコンプライアンスの課題に直面している。
ジョブ名やリソース使用量に基づいてアプリケーションを分類する既存の方法は、しばしば信頼できないか、異なる入力やシステムノイズによって異なる振る舞いを持つアプリケーションをキャプチャできない。
本研究では,HPCアプリケーション実行ファイルの分類に類似性保存ファジィハッシュを用いる手法を提案する。
SSDeep fuzzyハッシュの類似性を比較することで、ランダムフォレスト分類器は未知のサンプルを含むHPCシステムで実行されるアプリケーションを正確にラベル付けすることができる。
92のアプリケーションクラスと5333の異なるアプリケーションサンプルのデータセット上で、ファジィハッシュ分類器を評価する。
提案手法はマクロf1スコアの90%(マイクロf1スコア:89%,重み付きf1スコア:90%)を達成した。
提案手法は,HPC環境におけるより効率的なアプリケーション分類の必要性,資源無駄の最小化,セキュリティとコンプライアンスの強化に対処する。
関連論文リスト
- Meta-learning for Positive-unlabeled Classification [40.11462237689747]
提案手法は,モデルがPUデータに適用された後のテスト分類リスクを最小限に抑える。
この方法は各インスタンスをニューラルネットワークを使ってタスク固有の空間に埋め込む。
提案手法は1つの実世界のデータセットと3つの実世界のデータセットで既存の手法よりも優れていることを示す。
論文 参考訳(メタデータ) (2024-06-06T01:50:01Z) - Efficient Two-Stage Gaussian Process Regression Via Automatic Kernel Search and Subsampling [5.584863079768593]
本稿では,平均的予測と不確実性定量化(UQ)を分離して,平均的不特定化を防止する柔軟な2段階GPRフレームワークを提案する。
また,理論解析によって支持されるカーネル関数の誤特定アルゴリズムを提案し,候補集合から最適なカーネルを選択する。
計算コストがはるかに低いため、サブサンプリングベースの戦略は、完全なデータセットでのみトレーニングするよりも、競争力やパフォーマンスが向上します。
論文 参考訳(メタデータ) (2024-05-22T16:11:29Z) - Adaptive Hierarchical Certification for Segmentation using Randomized Smoothing [87.48628403354351]
機械学習の認証は、特定の条件下では、敵対的なサンプルが特定の範囲内でモデルを回避できないことを証明している。
セグメンテーションの一般的な認証方法は、平らな粒度のクラスを使い、モデルの不確実性による高い断続率をもたらす。
本稿では,複数レベルの階層内で画素を認証し,不安定なコンポーネントに対して粗いレベルに適応的に認証を緩和する,新しい,より実用的な設定を提案する。
論文 参考訳(メタデータ) (2024-02-13T11:59:43Z) - Performance evaluation of Machine learning algorithms for Intrusion Detection System [0.40964539027092917]
本稿では機械学習(ML)技術を用いた侵入検知システム(IDS)の解析に焦点を当てた。
機械学習モデルのトレーニングと検証に使用されるKDD CUP-'99'侵入検出データセットを分析した。
論文 参考訳(メタデータ) (2023-10-01T06:35:37Z) - On the Universal Adversarial Perturbations for Efficient Data-free
Adversarial Detection [55.73320979733527]
本稿では,UAPに対して正常サンプルと逆サンプルの異なる応答を誘導する,データに依存しない逆検出フレームワークを提案する。
実験結果から,本手法は様々なテキスト分類タスクにおいて,競合検出性能を実現することが示された。
論文 参考訳(メタデータ) (2023-06-27T02:54:07Z) - Efficient Approximate Kernel Based Spike Sequence Classification [56.2938724367661]
SVMのような機械学習モデルは、シーケンスのペア間の距離/相似性の定義を必要とする。
厳密な手法により分類性能は向上するが、計算コストが高い。
本稿では,その予測性能を向上させるために,近似カーネルの性能を改善する一連の方法を提案する。
論文 参考訳(メタデータ) (2022-09-11T22:44:19Z) - Code Compliance Assessment as a Learning Problem [0.15229257192293197]
コードコンプライアンスアセスメントを機械学習(ML)問題として定式化する。
コードのコンプライアンス、非コンプライアンス、あるいは無関係に関する予測を生成します。
当社のツール Policy2Code は分類精度 (59%, 71%) と検索MSR (0.05, 0.21) を実現している。
ユーザ調査では、24%のPolicy2Code検出が、CodeBERTの7%に対して受け入れられた。
論文 参考訳(メタデータ) (2022-09-10T05:41:04Z) - Representation learning with function call graph transformations for
malware open set recognition [0.0]
オープンセット認識問題は、セキュリティなど、多くの機械学習(ML)アプリケーションにおいて課題となっている。
本稿では,マルウェア分類におけるOSR問題に対する自己教師付き事前学習手法を提案する。
論文 参考訳(メタデータ) (2022-05-13T22:40:14Z) - Self-Certifying Classification by Linearized Deep Assignment [65.0100925582087]
そこで我々は,PAC-Bayesリスク認定パラダイム内で,グラフ上のメトリックデータを分類するための新しい深層予測器のクラスを提案する。
PAC-Bayesの最近の文献とデータに依存した先行研究に基づいて、この手法は仮説空間上の後続分布の学習を可能にする。
論文 参考訳(メタデータ) (2022-01-26T19:59:14Z) - Noise-resistant Deep Metric Learning with Ranking-based Instance
Selection [59.286567680389766]
PRISM(Probabilistic Ranking-based Instance Selection with Memory)と呼ばれるDMLの耐騒音トレーニング技術を提案する。
PRISMは、ニューラルネットワークの以前のバージョンから抽出された画像特徴との平均的類似性を用いて、ミニバッチ内のノイズデータを識別する。
メモリバンクが生み出す高い計算コストを緩和するために,個々のデータポイントをクラスセンタに置き換える高速化手法を提案する。
論文 参考訳(メタデータ) (2021-03-30T03:22:17Z) - Maat: Automatically Analyzing VirusTotal for Accurate Labeling and
Effective Malware Detection [71.84087757644708]
マルウェア分析と検出の研究コミュニティは、約60台のスキャナーのスキャン結果に基づいてAndroidアプリをラベル付けするために、オンラインプラットフォームVirusTotalに依存している。
VirusTotalから取得したスキャン結果を最もよく解釈する方法の基準はありません。
機械学習(ML)ベースのラベリングスキームを自動生成することで,標準化と持続可能性というこれらの問題に対処する手法であるMaatを実装した。
論文 参考訳(メタデータ) (2020-07-01T14:15:03Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。