論文の概要: JABBERWOCK: A Tool for WebAssembly Dataset Generation and Its
Application to Malicious Website Detection
- arxiv url: http://arxiv.org/abs/2306.05698v1
- Date: Fri, 9 Jun 2023 06:35:14 GMT
- ステータス: 処理完了
- システム内更新日: 2023-06-12 14:26:53.226068
- Title: JABBERWOCK: A Tool for WebAssembly Dataset Generation and Its
Application to Malicious Website Detection
- Title(参考訳): JABBERWOCK:WebAssemblyデータセット生成ツールとその悪意のあるWebサイト検出への応用
- Authors: Chika Komiya and Naoto Yanai and Kyosuke Yamashita and Shingo Okamura
- Abstract要約: JABBERWOCKは、JavaScript経由で擬似的にWebAssemblyを生成するツールである。
JABBERWOCKは99%のF1スコアで悪意のあるWebサイト検出を可能にする。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Machine learning is often used for malicious website detection, but an
approach incorporating WebAssembly as a feature has not been explored due to a
limited number of samples, to the best of our knowledge. In this paper, we
propose JABBERWOCK (JAvascript-Based Binary EncodeR by WebAssembly Optimization
paCKer), a tool to generate WebAssembly datasets in a pseudo fashion via
JavaScript. Loosely speaking, JABBERWOCK automatically gathers JavaScript code
in the real world, convert them into WebAssembly, and then outputs vectors of
the WebAssembly as samples for malicious website detection. We also conduct
experimental evaluations of JABBERWOCK in terms of the processing time for
dataset generation, comparison of the generated samples with actual WebAssembly
samples gathered from the Internet, and an application for malicious website
detection. Regarding the processing time, we show that JABBERWOCK can construct
a dataset in 4.5 seconds per sample for any number of samples. Next, comparing
10,000 samples output by JABBERWOCK with 168 gathered WebAssembly samples, we
believe that the generated samples by JABBERWOCK are similar to those in the
real world. We then show that JABBERWOCK can provide malicious website
detection with 99\% F1-score because JABBERWOCK makes a gap between benign and
malicious samples as the reason for the above high score. We also confirm that
JABBERWOCK can be combined with an existing malicious website detection tool to
improve F1-scores. JABBERWOCK is publicly available via GitHub
(https://github.com/c-chocolate/Jabberwock).
- Abstract(参考訳): 機械学習は悪質なwebサイト検出によく使用されるが、webassemblyを機能として組み込むアプローチは、限られた数のサンプルのため、私たちの知る限りでは検討されていない。
本稿では、javascriptによる擬似的な方法でwebassemblyデータセットを生成するツールであるjabberwock(webassembly optimization packerによるjavascriptベースのバイナリエンコーダ)を提案する。
一般的に言うと、JABBERWOCKはJavaScriptコードを実世界で自動的に収集し、WebAssemblyに変換し、悪意のあるWebサイト検出のためのサンプルとしてWebAssemblyのベクターを出力する。
また、データセット生成の処理時間、生成したサンプルとインターネットから収集した実際のWebAssemblyサンプルとの比較、悪意のあるWebサイト検出アプリケーションの観点から、JABBERWOCKを実験的に評価する。
処理時間については,JABBERWOCKがサンプル数毎に4.5秒でデータセットを構築することができることを示す。
次に、JABBERWOCKが出力する1万のサンプルと168個のWebAssemblyサンプルを比較し、JABBERWOCKが生成したサンプルは実世界のものと類似していると考えている。
以上の結果から,jabberwockは良質なサンプルと悪質なサンプルを区別するため,99\%のf1-scoreで悪意のあるwebサイトを検出できることを示した。
また、JABBERWOCKと既存の悪意のあるウェブサイト検出ツールを組み合わせることで、F1スコアを改善することも確認した。
JABBERWOCKはGitHubから公開されている(https://github.com/c-chocolate/Jabberwock)。
関連論文リスト
- Building Call Graph of WebAssembly Programs via Abstract Semantics [0.24103772239130034]
WebAssemblyは、ポータビリティとパフォーマンスに重点を置いて人気を集めているコードのバイナリフォーマットである。
WebAssemblyのバイナリフォーマットは、悪意のあるソフトウェアの手段として使用される傾向がある。
WebAssemblyのセキュリティ検証、情報フロー制御、より一般的には、行動特性を検証するツールの開発には、かなりの関心がある。
論文 参考訳(メタデータ) (2024-07-08T09:32:47Z) - What All the PHUZZ Is About: A Coverage-guided Fuzzer for Finding Vulnerabilities in PHP Web Applications [5.169724825219126]
本稿では,PHP WebアプリケーションのためのファジングフレームワークPHUZZを紹介する。
PHUZZは、最先端関連の作業よりもクライアントサイドとサーバサイドの脆弱性クラスを検出するために、新しいアプローチを使用している。
私たちは115のWordPressプラグインの1000以上のAPIエンドポイントをファズして、20以上のセキュリティ問題と2つの新しいCVE-IDを生み出しました。
論文 参考訳(メタデータ) (2024-06-10T13:43:07Z) - AutoScraper: A Progressive Understanding Web Agent for Web Scraper Generation [54.17246674188208]
Webスクレイピングは、Webサイトからデータを抽出し、自動データ収集を可能にし、データ分析機能を強化し、手動のデータ入力作業を最小化する強力なテクニックである。
既存の手法では、ラッパーベースの手法は、新しいウェブサイトで直面する場合、適応性とスケーラビリティの制限に悩まされる。
本稿では,大規模言語モデル(LLM)を用いたWebスクレイパー生成のパラダイムを紹介し,多様なWeb環境をより効率的に処理できる2段階フレームワークであるAutoScraperを提案する。
論文 参考訳(メタデータ) (2024-04-19T09:59:44Z) - Large Language Models are Few-shot Generators: Proposing Hybrid Prompt Algorithm To Generate Webshell Escape Samples [1.6223257916285212]
大規模言語モデルの助けを借りてウェブシェルエスケープサンプル生成のためのHybrid Promptアルゴリズムを提案する。
ウェブシェルサンプル生成用に特別に開発されたプロンプトアルゴリズムとして、Hybrid Promptアルゴリズムは、Chain of Thought、Tree of Thoughtなど様々なプロンプトなアイデアを組み合わせただけでなく、ウェブシェル階層モジュールのような様々なコンポーネントも組み込んでいる。
実験結果から,Hybrid Promptアルゴリズムはコード推論能力に優れ,高品質なウェブシェルサンプルを生成することができることがわかった。
論文 参考訳(メタデータ) (2024-02-12T04:59:58Z) - Static Semantics Reconstruction for Enhancing JavaScript-WebAssembly Multilingual Malware Detection [51.15122099046214]
WebAssemblyを使うと、攻撃者は言語間の相互運用でJavaScriptマルウェアの悪意のある機能を隠せる。
JavaScriptとWebAssembly間の複雑な相互運用とセマンティックな多様性のため、JavaScript-WebAssemblyマルチ言語マルウェア(JWMM)の検出は難しい。
本稿では,JWMMの静的検出を高速化する最初の手法であるJWBinderを紹介する。
論文 参考訳(メタデータ) (2023-10-26T10:59:45Z) - Neural Embeddings for Web Testing [49.66745368789056]
既存のクローラは、状態等価性を評価するために、アプリ固有のしきい値ベースのアルゴリズムに依存している。
ニューラルネットワークの埋め込みとしきい値のない分類器に基づく新しい抽象関数WEBEMBEDを提案する。
WEBEMBEDは,9つのWebアプリケーションに対する評価の結果,近距離検出により最先端技術よりも精度が高いことがわかった。
論文 参考訳(メタデータ) (2023-06-12T19:59:36Z) - FBERT: A Neural Transformer for Identifying Offensive Content [67.12838911384024]
fBERTは、SOLIDで再訓練されたBERTモデルである。
複数の英文データセット上での攻撃的内容の同定におけるfBERTの性能を評価し、SOLIDからインスタンスを選択するためのしきい値をテストする。
fBERTモデルは、コミュニティで自由に利用できるようになる。
論文 参考訳(メタデータ) (2021-09-10T19:19:26Z) - Web-based Application for Detecting Indonesian Clickbait Headlines using
IndoBERT [0.0]
この研究では、クラウドサーバー上でモデルをトレーニングするために必要なコンピューティングリソースをオフロードし、クライアント側アプリケーションはAPIにリクエストを送信するだけで、クラウドサーバーは残りの処理を行います。
アプリケーションの使用状況が議論され、平均ROC-BERTの89%のパフォーマンスで一般公開されています。
論文 参考訳(メタデータ) (2021-02-21T13:28:52Z) - Howl: A Deployed, Open-Source Wake Word Detection System [55.785258621737825]
Howlはオープンソースのウェイクワード検出ツールキットで、オープンスピーチデータセットをネイティブにサポートする。
我々は,Firefox Web ブラウザで音声対話を可能にするプラグインである Firefox Voice を運用している。
論文 参考訳(メタデータ) (2020-08-21T17:59:01Z) - DeeBERT: Dynamic Early Exiting for Accelerating BERT Inference [69.93692147242284]
BERTのような大規模事前訓練型言語モデルは、NLPアプリケーションに大幅な改善をもたらした。
本稿では, BERT推論を高速化するために, 単純だが効果的な手法であるDeeBERTを提案する。
実験の結果、DeeBERTはモデル品質の低下を最小限に抑えながら、最大40%の推論時間を節約できることがわかった。
論文 参考訳(メタデータ) (2020-04-27T17:58:05Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。