Fugu-MT 論文翻訳(概要): JABBERWOCK: A Tool for WebAssembly Dataset Generation and Its Application to Malicious Website Detection

論文の概要: JABBERWOCK: A Tool for WebAssembly Dataset Generation and Its Application to Malicious Website Detection

arxiv url: http://arxiv.org/abs/2306.05698v1
Date: Fri, 9 Jun 2023 06:35:14 GMT
ステータス: 翻訳完了
システム内更新日: 2023-06-12 14:26:53.226068
Title: JABBERWOCK: A Tool for WebAssembly Dataset Generation and Its Application to Malicious Website Detection
Title（参考訳）: JABBERWOCK:WebAssemblyデータセット生成ツールとその悪意のあるWebサイト検出への応用
Authors: Chika Komiya and Naoto Yanai and Kyosuke Yamashita and Shingo Okamura
Abstract要約: JABBERWOCKは、JavaScript経由で擬似的にWebAssemblyを生成するツールである。 JABBERWOCKは99%のF1スコアで悪意のあるWebサイト検出を可能にする。
参考スコア（独自算出の注目度）: 0.0
License: http://creativecommons.org/licenses/by/4.0/
Abstract: Machine learning is often used for malicious website detection, but an approach incorporating WebAssembly as a feature has not been explored due to a limited number of samples, to the best of our knowledge. In this paper, we propose JABBERWOCK (JAvascript-Based Binary EncodeR by WebAssembly Optimization paCKer), a tool to generate WebAssembly datasets in a pseudo fashion via JavaScript. Loosely speaking, JABBERWOCK automatically gathers JavaScript code in the real world, convert them into WebAssembly, and then outputs vectors of the WebAssembly as samples for malicious website detection. We also conduct experimental evaluations of JABBERWOCK in terms of the processing time for dataset generation, comparison of the generated samples with actual WebAssembly samples gathered from the Internet, and an application for malicious website detection. Regarding the processing time, we show that JABBERWOCK can construct a dataset in 4.5 seconds per sample for any number of samples. Next, comparing 10,000 samples output by JABBERWOCK with 168 gathered WebAssembly samples, we believe that the generated samples by JABBERWOCK are similar to those in the real world. We then show that JABBERWOCK can provide malicious website detection with 99\% F1-score because JABBERWOCK makes a gap between benign and malicious samples as the reason for the above high score. We also confirm that JABBERWOCK can be combined with an existing malicious website detection tool to improve F1-scores. JABBERWOCK is publicly available via GitHub (https://github.com/c-chocolate/Jabberwock).
Abstract（参考訳）: 機械学習は悪質なwebサイト検出によく使用されるが、webassemblyを機能として組み込むアプローチは、限られた数のサンプルのため、私たちの知る限りでは検討されていない。本稿では、javascriptによる擬似的な方法でwebassemblyデータセットを生成するツールであるjabberwock(webassembly optimization packerによるjavascriptベースのバイナリエンコーダ)を提案する。一般的に言うと、JABBERWOCKはJavaScriptコードを実世界で自動的に収集し、WebAssemblyに変換し、悪意のあるWebサイト検出のためのサンプルとしてWebAssemblyのベクターを出力する。また、データセット生成の処理時間、生成したサンプルとインターネットから収集した実際のWebAssemblyサンプルとの比較、悪意のあるWebサイト検出アプリケーションの観点から、JABBERWOCKを実験的に評価する。処理時間については,JABBERWOCKがサンプル数毎に4.5秒でデータセットを構築することができることを示す。次に、JABBERWOCKが出力する1万のサンプルと168個のWebAssemblyサンプルを比較し、JABBERWOCKが生成したサンプルは実世界のものと類似していると考えている。以上の結果から,jabberwockは良質なサンプルと悪質なサンプルを区別するため,99\%のf1-scoreで悪意のあるwebサイトを検出できることを示した。また、JABBERWOCKと既存の悪意のあるウェブサイト検出ツールを組み合わせることで、F1スコアを改善することも確認した。 JABBERWOCKはGitHubから公開されている(https://github.com/c-chocolate/Jabberwock)。

関連論文リスト

PP3D: An In-Browser Vision-Based Defense Against Web Behavior Manipulation Attacks [3.592319760548714]
Webベースの行動操作攻撃(BMA)は、情報収集攻撃(フィッシングなど)やマルウェアの感染など、他の攻撃と比較して調査されていない。我々はPixel Patrol 3D(PP3D)を紹介した。これは、行動操作SE攻撃をリアルタイムで検出、検出、防御する最初のエンドツーエンドブラウザフレームワークである。
論文参考訳（メタデータ） (2025-10-21T09:42:46Z)
Markup Language Modeling for Web Document Understanding [5.207876692210154]
本研究は,ショッピングレビューサイトから詳細な情報を抽出することで,最新の製品データベースを構築することの課題を考察する。異なるサイズのレビューサイトから収集した製品データに基づいてMarkupLMを微調整し、MarkupLM++と呼ばれる変種を開発しました。最終モデルは0.906、リコールは0.724、F1スコアは0.805に達した。
論文参考訳（メタデータ） (2025-09-25T09:25:43Z)
Building Call Graph of WebAssembly Programs via Abstract Semantics [0.24103772239130034]
WebAssemblyは、ポータビリティとパフォーマンスに重点を置いて人気を集めているコードのバイナリフォーマットである。 WebAssemblyのバイナリフォーマットは、悪意のあるソフトウェアの手段として使用される傾向がある。 WebAssemblyのセキュリティ検証、情報フロー制御、より一般的には、行動特性を検証するツールの開発には、かなりの関心がある。
論文参考訳（メタデータ） (2024-07-08T09:32:47Z)
What All the PHUZZ Is About: A Coverage-guided Fuzzer for Finding Vulnerabilities in PHP Web Applications [5.169724825219126]
本稿では,PHP WebアプリケーションのためのファジングフレームワークPHUZZを紹介する。 PHUZZは、最先端関連の作業よりもクライアントサイドとサーバサイドの脆弱性クラスを検出するために、新しいアプローチを使用している。私たちは115のWordPressプラグインの1000以上のAPIエンドポイントをファズして、20以上のセキュリティ問題と2つの新しいCVE-IDを生み出しました。
論文参考訳（メタデータ） (2024-06-10T13:43:07Z)
AutoScraper: A Progressive Understanding Web Agent for Web Scraper Generation [54.17246674188208]
Webスクレイピングは、Webサイトからデータを抽出し、自動データ収集を可能にし、データ分析機能を強化し、手動のデータ入力作業を最小化する強力なテクニックである。既存の手法では、ラッパーベースの手法は、新しいウェブサイトで直面する場合、適応性とスケーラビリティの制限に悩まされる。本稿では,大規模言語モデル(LLM)を用いたWebスクレイパー生成のパラダイムを紹介し,多様なWeb環境をより効率的に処理できる2段階フレームワークであるAutoScraperを提案する。
論文参考訳（メタデータ） (2024-04-19T09:59:44Z)
Large Language Models are Few-shot Generators: Proposing Hybrid Prompt Algorithm To Generate Webshell Escape Samples [1.6223257916285212]
大規模言語モデルの助けを借りてウェブシェルエスケープサンプル生成のためのHybrid Promptアルゴリズムを提案する。ウェブシェルサンプル生成用に特別に開発されたプロンプトアルゴリズムとして、Hybrid Promptアルゴリズムは、Chain of Thought、Tree of Thoughtなど様々なプロンプトなアイデアを組み合わせただけでなく、ウェブシェル階層モジュールのような様々なコンポーネントも組み込んでいる。実験結果から,Hybrid Promptアルゴリズムはコード推論能力に優れ,高品質なウェブシェルサンプルを生成することができることがわかった。
論文参考訳（メタデータ） (2024-02-12T04:59:58Z)
Static Semantics Reconstruction for Enhancing JavaScript-WebAssembly Multilingual Malware Detection [51.15122099046214]
WebAssemblyを使うと、攻撃者は言語間の相互運用でJavaScriptマルウェアの悪意のある機能を隠せる。 JavaScriptとWebAssembly間の複雑な相互運用とセマンティックな多様性のため、JavaScript-WebAssemblyマルチ言語マルウェア(JWMM)の検出は難しい。本稿では,JWMMの静的検出を高速化する最初の手法であるJWBinderを紹介する。
論文参考訳（メタデータ） (2023-10-26T10:59:45Z)
Neural Embeddings for Web Testing [49.66745368789056]
既存のクローラは、状態等価性を評価するために、アプリ固有のしきい値ベースのアルゴリズムに依存している。ニューラルネットワークの埋め込みとしきい値のない分類器に基づく新しい抽象関数WEBEMBEDを提案する。 WEBEMBEDは,9つのWebアプリケーションに対する評価の結果,近距離検出により最先端技術よりも精度が高いことがわかった。
論文参考訳（メタデータ） (2023-06-12T19:59:36Z)
FBERT: A Neural Transformer for Identifying Offensive Content [67.12838911384024]
fBERTは、SOLIDで再訓練されたBERTモデルである。複数の英文データセット上での攻撃的内容の同定におけるfBERTの性能を評価し、SOLIDからインスタンスを選択するためのしきい値をテストする。 fBERTモデルは、コミュニティで自由に利用できるようになる。
論文参考訳（メタデータ） (2021-09-10T19:19:26Z)
Web-based Application for Detecting Indonesian Clickbait Headlines using IndoBERT [0.0]
この研究では、クラウドサーバー上でモデルをトレーニングするために必要なコンピューティングリソースをオフロードし、クライアント側アプリケーションはAPIにリクエストを送信するだけで、クラウドサーバーは残りの処理を行います。アプリケーションの使用状況が議論され、平均ROC-BERTの89%のパフォーマンスで一般公開されています。
論文参考訳（メタデータ） (2021-02-21T13:28:52Z)
Howl: A Deployed, Open-Source Wake Word Detection System [55.785258621737825]
Howlはオープンソースのウェイクワード検出ツールキットで、オープンスピーチデータセットをネイティブにサポートする。我々は,Firefox Web ブラウザで音声対話を可能にするプラグインである Firefox Voice を運用している。
論文参考訳（メタデータ） (2020-08-21T17:59:01Z)
DeeBERT: Dynamic Early Exiting for Accelerating BERT Inference [69.93692147242284]
BERTのような大規模事前訓練型言語モデルは、NLPアプリケーションに大幅な改善をもたらした。本稿では, BERT推論を高速化するために, 単純だが効果的な手法であるDeeBERTを提案する。実験の結果、DeeBERTはモデル品質の低下を最小限に抑えながら、最大40%の推論時間を節約できることがわかった。
論文参考訳（メタデータ） (2020-04-27T17:58:05Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。