論文の概要: Large Language Models are Few-shot Generators: Proposing Hybrid Prompt
Algorithm To Generate Webshell Escape Samples
- arxiv url: http://arxiv.org/abs/2402.07408v1
- Date: Mon, 12 Feb 2024 04:59:58 GMT
- ステータス: 処理完了
- システム内更新日: 2024-02-13 15:29:12.155966
- Title: Large Language Models are Few-shot Generators: Proposing Hybrid Prompt
Algorithm To Generate Webshell Escape Samples
- Title(参考訳): 大規模言語モデル:Webshellのエスケープサンプルを生成するハイブリッドプロンプトアルゴリズムの提案
- Authors: Mingrui Ma, Lansheng Han, Chunjie Zhou
- Abstract要約: 大規模言語モデルの助けを借りてウェブシェルエスケープサンプル生成のためのHybrid Promptアルゴリズムを提案する。
実験結果から,Hybrid Promptアルゴリズムはコード推論能力に優れ,高品質なウェブシェルサンプルを生成することができることがわかった。
- 参考スコア(独自算出の注目度): 1.8233316086214963
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: The frequent occurrence of cyber-attacks has made webshell attacks and
defense gradually become a research hotspot in the field of network security.
However, the lack of publicly available benchmark datasets and the
over-reliance on manually defined rules for webshell escape sample generation
have slowed down the progress of research related to webshell escape sample
generation strategies and artificial intelligence-based webshell detection
algorithms. To address the drawbacks of weak webshell sample escape
capabilities, the lack of webshell datasets with complex malicious features,
and to promote the development of webshell detection technology, we propose the
Hybrid Prompt algorithm for webshell escape sample generation with the help of
large language models. As a prompt algorithm specifically developed for
webshell sample generation, the Hybrid Prompt algorithm not only combines
various prompt ideas including Chain of Thought, Tree of Thought, but also
incorporates various components such as webshell hierarchical module and
few-shot example to facilitate the LLM in learning and reasoning webshell
escape strategies. Experimental results show that the Hybrid Prompt algorithm
can work with multiple LLMs with excellent code reasoning ability to generate
high-quality webshell samples with high Escape Rate (88.61% with GPT-4 model on
VIRUSTOTAL detection engine) and Survival Rate (54.98% with GPT-4 model).
- Abstract(参考訳): サイバー攻撃の頻発により、webshell攻撃と防御は徐々にネットワークセキュリティの分野で研究のホットスポットとなっている。
しかしながら、公開されているベンチマークデータセットの欠如と、webshellエスケープサンプル生成の手動定義ルールへの過度な依存により、webshellエスケープサンプル生成戦略と人工知能ベースのwebshell検出アルゴリズムに関する研究の進展が鈍化している。
弱いウェブシェルサンプルエスケープ機能,複雑な悪意のある特徴を持つウェブシェルデータセットの欠如,およびWebシェル検出技術の開発を促進するために,大規模言語モデルの助けを借りてウェブシェルサンプル生成のためのHybrid Promptアルゴリズムを提案する。
webshellサンプル生成用に特別に開発されたプロンプトアルゴリズムとして、ハイブリッドプロンプトアルゴリズムは、思考連鎖、思考のツリーを含む様々なプロンプトアイデアを結合するだけでなく、webshell階層モジュールや、webshellエスケープ戦略の学習と推論におけるllmの促進のための、少数のサンプルを含む。
実験の結果、ハイブリッドプロンプトアルゴリズムは、高いエスケープ率(gpt-4モデルによる88.61%)と生存率(gpt-4モデルによる54.98%)で高品質なwebshellサンプルを生成するコード推論能力に優れた複数のllmで動作することがわかった。
関連論文リスト
- EnStack: An Ensemble Stacking Framework of Large Language Models for Enhanced Vulnerability Detection in Source Code [1.9374282535132379]
本稿では,自然言語処理(NLP)技術を用いた脆弱性検出を支援する,新たなアンサンブルスタックフレームワークであるEnStackを紹介する。
本手法は,コード理解に特化した複数の事前学習型大規模言語モデル(LLM)を相乗化する。
メタ分類器はそれぞれのLSMの強度を集約し、微妙で複雑な脆弱性を検知する包括的なモデルをもたらす。
論文 参考訳(メタデータ) (2024-11-25T16:47:10Z) - StackSight: Unveiling WebAssembly through Large Language Models and Neurosymbolic Chain-of-Thought Decompilation [2.1094456929188676]
StackSightは静的解析アルゴリズムを通じて仮想スタックの変更を視覚化し、追跡し、チェーン・オブ・シークレット・プロンプトを適用する。
評価結果は、StackSightがWebAssemblyの逆コンパイルを大幅に改善していることを示している。
またユーザ調査では、StackSightが生成したコードスニペットの勝利率が大幅に高く、コードのセマンティクスをよりよく把握できることを示した。
論文 参考訳(メタデータ) (2024-06-07T01:08:17Z) - AutoScraper: A Progressive Understanding Web Agent for Web Scraper Generation [54.17246674188208]
Webスクレイピングは、Webサイトからデータを抽出し、自動データ収集を可能にし、データ分析機能を強化し、手動のデータ入力作業を最小化する強力なテクニックである。
既存の手法では、ラッパーベースの手法は、新しいウェブサイトで直面する場合、適応性とスケーラビリティの制限に悩まされる。
本稿では,大規模言語モデル(LLM)を用いたWebスクレイパー生成のパラダイムを紹介し,多様なWeb環境をより効率的に処理できる2段階フレームワークであるAutoScraperを提案する。
論文 参考訳(メタデータ) (2024-04-19T09:59:44Z) - Limits of Transformer Language Models on Learning to Compose Algorithms [77.2443883991608]
我々は,LLaMAモデルのトレーニングと,複数の個別サブタスクの合成学習を必要とする4つのタスクにおけるGPT-4とGeminiの促進について検討した。
その結果,現在最先端のTransformer言語モデルにおける構成学習は,非常に非効率なサンプルであることが示唆された。
論文 参考訳(メタデータ) (2024-02-08T16:23:29Z) - A Quality-based Syntactic Template Retriever for
Syntactically-controlled Paraphrase Generation [67.98367574025797]
既存の構文制御されたパラフレーズ生成モデルは、人間の注釈付きまたはよく書かれた構文テンプレートで有望に機能する。
禁止コストにより、ソース文ごとに適切なテンプレートを手作業で設計することは不可能になります。
本稿では,QSTR(Quality-based Syntactic Template Retriever)を提案する。
論文 参考訳(メタデータ) (2023-10-20T03:55:39Z) - Detecting Language Model Attacks with Perplexity [0.0]
LLM(Large Language Models)を含む新たなハックが出現し、敵の接尾辞を利用してモデルを騙し、危険な応答を発生させた。
難易度とトークン長を訓練したLight-GBMは偽陽性を解消し、テストセットのほとんどの敵攻撃を正しく検出した。
論文 参考訳(メタデータ) (2023-08-27T15:20:06Z) - Guiding Large Language Models via Directional Stimulus Prompting [114.84930073977672]
我々は,特定の所望の出力に対して,ブラックボックス大言語モデル(LLM)を導くための新しいフレームワークであるDirectional Stimulus Promptingを紹介する。
LLMを直接調整するのではなく、小さな調整可能なポリシーモデルを用いて各入力インスタンスに対して補助的な指向性刺激プロンプトを生成する。
論文 参考訳(メタデータ) (2023-02-22T17:44:15Z) - Chatbots in a Botnet World [0.0]
この研究は、MITRE ATT&CKフレームワークのステージとして一般的に適する13のコーディングタスクを実証している。
実験的なプロンプトは、キーロガー、論理爆弾、難読化ワーム、および支払い満載のランサムウェアの例を生成する。
論文 参考訳(メタデータ) (2022-12-18T16:08:40Z) - Multi-Modal Few-Shot Object Detection with Meta-Learning-Based
Cross-Modal Prompting [77.69172089359606]
本稿では,マルチモーダルな複数ショットオブジェクト検出(FSOD)について,少数ショット視覚例とクラスセマンティック情報の両方を用いて検討する。
我々のアプローチは、(メトリックベース)メタラーニングとプロンプトベースラーニングの高レベルな概念的類似性によって動機付けられている。
提案するマルチモーダルFSODモデルを,複数の複数ショットオブジェクト検出ベンチマークで総合的に評価し,有望な結果を得た。
論文 参考訳(メタデータ) (2022-04-16T16:45:06Z) - A Provably Efficient Sample Collection Strategy for Reinforcement
Learning [123.69175280309226]
オンライン強化学習(RL)における課題の1つは、エージェントがその振る舞いを最適化するために、環境の探索とサンプルの活用をトレードオフする必要があることである。
1) 生成モデル(環境のスパースシミュレータなど)にアクセス可能な状態のサンプル数を規定する「対象別」アルゴリズム,2) 所定のサンプルをできるだけ早く生成する「対象別」サンプル収集。
論文 参考訳(メタデータ) (2020-07-13T15:17:35Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。