論文の概要: Leveraging AI to optimize website structure discovery during Penetration
Testing
- arxiv url: http://arxiv.org/abs/2101.07223v1
- Date: Mon, 18 Jan 2021 18:21:42 GMT
- ステータス: 処理完了
- システム内更新日: 2021-03-27 06:02:40.134383
- Title: Leveraging AI to optimize website structure discovery during Penetration
Testing
- Title(参考訳): 浸透テスト中のウェブサイト構造発見を最適化するAIを活用する
- Authors: Diego Antonelli, Roberta Cascella, Gaetano Perrone, Simon Pietro
Romano, Antonio Schiano
- Abstract要約: 人工知能を活用することで、ダイバスティングプロセスを最適化する高度な技術を提案します。
セマンティッククラスタリング技術を使用して、セマンティックの意味に応じて異なるグループ内のワードリスト項目を整理します。
結果は、実施された実験ごとに最大50%のパフォーマンス向上を示しています。
- 参考スコア(独自算出の注目度): 2.2049183478692584
- License: http://creativecommons.org/licenses/by-nc-nd/4.0/
- Abstract: Dirbusting is a technique used to brute force directories and file names on
web servers while monitoring HTTP responses, in order to enumerate server
contents. Such a technique uses lists of common words to discover the hidden
structure of the target website. Dirbusting typically relies on response codes
as discovery conditions to find new pages. It is widely used in web application
penetration testing, an activity that allows companies to detect websites
vulnerabilities. Dirbusting techniques are both time and resource consuming and
innovative approaches have never been explored in this field. We hence propose
an advanced technique to optimize the dirbusting process by leveraging
Artificial Intelligence. More specifically, we use semantic clustering
techniques in order to organize wordlist items in different groups according to
their semantic meaning. The created clusters are used in an ad-hoc implemented
next-word intelligent strategy. This paper demonstrates that the usage of
clustering techniques outperforms the commonly used brute force methods.
Performance is evaluated by testing eight different web applications. Results
show a performance increase that is up to 50% for each of the conducted
experiments.
- Abstract(参考訳): Dirbustingは、サーバの内容を列挙するために、HTTPレスポンスを監視しながら、Webサーバ上のディレクトリとファイル名をブルートするテクニックである。
このような手法は、共通の単語のリストを使用して、ターゲットウェブサイトの隠れた構造を発見する。
dirbustingは通常、新しいページを見つけるための発見条件としてレスポンスコードに依存している。
これは企業がウェブサイトの脆弱性を検知する活動であるWebアプリケーションの浸透テストで広く利用されている。
dirbustingのテクニックは時間とリソースの両方を消費するものであり、この分野で革新的なアプローチが探求されたことはない。
そこで我々は,人工知能を活用し,ディルバスティングプロセスを最適化する高度な手法を提案する。
具体的には、セマンティッククラスタリング手法を用いて、意味的意味に応じて異なるグループで単語リストを整理する。
生成されたクラスタは、アドホックに実装された次のワードインテリジェント戦略で使用される。
本稿では,クラスタリング手法が一般的なブライト力法よりも優れていることを示す。
パフォーマンスは8つの異なるWebアプリケーションをテストすることで評価される。
その結果,各実験で最大50%の性能向上が確認された。
関連論文リスト
- Autoregressive Search Engines: Generating Substrings as Document
Identifiers [53.0729058170278]
自動回帰言語モデルは、回答を生成するデファクト標準として現れています。
これまでの研究は、探索空間を階層構造に分割する方法を探究してきた。
本研究では,検索空間の任意の構造を強制しない代替として,経路内のすべてのngramを識別子として使用することを提案する。
論文 参考訳(メタデータ) (2022-04-22T10:45:01Z) - Enhancing Semantic Code Search with Multimodal Contrastive Learning and
Soft Data Augmentation [50.14232079160476]
コード検索のためのマルチモーダルコントラスト学習とソフトデータ拡張を用いた新しい手法を提案する。
我々は,6つのプログラミング言語を用いた大規模データセットにおけるアプローチの有効性を評価するために,広範囲な実験を行った。
論文 参考訳(メタデータ) (2022-04-07T08:49:27Z) - On the Efficiency of Integrating Self-supervised Learning and
Meta-learning for User-defined Few-shot Keyword Spotting [51.41426141283203]
ユーザ定義キーワードスポッティングは、ユーザが定義する新しい音声用語を検出するタスクである。
これまでの研究は、自己教師付き学習モデルを取り入れたり、メタ学習アルゴリズムを適用しようとするものだった。
この結果から,HuBERTとMatching Networkを組み合わせることで,最適な結果が得られることがわかった。
論文 参考訳(メタデータ) (2022-04-01T10:59:39Z) - Tree-based Focused Web Crawling with Reinforcement Learning [0.2624902795082451]
集中型クローラは、ターゲットトピックに関連するWebページを可能な限り多く発見することを目的としており、無関係なページは避けている。
集中型クローリングのためのエンドツーエンドのRL駆動フレームワークであるTRESを提案する。
TRESは収穫率を少なくとも58%上回り、ドメイン内では競争力のある結果が得られている。
論文 参考訳(メタデータ) (2021-12-12T00:19:47Z) - Predicting Process Name from Network Data [0.0]
本稿では,トラフィックを発生させるアプリケーションを予測するために,Netflowのような機能を利用する機械学習技術について報告する。
実験では,大規模企業環境に展開したホスト型センサから得られた地中構造ラベルを用いて実験を行った。
機械学習モデルが、ネットフローのような特徴のみを分類の基盤として、どのように高い分類精度を達成するかを実証する。
論文 参考訳(メタデータ) (2021-09-03T20:15:34Z) - A Technical Survey and Evaluation of Traditional Point Cloud Clustering
Methods for LiDAR Panoptic Segmentation [11.138159123596669]
LiDARのパノプティカルセグメンテーションは、自動運転のための新しい技術課題である。
既存のセマンティックセグメンテーションネットワークを用いたハイブリッド手法を提案し,セマンティック情報を抽出する。
パン光学セグメンテーションリーダーボード上で、すべてのエンドツーエンドディープラーニングソリューションの中で、最先端のパフォーマンスを示す。
論文 参考訳(メタデータ) (2021-08-21T14:59:02Z) - Unsupervised Domain-adaptive Hash for Networks [81.49184987430333]
ドメイン適応型ハッシュ学習はコンピュータビジョンコミュニティでかなりの成功を収めた。
UDAHと呼ばれるネットワークのための教師なしドメイン適応型ハッシュ学習手法を開発した。
論文 参考訳(メタデータ) (2021-08-20T12:09:38Z) - Classification of Consumer Belief Statements From Social Media [1.4586106862913546]
複雑な専門家アノテーションがいかにして分類に有効に活用できるかを考察する。
自動クラス抽象化アプローチは、テキスト分類タスクのドメインエキスパートベースラインに対して極めてよく機能することがわかった。
論文 参考訳(メタデータ) (2021-06-29T15:25:33Z) - TEACHTEXT: CrossModal Generalized Distillation for Text-Video Retrieval [103.85002875155551]
本研究では,大規模言語前訓練を利用した一般化蒸留法TeachTextを提案する。
提案手法をビデオ側モダリティに拡張し,テスト時に使用するモダリティの数を効果的に削減できることを示す。
提案手法は,いくつかのビデオ検索ベンチマークの精度を著しく向上させ,テスト時の計算オーバーヘッドを増加させない。
論文 参考訳(メタデータ) (2021-04-16T17:55:28Z) - A Meta-embedding-based Ensemble Approach for ICD Coding Prediction [64.42386426730695]
国際疾病分類 (icd) は、世界中で臨床コーディングに使われているデファクトコードである。
これらのコードにより、医療提供者は償還を請求し、診断情報の効率的な保管と検索を容易にします。
提案手法は,日常的な医学データと科学論文の外部知識を用いて,効果的に単語ベクトルを訓練することにより,神経モデルの性能を高める。
論文 参考訳(メタデータ) (2021-02-26T17:49:58Z) - Unsupervised Key-phrase Extraction and Clustering for Classification
Scheme in Scientific Publications [0.0]
本稿では,システムマッピング (SM) とシステムレビュー (SR) プロセスの自動化の可能性について検討する。
キーフレーズは教師なしの方法で科学文書から抽出され、対応する分類体系を構築するために使用される。
また、クラスタリングを使って関連するキーフレーズをグループ化する方法についても検討する。
論文 参考訳(メタデータ) (2021-01-25T10:17:33Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。