論文の概要: Counteracting Dark Web Text-Based CAPTCHA with Generative Adversarial
Learning for Proactive Cyber Threat Intelligence
- arxiv url: http://arxiv.org/abs/2201.02799v1
- Date: Sat, 8 Jan 2022 09:53:31 GMT
- ステータス: 処理完了
- システム内更新日: 2022-01-11 16:06:10.639199
- Title: Counteracting Dark Web Text-Based CAPTCHA with Generative Adversarial
Learning for Proactive Cyber Threat Intelligence
- Title(参考訳): アクティブサイバー脅威インテリジェンスのための生成逆学習によるダークウェブテキストベースのCAPTCHA
- Authors: Ning Zhang, Mohammadreza Ebrahimi, Weifeng Li, Hsinchun Chen
- Abstract要約: テキストベースのCAPTCHAは、ダークウェブにおいて最も一般的で禁止されているアンチクローリング対策である。
既存のCAPTCHAの破壊手法は、ダークウェブの課題を克服するのに困難である。
我々は,暗黒ウェブデータ収集を容易にするために,暗黒ウェブCAPTCHAの自動切断のための新しいフレームワークを提案する。
- 参考スコア(独自算出の注目度): 15.71648511138197
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Automated monitoring of dark web (DW) platforms on a large scale is the first
step toward developing proactive Cyber Threat Intelligence (CTI). While there
are efficient methods for collecting data from the surface web, large-scale
dark web data collection is often hindered by anti-crawling measures. In
particular, text-based CAPTCHA serves as the most prevalent and prohibiting
type of these measures in the dark web. Text-based CAPTCHA identifies and
blocks automated crawlers by forcing the user to enter a combination of
hard-to-recognize alphanumeric characters. In the dark web, CAPTCHA images are
meticulously designed with additional background noise and variable character
length to prevent automated CAPTCHA breaking. Existing automated CAPTCHA
breaking methods have difficulties in overcoming these dark web challenges. As
such, solving dark web text-based CAPTCHA has been relying heavily on human
involvement, which is labor-intensive and time-consuming. In this study, we
propose a novel framework for automated breaking of dark web CAPTCHA to
facilitate dark web data collection. This framework encompasses a novel
generative method to recognize dark web text-based CAPTCHA with noisy
background and variable character length. To eliminate the need for human
involvement, the proposed framework utilizes Generative Adversarial Network
(GAN) to counteract dark web background noise and leverages an enhanced
character segmentation algorithm to handle CAPTCHA images with variable
character length. Our proposed framework, DW-GAN, was systematically evaluated
on multiple dark web CAPTCHA testbeds. DW-GAN significantly outperformed the
state-of-the-art benchmark methods on all datasets, achieving over 94.4%
success rate on a carefully collected real-world dark web dataset...
- Abstract(参考訳): ダークウェブ(dw)プラットフォームの大規模な自動監視は、cti(proactive cyber threat intelligence)の開発に向けた第一歩である。
surface webからデータを収集する効率的な方法はあるが、大規模なダークウェブデータ収集は、しばしばアンチクローリング対策によって妨げられる。
特に、テキストベースのCAPTCHAは、ダークウェブにおいて最も一般的で禁止されている手段である。
テキストベースのCAPTCHAは、ユーザーが認識しにくい英数字文字の組み合わせを入力させることで、自動クローラを識別し、ブロックする。
ダークウェブでは、CAPTCHAイメージは、自動CAPTCHA破壊を防止するために、バックグラウンドノイズと可変文字長を追加して慎重に設計されている。
既存のCAPTCHAの破壊手法は、これらのダークウェブの課題を克服するのに困難である。
このように、ダークウェブテキストベースのCAPTCHAの解決は、労働集約的で時間を要する人間の関与に大きく依存している。
本研究では,暗黒ウェブデータ収集を容易にするために,暗黒ウェブCAPTCHAの自動分解のための新しいフレームワークを提案する。
このフレームワークは、暗黒ウェブテキストベースのCAPTCHAをノイズ背景と可変文字長で認識する新しい生成方法を含む。
提案フレームワークは,人的関与をなくすために,GAN(Generative Adversarial Network)を用いて暗黒Webバックグラウンドノイズを対策し,CAPTCHA画像を可変長で処理するための拡張文字分割アルゴリズムを利用する。
提案するフレームワークであるDW-GANは、複数のダークウェブCAPTCHAテストベッド上で体系的に評価された。
DW-GANは、すべてのデータセットで最先端のベンチマーク手法を著しく上回り、注意深く収集された現実世界のダークウェブデータセットで94.4%以上の成功率を達成した。
関連論文リスト
- MASKDROID: Robust Android Malware Detection with Masked Graph Representations [56.09270390096083]
マルウェアを識別する強力な識別能力を持つ強力な検出器MASKDROIDを提案する。
我々は、グラフニューラルネットワークベースのフレームワークにマスキング機構を導入し、MASKDROIDに入力グラフ全体の復元を強制する。
この戦略により、モデルは悪意のあるセマンティクスを理解し、より安定した表現を学習し、敵攻撃に対する堅牢性を高めることができる。
論文 参考訳(メタデータ) (2024-09-29T07:22:47Z) - Unveiling Vulnerability of Self-Attention [61.85150061213987]
事前訓練された言語モデル(PLM)は、マイナーな単語変更に対して脆弱であることが示されている。
本稿では,変圧器を用いたPSMの基本構造,自己注意機構について検討する。
構造的摂動によってSAを効果的に堅牢にする新しい平滑化技術である textitS-Attend を導入する。
論文 参考訳(メタデータ) (2024-02-26T10:31:45Z) - JAMDEC: Unsupervised Authorship Obfuscation using Constrained Decoding
over Small Language Models [53.83273575102087]
著者の難読化に対する教師なし推論時間アプローチを提案する。
本稿では,著者難読化のためのユーザ制御推論時間アルゴリズムであるJAMDECを紹介する。
提案手法は,GPT2-XL などの小型言語モデルに基づいて,オリジナルコンテンツをプロプライエタリな LLM の API に公開するのを防ぐ。
論文 参考訳(メタデータ) (2024-02-13T19:54:29Z) - A Survey of Adversarial CAPTCHAs on its History, Classification and
Generation [69.36242543069123]
本稿では, 逆CAPTCHAの定義を拡張し, 逆CAPTCHAの分類法を提案する。
また, 敵CAPTCHAの防御に使用可能な防御方法も分析し, 敵CAPTCHAに対する潜在的な脅威を示す。
論文 参考訳(メタデータ) (2023-11-22T08:44:58Z) - Diff-CAPTCHA: An Image-based CAPTCHA with Security Enhanced by Denoising
Diffusion Model [2.1551899143698328]
Diff-CAPTCHAは拡散モデルに基づく画像クリック型CAPTCHAスキームである。
本稿では,Faster R-CNNに基づくエンドツーエンドアタックや2段階アタックなど,いくつかの攻撃手法を開発する。
その結果, 拡散モデルによりCAPTCHAの安全性が向上し, 良好なユーザビリティが維持できることが示唆された。
論文 参考訳(メタデータ) (2023-08-16T13:41:29Z) - Vulnerability analysis of captcha using Deep learning [0.0]
本研究ではCAPTCHA生成システムの欠陥と脆弱性について検討する。
これを実現するために、我々は畳み込みニューラルネットワークであるCapNetを開発した。
提案プラットフォームは,数値およびアルファ数値CAPTCHAの両方を評価することができる
論文 参考訳(メタデータ) (2023-02-18T17:45:11Z) - Countering Malicious Content Moderation Evasion in Online Social
Networks: Simulation and Detection of Word Camouflage [64.78260098263489]
ツイストとカモフラージュキーワードは、プラットフォームコンテンツモデレーションシステムを回避する最もよく使われるテクニックである。
本稿では,コンテンツ回避の新たな手法をシミュレートし,検出する多言語ツールを開発することにより,悪意ある情報に対する対処に大きく貢献する。
論文 参考訳(メタデータ) (2022-12-27T16:08:49Z) - Robust Text CAPTCHAs Using Adversarial Examples [129.29523847765952]
Robust Text CAPTCHA (RTC) という,ユーザフレンドリーなテキストベースのCAPTCHA生成法を提案する。
第1段階では、前景と背景はランダムにサンプルされたフォントと背景画像で構成される。
第2段階では、CAPTCHAの解法をより妨害するために、高転送可能な逆攻撃をテキストCAPTCHAに適用する。
論文 参考訳(メタデータ) (2021-01-07T11:03:07Z) - An End-to-End Attack on Text-based CAPTCHAs Based on Cycle-Consistent
Generative Adversarial Network [4.955311532191887]
本稿では,サイクル一貫性のある生成対向ネットワークをベースとした,効率的かつ簡便なエンドツーエンド攻撃手法を提案する。
いくつかの設定パラメータを変更するだけで、一般的なテキストベースのCAPTCHAスキームを攻撃できる。
提案手法は,10のWebサイトが展開するCAPTCHAスキームを効率的に分解する。
論文 参考訳(メタデータ) (2020-08-26T14:57:47Z) - Deep-CAPTCHA: a deep learning based CAPTCHA solver for vulnerability
assessment [1.027974860479791]
本研究では,CAPTCHAジェネレータシステムの弱点と脆弱性について検討する。
この目的を達成するために,Deep-CAPTCHAと呼ばれる畳み込みニューラルネットワークを開発した。
我々のネットワークのクラック精度は、数値およびアルファ数値テストデータセットの98.94%と98.31%のハイレートにつながる。
論文 参考訳(メタデータ) (2020-06-15T11:44:43Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。