論文の概要: Shy Guys: A Light-Weight Approach to Detecting Robots on Websites
- arxiv url: http://arxiv.org/abs/2603.28546v1
- Date: Mon, 30 Mar 2026 15:07:00 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-03-31 23:18:45.46485
- Title: Shy Guys: A Light-Weight Approach to Detecting Robots on Websites
- Title(参考訳): Shy Guys: ウェブサイト上でロボットを検知する軽量なアプローチ
- Authors: Rémi Van Boxem, Tom Barbette, Cristel Pelsser, Ramin Sadre,
- Abstract要約: 本稿では,クライアント側のインタラクションを伴わない標準的なWebサーバログ上でのみ動作する,軽量でパッシブなボット検出手法を提案する。
世界中にホストされているウェブサイトから収集された54,945個のユニークなユーザエージェント文字列を含む460万件以上のリクエストに対して,本手法の評価を行った。
提案手法は, 偽陽性率3%を維持しながら, ボットトラフィックの67.7%を検知し, 美術品の状態を20%以下に向上させる。
- 参考スコア(独自算出の注目度): 1.5036109852211983
- License: http://creativecommons.org/licenses/by-nc-sa/4.0/
- Abstract: Automated bots now account for roughly half of all web requests, and an increasing number deliberately spoof their identity to either evade detection or to not respect robots.txt. Existing countermeasures are either resource-intensive (JavaScript challenges, CAPTCHAs), cost-prohibitive (commercial solutions), or degrade the user experience. This paper proposes a lightweight, passive approach to bot detection that combines user-agent string analysis with favicon-based heuristics, operating entirely on standard web server logs with no client-side interaction. We evaluate the method on over 4.6 million requests containing 54,945 unique user-agent strings collected from website hosted all around the earth. Our approach detects 67.7% of bot traffic while maintaining a false-positive rate of 3%, outperforming state of the art (less than 20%). This method can serve as a first line of defence, routing only genuinely ambiguous requests to active challenges and preserving the experience of legitimate users.
- Abstract(参考訳): 自動化されたボットは今やWebリクエストの約半分を占めており、検出を避けるか、ロボット.txtを尊重しないよう意図的に自身のアイデンティティを偽造している。
既存の対策としては、リソース集約(JavaScriptチャレンジ、CAPTCHA)、コスト抑制(商用ソリューション)、ユーザエクスペリエンスの低下などがある。
本稿では,ユーザエージェント文字列解析とファビコンに基づくヒューリスティックスを組み合わせた,軽量で受動的なボット検出手法を提案する。
世界中にホストされているウェブサイトから収集された54,945個のユニークなユーザエージェント文字列を含む460万件以上のリクエストに対して,本手法の評価を行った。
われわれの手法は、偽陽性率3%を維持しながら、67.7%のボットトラフィックを検出し、最先端(20%未満)を上回っている。
この方法は、防御の第一線として機能し、真にあいまいな要求のみをアクティブな課題にルーティングし、正当なユーザ体験を維持する。
関連論文リスト
- Software Testing at the Network Layer: Automated HTTP API Quality Assessment and Security Analysis of Production Web Applications [1.9537983097153042]
我々は18のプロダクションWebサイトの完全なHTTPトラフィックをキャプチャして分析する自動ソフトウェアテスティングフレームワークを提案する。
最小主義のサーバーレンダリングサイトは100点、コンテンツの多い商用サイトは56.8点のスコアを得た。
冗長なAPI呼び出しと欠落するキャッシュヘッダを、最も普及している2つのアンチパターンとして識別し、それぞれが67%のサイトに影響を与える。
論文 参考訳(メタデータ) (2026-02-09T03:39:45Z) - It's a TRAP! Task-Redirecting Agent Persuasion Benchmark for Web Agents [52.81924177620322]
大規模な言語モデルを利用したWebベースのエージェントは、メール管理やプロフェッショナルネットワーキングといったタスクにますます利用されている。
動的Webコンテンツへの依存は、インジェクション攻撃の引き金に弱い: インターフェース要素に隠された敵対的命令は、エージェントが元のタスクから逸脱するように説得する。
本稿では,タスクリダイレクトエージェントの説得ベンチマーク(TRAP)について紹介する。
論文 参考訳(メタデータ) (2025-12-29T01:09:10Z) - BrowserArena: Evaluating LLM Agents on Real-World Web Navigation Tasks [51.803138848305814]
我々はBrowserArenaを紹介した。BrowserArenaは、ユーザから送信されたタスクを収集するオープンソースのエージェント評価プラットフォームである。
Captcha解決、ポップアップバナー削除、URLへのダイレクトナビゲーションの3つの一貫した障害モードを特定します。
本研究は,Webエージェントの多様性と脆性の両方を明らかにする。
論文 参考訳(メタデータ) (2025-10-02T15:22:21Z) - Characterizing Phishing Pages by JavaScript Capabilities [77.64740286751834]
本論文は,フィッシングページのグループを自動的に識別し,研究者やアナリストを支援することを目的としている。
キット検出の精度は,4,562個のフィッシングURLに展開した548個のキット群に対して97%であった。
UIの対話性と基本的なフィンガープリントは、クラスタの90%と80%に存在する普遍的なテクニックであることが分かりました。
論文 参考訳(メタデータ) (2025-09-16T15:39:23Z) - BountyBench: Dollar Impact of AI Agent Attackers and Defenders on Real-World Cybersecurity Systems [62.17474934536671]
我々は、現実世界のシステムを進化させる際に、攻撃的かつ防御的なサイバー能力を捕獲する最初の枠組みを紹介する。
脆弱性ライフサイクルを捉えるために、3つのタスクタイプを定義します。検出(新たな脆弱性の検出)、エクスプロイト(特定の脆弱性の探索)、パッチ(特定の脆弱性のパッチ)。
Claude Code,OpenAI Codex CLI with o3-high and o4-mini,カスタムエージェント with o3-high, GPT-4.1, Gemini 2.5 Pro Preview, Claude 3.7 Sonnet Thinking, DeepSeek-R1。
論文 参考訳(メタデータ) (2025-05-21T07:44:52Z) - BOTracle: A framework for Discriminating Bots and Humans [5.3248028128815434]
ボットはインターネットトラフィックの重要な部分を占め、複数のドメインにまたがる様々な問題の原因となっている。
我々は,3つの異なる検出手法を解析することにより,高トラフィックシナリオにおけるボット検出の課題を分析する。
精度、リコール、AUCなどのパフォーマンス指標は98%以上に達し、Botchaを上回っています。
論文 参考訳(メタデータ) (2024-12-03T08:38:30Z) - Dissecting Adversarial Robustness of Multimodal LM Agents [70.2077308846307]
我々は、VisualWebArena上に現実的な脅威モデルを用いて、200の敵タスクと評価スクリプトを手動で作成する。
我々は,クロボックスフロンティアLMを用いた最新のエージェントを,リフレクションやツリーサーチを行うエージェントを含む,壊すことに成功している。
AREを使用して、新しいコンポーネントの追加に伴うロバスト性の変化を厳格に評価しています。
論文 参考訳(メタデータ) (2024-06-18T17:32:48Z) - My Brother Helps Me: Node Injection Based Adversarial Attack on Social Bot Detection [69.99192868521564]
Twitterのようなソーシャルプラットフォームは、数多くの不正なユーザーから包囲されている。
ソーシャルネットワークの構造のため、ほとんどの手法は攻撃を受けやすいグラフニューラルネットワーク(GNN)に基づいている。
本稿では,ボット検出モデルを欺いたノードインジェクションに基づく逆攻撃手法を提案する。
論文 参考訳(メタデータ) (2023-10-11T03:09:48Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。