論文の概要: A machine learning approach for detecting CNAME cloaking-based tracking
on the Web
- arxiv url: http://arxiv.org/abs/2009.14330v1
- Date: Tue, 29 Sep 2020 22:33:19 GMT
- ステータス: 処理完了
- システム内更新日: 2023-04-30 16:12:26.551772
- Title: A machine learning approach for detecting CNAME cloaking-based tracking
on the Web
- Title(参考訳): Web上でのCNAMEクローキングに基づくトラッキング検出のための機械学習手法
- Authors: Ha Dao, Kensuke Fukuda
- Abstract要約: オンデマンドDNSルックアップAPIを使わずに,マシンクローキングに基づくトラッキングを検出するための教師付き学習ベース手法を提案する。
私たちの目標は、クローキング関連のトラッキングに関連するサイトとリクエストの両方を検出することです。
評価の結果,提案手法はよく知られた追跡フィルタよりも優れていることがわかった。
- 参考スコア(独自算出の注目度): 2.7267622401439255
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Various in-browser privacy protection techniques have been designed to
protect end-users from third-party tracking. In an arms race against these
counter-measures, the tracking providers developed a new technique called CNAME
cloaking based tracking to avoid issues with browsers that block third-party
cookies and requests. To detect this tracking technique, browser extensions
require on-demand DNS lookup APIs. This feature is however only supported by
the Firefox browser.
In this paper, we propose a supervised machine learning-based method to
detect CNAME cloaking-based tracking without the on-demand DNS lookup. Our goal
is to detect both sites and requests linked to CNAME cloaking-related tracking.
We crawl a list of target sites and store all HTTP/HTTPS requests with their
attributes. Then we label all instances automatically by looking up CNAME
record of subdomain, and applying wildcard matching based on well-known
tracking filter lists. After extracting features, we build a supervised
classification model to distinguish site and request related to CNAME
cloaking-based tracking. Our evaluation shows that the proposed approach
outperforms well-known tracking filter lists: F1 scores of 0.790 for sites and
0.885 for requests. By analyzing the feature permutation importance, we
demonstrate that the number of scripts and the proportion of XMLHttpRequests
are discriminative for detecting sites, and the length of URL request is
helpful in detecting requests. Finally, we analyze concept drift by using the
2018 dataset to train a model and obtain a reasonable performance on the 2020
dataset for detecting both sites and requests using CNAME cloaking-based
tracking.
- Abstract(参考訳): ブラウザ内プライバシー保護技術は、エンドユーザをサードパーティのトラッキングから保護するために設計されている。
これらの対策との戦いにおいて、トラッキングプロバイダは、サードパーティのクッキーやリクエストをブロックするブラウザの問題を回避するために、cname cloaking based trackingと呼ばれる新しいテクニックを開発した。
このトラッキングテクニックを検出するために、ブラウザ拡張機能はオンデマンドDNSルックアップAPIを必要とする。
ただしこの機能はfirefoxブラウザでのみサポートされている。
本稿では,オンデマンドのDNS検索を使わずに,CNAMEクローキングに基づくトラッキングを検出するための教師付き機械学習手法を提案する。
我々の目標は、CNAMEのクローキング関連トラッキングに関連するサイトとリクエストの両方を検出することです。
ターゲットサイトのリストをクロールして、すべてのHTTP/HTTPSリクエストを属性で保存します。
次に、サブドメインのCNAMEレコードを調べ、よく知られた追跡フィルタリストに基づいてワイルドカードマッチングを適用することで、すべてのインスタンスを自動的にラベル付けする。
特徴を抽出した後、我々はCNAMEクローキングに基づくトラッキングに関連するサイトと要求を識別する教師付き分類モデルを構築した。
提案手法は,f1スコアが0.790点,リクエスト0.885点という,よく知られた追跡フィルタリストを上回っている。
特徴の置換の重要性を分析することで,xmlhttprequestsのスクリプト数と比率がサイト検出に差別的であり,urlリクエストの長さがリクエスト検出に有用であることを実証する。
最後に,2018 年のデータセットを用いてモデルのトレーニングを行い,2020 年のデータセット上で cname クローキングベースのトラッキングを用いて,サイトとリクエストの両方を検出する合理的なパフォーマンスを得ることにより,概念ドリフトを分析する。
関連論文リスト
- Beyond the Request: Harnessing HTTP Response Headers for Cross-Browser
Web Tracker Classification in an Imbalanced Setting [0.0]
本研究は,HTTP/S応答ヘッダを用いたWebトラッカ検出のための効果的な機械学習分類器の設計の試みである。
11の教師付きモデルがChromeデータでトレーニングされ、すべてのブラウザでテストされた。
結果は、ChromeとFirefoxで高い精度、F1スコア、精度、リコール、最小ログロスエラーを示した。
論文 参考訳(メタデータ) (2024-02-02T09:07:09Z) - PURL: Safe and Effective Sanitization of Link Decoration [20.03929841111819]
PURLは、Webページ実行の層間グラフ表現を利用して、リンクの装飾を安全かつ効果的に衛生化する機械学習手法である。
評価の結果,PURLは既存の対策よりも精度が高く,ウェブサイトの破損を低減できることがわかった。
論文 参考訳(メタデータ) (2023-08-07T09:08:39Z) - OmniTracker: Unifying Object Tracking by Tracking-with-Detection [119.51012668709502]
OmniTrackerは、完全に共有されたネットワークアーキテクチャ、モデルウェイト、推論パイプラインですべてのトラッキングタスクを解決するために提供されている。
LaSOT、TrackingNet、DAVIS16-17、MOT17、MOTS20、YTVIS19を含む7つの追跡データセットの実験は、OmniTrackerがタスク固有の追跡モデルと統合された追跡モデルの両方よりも、オンパーまたはそれ以上の結果を達成することを示した。
論文 参考訳(メタデータ) (2023-03-21T17:59:57Z) - Real-time Online Multi-Object Tracking in Compressed Domain [66.40326768209]
近年,Multi-Object Tracking (MOT) 手法が望まれるトラッキング性能を実現している。
隣接するフレームが極めて関連性が高く冗長であるという事実に着想を得て、フレームをキーフレームと非キーフレームに分割する。
私たちのトラッカーは、同等のトラッカー性能を維持しながら、約6倍高速です。
論文 参考訳(メタデータ) (2022-04-05T09:47:24Z) - PhishMatch: A Layered Approach for Effective Detection of Phishing URLs [8.658596218544774]
We present a layered anti-phishing defense, PhishMatch, which is robust, accurate, expensive, and client-side。
Chromeブラウザ用に開発されたPhishMatchのプロトタイププラグインは、高速で軽量であることが判明した。
論文 参考訳(メタデータ) (2021-12-04T03:21:29Z) - Classification of URL bitstreams using Bag of Bytes [3.2204506933585026]
本稿では,URL文字列から特徴ベクトルを生成するための機械的手法を適用する。
従来のDL法に比べて精度が23%向上した。
論文 参考訳(メタデータ) (2021-11-11T07:43:45Z) - Masked LARk: Masked Learning, Aggregation and Reporting worKflow [6.484847460164177]
多くのWeb広告データフローは、ユーザの受動的クロスサイト追跡を含む。
ほとんどのブラウザは、その後のブラウザイテレーションで3PCの削除に向かっている。
本稿では,ユーザエンゲージメント測定とモデルトレーニングの集約を目的としたMasked LARkという新しい提案を提案する。
論文 参考訳(メタデータ) (2021-10-27T21:59:37Z) - Tracking by Joint Local and Global Search: A Target-aware Attention
based Approach [63.50045332644818]
本研究では、ロバストな追跡のための局所的・グローバルな共同探索を行うための新たな目標認識型アテンション機構(TANet)を提案する。
具体的には、ターゲットオブジェクトパッチと連続ビデオフレームの特徴を抽出し、それらをデコーダネットワークに追従して、ターゲットを意識したグローバルアテンションマップを生成する。
追跡手順において、ロバストな追跡のための候補探索領域を探索することにより、ターゲット認識の注意を複数のトラッカーと統合する。
論文 参考訳(メタデータ) (2021-06-09T06:54:15Z) - Track to Detect and Segment: An Online Multi-Object Tracker [81.15608245513208]
TraDeSは、エンドツーエンドの検出を支援するために追跡の手がかりを利用するオンライン共同検出および追跡モデルです。
TraDeSは、以前のオブジェクトの機能を伝播するために使用されるコストボリュームでオブジェクト追跡オフセットを推測します。
論文 参考訳(メタデータ) (2021-03-16T02:34:06Z) - Chained-Tracker: Chaining Paired Attentive Regression Results for
End-to-End Joint Multiple-Object Detection and Tracking [102.31092931373232]
そこで我々は,3つのサブタスク全てをエンド・ツー・エンドのソリューションに統合する簡単なオンラインモデルである Chained-Tracker (CTracker) を提案する。
鎖状構造と対の注意的回帰という2つの大きな特徴は、CTrackerをシンプルに、速く、効果的にする。
論文 参考訳(メタデータ) (2020-07-29T02:38:49Z) - Tracking by Instance Detection: A Meta-Learning Approach [99.66119903655711]
本稿では,高性能トラッカー構築のための3段階の原理的手法を提案する。
我々は2つの現代的な検出器であるRetinaNetとFCOSをベースに、Retina-MAMLとFCOS-MAMLという2つのトラッカーを構築した。
両方のトラッカーは40FPSでリアルタイムに動作します。
論文 参考訳(メタデータ) (2020-04-02T05:55:06Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。