論文の概要: Cookiescanner: An Automated Tool for Detecting and Evaluating GDPR
Consent Notices on Websites
- arxiv url: http://arxiv.org/abs/2309.06196v1
- Date: Tue, 12 Sep 2023 13:04:00 GMT
- ステータス: 処理完了
- システム内更新日: 2023-09-13 13:01:26.761905
- Title: Cookiescanner: An Automated Tool for Detecting and Evaluating GDPR
Consent Notices on Websites
- Title(参考訳): Cookiescanner: Webサイト上でGDPR含有通知を検出し評価するための自動化ツール
- Authors: Ralf Gundelach and Dominik Herrmann
- Abstract要約: 本稿では,同意通知を検出し,抽出する自動スキャンツールであるEmphcookiescannerを紹介する。
その結果,手作業によるフィルタリストの精度は高いが,キーワードベースの手法よりも同意度が低いことがわかった。
我々のBERTモデルは、以前の研究と一致しているが、候補抽出が不十分なため、低リコールに苦しむ英語の通知に対して高い精度を達成する。
- 参考スコア(独自算出の注目度): 1.3416250383686867
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: The enforcement of the GDPR led to the widespread adoption of consent
notices, colloquially known as cookie banners. Studies have shown that many
website operators do not comply with the law and track users prior to any
interaction with the consent notice, or attempt to trick users into giving
consent through dark patterns. Previous research has relied on manually curated
filter lists or automated detection methods limited to a subset of websites,
making research on GDPR compliance of consent notices tedious or limited. We
present \emph{cookiescanner}, an automated scanning tool that detects and
extracts consent notices via various methods and checks if they offer a decline
option or use color diversion. We evaluated cookiescanner on a random sample of
the top 10,000 websites listed by Tranco. We found that manually curated filter
lists have the highest precision but recall fewer consent notices than our
keyword-based methods. Our BERT model achieves high precision for English
notices, which is in line with previous work, but suffers from low recall due
to insufficient candidate extraction. While the automated detection of decline
options proved to be challenging due to the dynamic nature of many sites,
detecting instances of different colors of the buttons was successful in most
cases. Besides systematically evaluating our various detection techniques, we
have manually annotated 1,000 websites to provide a ground-truth baseline,
which has not existed previously. Furthermore, we release our code and the
annotated dataset in the interest of reproducibility and repeatability.
- Abstract(参考訳): GDPRの施行により、クッキーバナーとして知られる同意通知が広く採用された。
研究によると、多くのウェブサイトオペレーターは、同意通知と対話する前に法に従わず、ユーザーを追跡したり、ダークパターンを通じてユーザーを騙して同意させようとしている。
従来の研究では、ウェブサイトのサブセットに限られる手作業によるフィルタリストや自動検出手法に頼っていたため、GDPRの同意通知の遵守に関する調査は退屈なものや制限されている。
我々は,様々な手法で同意通知を検出し抽出する自動スキャンツールである \emph{cookiescanner} を提案する。
我々は、trancoがリストしたトップ10,000ウェブサイトのランダムサンプルでcookiescannerを評価した。
手動でキュレートしたフィルタリストが最も精度が高いが、キーワードベースのメソッドよりも同意の通知が少ないことが分かりました。
我々のBERTモデルは、以前の研究と一致しているが、候補抽出が不十分なためリコールの少ない英語の通知に対して高い精度を達成する。
多くのサイトの動的性質のため、自動的に下降オプションを検出することは困難であることが判明したが、ほとんどの場合、異なる色のボタンを検出できた。
様々な検出手法を体系的に評価するのに加えて,これまでに存在しなかった基盤線を提供するために,1000のウェブサイトを手動でアノテートした。
さらに、再現性と再現性を考慮して、コードと注釈付きデータセットをリリースします。
関連論文リスト
- Fingerprinting and Tracing Shadows: The Development and Impact of Browser Fingerprinting on Digital Privacy [55.2480439325792]
ブラウザのフィンガープリントは、クッキーのような従来の方法なしでオンラインでユーザーを特定し、追跡するテクニックとして成長している。
本稿では, 各種指紋認証技術について概説し, 収集データのエントロピーと特異性を解析する。
論文 参考訳(メタデータ) (2024-11-18T20:32:31Z) - Enhanced Review Detection and Recognition: A Platform-Agnostic Approach with Application to Online Commerce [0.46040036610482665]
本稿では,検出・抽出のための機械学習手法を提案する。
トレーニングデータに含まれていないウェブサイトにまたがって使用するために一般化されていることを実証する。
この方法は、ソースに関係なく、レビューの自動検出と評価のためにアプリケーションを駆動することを約束する。
論文 参考訳(メタデータ) (2024-05-09T00:32:22Z) - AVTENet: Audio-Visual Transformer-based Ensemble Network Exploiting
Multiple Experts for Video Deepfake Detection [53.448283629898214]
近年の超現実的なディープフェイクビデオの普及は、オーディオと視覚の偽造の脅威に注意を向けている。
AI生成のフェイクビデオの検出に関するこれまでのほとんどの研究は、視覚的モダリティまたはオーディオ的モダリティのみを使用していた。
音響操作と視覚操作の両方を考慮したAVTENet(Audio-Visual Transformer-based Ensemble Network)フレームワークを提案する。
論文 参考訳(メタデータ) (2023-10-19T19:01:26Z) - Can AI-Generated Text be Reliably Detected? [54.670136179857344]
LLMの規制されていない使用は、盗作、偽ニュースの生成、スパムなど、悪意のある結果をもたらす可能性がある。
最近の研究は、生成されたテキスト出力に存在する特定のモデルシグネチャを使用するか、透かし技術を適用してこの問題に対処しようとしている。
本稿では,これらの検出器は実用シナリオにおいて信頼性が低いことを示す。
論文 参考訳(メタデータ) (2023-03-17T17:53:19Z) - Verifying the Robustness of Automatic Credibility Assessment [50.55687778699995]
入力テキストにおける意味保存的変化がモデルを誤解させる可能性があることを示す。
また、誤情報検出タスクにおける被害者モデルと攻撃方法の両方をテストするベンチマークであるBODEGAについても紹介する。
我々の実験結果によると、現代の大規模言語モデルは、以前のより小さなソリューションよりも攻撃に対して脆弱であることが多い。
論文 参考訳(メタデータ) (2023-03-14T16:11:47Z) - Augmenting Rule-based DNS Censorship Detection at Scale with Machine
Learning [38.00013408742201]
ドメイン名システム(DNS)の検閲は、異なる国で使用される重要なメカニズムである。
本稿では,機械学習(ML)モデルが検出プロセスの合理化にどのように役立つかを検討する。
検閲されていないインスタンスのみに基づいてトレーニングされた教師なしモデルは、既存のプローブが見逃した新しいインスタンスと検閲のバリエーションを特定することができる。
論文 参考訳(メタデータ) (2023-02-03T23:36:30Z) - An End-to-End Set Transformer for User-Level Classification of
Depression and Gambling Disorder [24.776445591293186]
本研究は,ギャンブル中毒とうつ病のユーザレベル分類のためのトランスフォーマーアーキテクチャを提案する。
我々は、特定の個人からソーシャルメディア投稿の集合を処理し、投稿間の相互作用を利用し、ポストレベルでラベルノイズを除去する。
我々のアーキテクチャは、現代の特徴属性法と解釈可能であり、自動データセット作成を可能にします。
論文 参考訳(メタデータ) (2022-07-02T06:40:56Z) - An Adversarial Attack Analysis on Malicious Advertisement URL Detection
Framework [22.259444589459513]
悪意のある広告URLは、サイバー攻撃の源泉であるため、セキュリティ上のリスクをもたらす。
既存の悪意のあるURL検出技術は制限されており、見えない機能やテストデータの一般化を扱うことができる。
本研究では,新しい語彙・ウェブスクラップ機能群を抽出し,機械学習技術を用いて不正広告URL検出システムを構築する。
論文 参考訳(メタデータ) (2022-04-27T20:06:22Z) - Automated detection of dark patterns in cookie banners: how to do it
poorly and why it is hard to do it any other way [7.2834950390171205]
300のニュースサイトのクッキーバナーのデータセットを使用して、正確にそれを行う予測モデルをトレーニングした。
トレーニングされたモデルの正確性は有望ですが、改善の余地はたくさんあります。
我々は、人工知能に暗パターンの自動検出がもたらす学際的課題を詳細に分析する。
論文 参考訳(メタデータ) (2022-04-21T12:10:27Z) - Spotting adversarial samples for speaker verification by neural vocoders [102.1486475058963]
我々は、自動話者検証(ASV)のための敵対サンプルを見つけるために、ニューラルボコーダを採用する。
元の音声と再合成音声のASVスコアの違いは、真正と逆正のサンプルの識別に良い指標であることがわかった。
私たちのコードは、将来的な比較作業のためにオープンソースにされます。
論文 参考訳(メタデータ) (2021-07-01T08:58:16Z) - Detection of Novel Social Bots by Ensembles of Specialized Classifiers [60.63582690037839]
悪意ある俳優は、社会ボットとして知られるアルゴリズムによって部分的に制御される不正なソーシャルメディアアカウントを作成し、誤情報を広め、オンラインでの議論を扇動する。
異なるタイプのボットが、異なる行動特徴によって特徴づけられることを示す。
本稿では,ボットのクラスごとに専門的な分類器を訓練し,それらの決定を最大ルールで組み合わせる,教師付き学習手法を提案する。
論文 参考訳(メタデータ) (2020-06-11T22:59:59Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。