論文の概要: Google Tag Manager: Hidden Data Leaks and its Potential Violations under EU Data Protection Law
- arxiv url: http://arxiv.org/abs/2312.08806v2
- Date: Fri, 22 Dec 2023 13:25:08 GMT
- ステータス: 処理完了
- システム内更新日: 2024-03-18 12:17:07.903272
- Title: Google Tag Manager: Hidden Data Leaks and its Potential Violations under EU Data Protection Law
- Title(参考訳): Google Tag Manager: EUデータ保護法に基づくデータ漏洩とその潜在的な違反
- Authors: Gilles Mertens, Nataliia Bielova, Vincent Roca, Cristiana Santos, Michael Toth,
- Abstract要約: 2012年、GoogleはGoogle Tag Manager(GTM)という独自のTMSを開発した。
2020年、新しい"Server-side" GTMが導入され、パブリッシャはTagを直接サーバに組み込めるようになった。
本稿では,Google Tag Management (GTM) アーキテクチャの2つのバージョンである Client- and Server-side GTM について検討する。
- 参考スコア(独自算出の注目度): 4.98655176599042
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Tag Management Systems were developed in order to support website publishers in installing multiple third-party JavaScript scripts (Tags) on their websites. In 2012, Google developed its own TMS called "Google Tag Manager" (GTM) that is currently present on 28 million live websites. In 2020, a new "Server-side" GTM was introduced, allowing publishers to include Tags directly on the server. However, neither version of GTM has yet been thoroughly evaluated by the academic research community. In this work, we study, for the first time, the two versions of the Google Tag Management (GTM) architectures: Client- and Server-side GTM. By analyzing these systems with 78 Client-side Tags, 8 Server-side Tags and two Consent Management Platforms (CMPs) from the inside, we discover multiple hidden data leaks, Tags bypassing GTM permission system to inject scripts, and consent enabled by default. With a legal expert, we perform an in-depth legal analysis of GTM and its actors to identify potential legal violations and their liabilities. We provide recommendations and propose numerous improvements for GTM to facilitate legal compliance.
- Abstract(参考訳): タグ管理システムは、ウェブサイトのパブリッシャーが複数のサードパーティのJavaScriptスクリプト(タグ)をウェブサイトにインストールするのをサポートするために開発された。
2012年、GoogleはGoogle Tag Manager(GTM)という独自のTMSを開発した。
2020年、新しい"Server-side" GTMが導入され、パブリッシャはTagを直接サーバに組み込めるようになった。
しかしながら、GTMのどちらのバージョンも学術研究コミュニティによって徹底的に評価されていない。
本稿では,Google Tag Management (GTM) アーキテクチャの2つのバージョンである Client- and Server-side GTM について検討する。
78のクライアントサイドタグ,8つのサーバサイドタグ,2つのConsent Management Platform (CMP) を内部から分析することにより,複数の隠れデータリーク,GTMパーミッションシステムをパスしてスクリプトを注入するタグ,デフォルトで有効となる同意などを検出する。
我々は法律の専門家とともに、GTMとそのアクターの詳細な法的分析を行い、潜在的な法的違反とその責任を特定する。
我々は,法的コンプライアンスを容易にするため,GTMの勧告と多数の改善を提案する。
関連論文リスト
- Are LLM-based methods good enough for detecting unfair terms of service? [67.49487557224415]
大規模言語モデル(LLM)は、長いテキストベースの文書を解析するのに適している。
プライバシーポリシーの集合に対して個別に適用された12の質問からなるデータセットを構築します。
いくつかのオープンソースモデルは、いくつかの商用モデルと比較して高い精度を提供できる。
論文 参考訳(メタデータ) (2024-08-24T09:26:59Z) - M4GT-Bench: Evaluation Benchmark for Black-Box Machine-Generated Text Detection [69.41274756177336]
大規模言語モデル (LLMs) は様々なチャネルにまたがる機械生成テキスト (MGT) を前例のない急激な増加をもたらした。
このことは、その潜在的な誤用と社会的意味に関する正当な懸念を提起する。
本稿では,MGT-M4GT-Benchの多言語,マルチドメイン,マルチジェネレータコーパスに基づく新しいベンチマークを提案する。
論文 参考訳(メタデータ) (2024-02-17T02:50:33Z) - Understanding the Process of Data Labeling in Cybersecurity [4.611436679049889]
サイバー脅威検出では、高品質なデータを得るのは難しい。
機械学習の特定の応用には、そのようなデータは人間のオペレーターによってラベル付けされなければならない。
データラベリングの文脈において,学術研究とセキュリティ実践の橋渡しを行う。
論文 参考訳(メタデータ) (2023-11-28T00:20:07Z) - ContraDoc: Understanding Self-Contradictions in Documents with Large Language Models [7.428236410246183]
われわれはContraDocを紹介した。ContraDocは、複数のドメインにまたがる長いドキュメントにおける自己コントラクションを研究する最初の人間アノテーション付きデータセットである。
我々は,このデータセット上でGPT3.5, GPT4, PaLM2, LLaMAv2の4つの最先端オープンソースおよび商用LLMの現在の機能を分析する。
GPT4はこのタスクで最高のパフォーマンスを発揮し、人間より優れていますが、信頼できないことや、よりニュアンスとコンテキストを必要とする自己矛盾に苦労していることが分かりました。
論文 参考訳(メタデータ) (2023-11-15T18:23:17Z) - What's In My Big Data? [67.04525616289949]
大規模なテキストコーパスの内容を明らかにするためのプラットフォームと16の分析セットであるWIMBD(What's In My Big Data?)を提案する。
WIMBDは2つの基本的な機能 – カウントとサーチ – を大規模に構築することで,標準的な計算ノード上で35テラバイト以上を解析することが可能になります。
これらのコーパスについて, 重複, 合成, 品質の低下など, 意外かつ未発表の発見がいくつか見出された。
論文 参考訳(メタデータ) (2023-10-31T17:59:38Z) - PolicyGPT: Automated Analysis of Privacy Policies with Large Language
Models [41.969546784168905]
実際に使う場合、ユーザーは慎重に読むのではなく、Agreeボタンを直接クリックする傾向がある。
このプラクティスは、プライバシーの漏洩や法的問題のリスクにユーザをさらけ出す。
近年,ChatGPT や GPT-4 などの大規模言語モデル (LLM) が出現し,テキスト解析の新たな可能性が高まっている。
論文 参考訳(メタデータ) (2023-09-19T01:22:42Z) - Micro-video Tagging via Jointly Modeling Social Influence and Tag
Relation [56.23157334014773]
85.7%のマイクロビデオにはアノテーションがない。
既存の手法は、主にビデオコンテンツの分析、ユーザの社会的影響やタグ関係を無視することに焦点を当てている。
構築したヘテロジニアスネットワークにおけるリンク予測問題として,マイクロビデオタギングを定式化する。
論文 参考訳(メタデータ) (2023-03-15T02:13:34Z) - Black-box Dataset Ownership Verification via Backdoor Watermarking [67.69308278379957]
我々は、リリースデータセットの保護を、(目立たしい)サードパーティモデルのトレーニングに採用されているかどうかの検証として定式化する。
バックドアの透かしを通じて外部パターンを埋め込んでオーナシップの検証を行い,保護することを提案する。
具体的には、有毒なバックドア攻撃(例えばBadNets)をデータセットのウォーターマーキングに利用し、データセット検証のための仮説テストガイダンスメソッドを設計する。
論文 参考訳(メタデータ) (2022-08-04T05:32:20Z) - MATCH: Metadata-Aware Text Classification in A Large Hierarchy [60.59183151617578]
MATCHはメタデータと階層情報の両方を利用するエンドツーエンドのフレームワークである。
親による各子ラベルのパラメータと出力確率を正規化するさまざまな方法を提案します。
大規模なラベル階層を持つ2つの大規模なテキストデータセットの実験は、MATCHの有効性を示しています。
論文 参考訳(メタデータ) (2021-02-15T05:23:08Z) - Privacy Policies over Time: Curation and Analysis of a Million-Document
Dataset [6.060757543617328]
我々は,インターネットアーカイブのWayback Machineからアーカイブされたプライバシーポリシーを発見し,ダウンロードし,抽出するクローラを開発した。
私たちは、20年以上にわたって、13万以上の異なるウェブサイトにまたがる、1,071,488の英語のプライバシーポリシーのデータセットをキュレートしました。
我々のデータによると、サードパーティーのウェブサイトの自己規制は停滞しており、サードパーティの自己規制は増加しているが、オンライン広告取引団体が支配している。
論文 参考訳(メタデータ) (2020-08-20T19:00:37Z) - Method for Customizable Automated Tagging: Addressing the Problem of
Over-tagging and Under-tagging Text Documents [0.0]
著者が提供するタグを使用して、新しいドキュメントのタグを予測すると、タグのオーバージェネレーションが発生することが多い。
本稿では,大規模文書コーパスに広く適用可能な,普遍的なタグセットを生成する手法を提案する。
論文 参考訳(メタデータ) (2020-04-30T18:28:42Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。