Fugu-MT 論文翻訳(概要): Google Tag Manager: Privacy Leaks and Potential Legal Violations

論文の概要: Google Tag Manager: Privacy Leaks and Potential Legal Violations

arxiv url: http://arxiv.org/abs/2312.08806v4
Date: Tue, 12 Nov 2024 14:18:12 GMT
ステータス: 翻訳完了
システム内更新日: 2024-11-28 17:07:30.07807
Title: Google Tag Manager: Privacy Leaks and Potential Legal Violations
Title（参考訳）: Google Tag Manager: プライバシー漏洩と法違反の可能性
Authors: Gilles Mertens, Nataliia Bielova, Vincent Roca, Cristiana Santos,
Abstract要約: Googleは、Google Tag Manager'(GTM)と呼ばれる独自のTMSを開発した。タグを収集するデータのタイプを分析するために,プライバシリークを分離して検出する手法を提案する。我々は、複数の隠れたデータ漏洩、不完全でバラバラな宣言、未公表のサードパーティやクッキー、個人データの共有、同意なしに発見する。
参考スコア（独自算出の注目度）: 4.749824105387293
License: http://creativecommons.org/licenses/by/4.0/
Abstract: Tag Management Systems were developed in order to support website publishers in installing multiple third-party JavaScript scripts (Tags) on their websites. Google developed its own TMS called ``Google Tag Manager'' (GTM) that is currently present on 42\% of the top 1 million most popular websites. However, GTM has not yet been thoroughly evaluated by the academic research community. In this work, we study, for the first time, the Tags provided within the GTM system. We propose a new methodology called ``detecting privacy leaks in isolation'' and apply it to multiple Tags to analyse the types of data that Tags collect and contrast them to the legal and technical documentation, in collaboration with a legal expert. Across three studies - in-depth analysis of 6 Tags, automated analysis of 718 Tags, and analysis of Google ``Consent Mode'' - we discover multiple hidden data leaks, incomplete and diverging declarations, undisclosed third-parties and cookies, personal data sharing without consent and we further identify potential legal violations within EU Data Protection law.
Abstract（参考訳）: タグ管理システムは、ウェブサイトのパブリッシャーが複数のサードパーティのJavaScriptスクリプト(タグ)をウェブサイトにインストールするのをサポートするために開発された。 Googleは‘Google Tag Manager’(GTM)と呼ばれる独自のTMSを開発した。しかし、GTMはまだ学術研究コミュニティによって徹底的に評価されていない。本研究では,GTMシステム内で提供されるタグを初めて研究する。我々は,「分離したプライバシー漏洩を検出する」という新しい手法を提案し,それを複数のタグに適用して,タグが収集するデータの種類を分析し,法的専門家と共同で法的および技術的文書と対比する。 6タグの詳細な分析、718タグの自動分析、Google ‘‘Consent Mode’’の分析の3つの研究で、複数の隠れたデータ漏洩、不完全で分散した宣言、未公表のサードパーティとクッキー、同意なく個人データの共有、EUデータ保護法における潜在的法的違反の発見、などが行われている。

関連論文リスト

You Have Been LaTeXpOsEd: A Systematic Analysis of Information Leakage in Preprint Archives Using Large Language Models [1.0268444449457959]
衛生がなければ、投稿者はオープンソースインテリジェンスを使って敵が収穫できる機密情報を開示することができる。我々は,10万件のarXiv提出資料から1.2TB以上のソースデータを解析し,初版アーカイブの大規模セキュリティ監査を行った。我々は,研究コミュニティとレポジトリオペレーターに,これらの隠れたセキュリティギャップを埋めるために直ちに行動するよう促す。
論文参考訳（メタデータ） (2025-10-04T10:03:17Z)
Can You Trust Your Copilot? A Privacy Scorecard for AI Coding Assistants [0.0]
本稿では、専門家が検証した新しいプライバシースコアカードを紹介し、適用する。この方法論は、法的方針から外部監査までの4種類の文書の詳細な分析を含む。その結果、プライバシー保護の異なる階層が明らかとなり、上位と下位のツールの間に20ポイントのギャップがある。
論文参考訳（メタデータ） (2025-09-22T21:45:45Z)
MAGPIE: A dataset for Multi-AGent contextual PrIvacy Evaluation [54.410825977390274]
LLMエージェントのコンテキストプライバシを評価するための既存のベンチマークは、主にシングルターン、低複雑さタスクを評価する。まず、15ドメインにわたる158のリアルタイムハイテイクシナリオからなるベンチマーク-MAGPIEを示す。次に、コンテキスト的にプライベートなデータに対する理解と、ユーザのプライバシを侵害することなくコラボレーションする能力に基づいて、最先端のLCMを評価します。
論文参考訳（メタデータ） (2025-06-25T18:04:25Z)
LLM4Tag: Automatic Tagging System for Information Retrieval via Large Language Models [32.00181672539555]
大規模言語モデル(LLM)は、多岐にわたる世界知識、意味理解、推論能力のためにタグ付けシステムに適用されている。パフォーマンスは優れていますが、既存のメソッドには制限があります。グラフベースのタグリコールモジュールは、小規模で関連性の高いタグセットを効果的かつ包括的に構築するように設計されている。長期的および短期的な知識注入を伴う正確なタグを生成するために、知識強化タグ生成モジュールが使用される。タグ信頼度スコアを生成するためにタグ信頼度判定モジュールを導入する。
論文参考訳（メタデータ） (2025-02-19T07:10:23Z)
Are LLM-based methods good enough for detecting unfair terms of service? [67.49487557224415]
大規模言語モデル(LLM)は、長いテキストベースの文書を解析するのに適している。プライバシーポリシーの集合に対して個別に適用された12の質問からなるデータセットを構築します。いくつかのオープンソースモデルは、いくつかの商用モデルと比較して高い精度を提供できる。
論文参考訳（メタデータ） (2024-08-24T09:26:59Z)
M4GT-Bench: Evaluation Benchmark for Black-Box Machine-Generated Text Detection [69.41274756177336]
大規模言語モデル (LLMs) は様々なチャネルにまたがる機械生成テキスト (MGT) を前例のない急激な増加をもたらした。このことは、その潜在的な誤用と社会的意味に関する正当な懸念を提起する。本稿では,MGT-M4GT-Benchの多言語,マルチドメイン,マルチジェネレータコーパスに基づく新しいベンチマークを提案する。
論文参考訳（メタデータ） (2024-02-17T02:50:33Z)
Understanding the Process of Data Labeling in Cybersecurity [4.611436679049889]
サイバー脅威検出では、高品質なデータを得るのは難しい。機械学習の特定の応用には、そのようなデータは人間のオペレーターによってラベル付けされなければならない。データラベリングの文脈において,学術研究とセキュリティ実践の橋渡しを行う。
論文参考訳（メタデータ） (2023-11-28T00:20:07Z)
ContraDoc: Understanding Self-Contradictions in Documents with Large Language Models [7.428236410246183]
われわれはContraDocを紹介した。ContraDocは、複数のドメインにまたがる長いドキュメントにおける自己コントラクションを研究する最初の人間アノテーション付きデータセットである。我々は,このデータセット上でGPT3.5, GPT4, PaLM2, LLaMAv2の4つの最先端オープンソースおよび商用LLMの現在の機能を分析する。 GPT4はこのタスクで最高のパフォーマンスを発揮し、人間より優れていますが、信頼できないことや、よりニュアンスとコンテキストを必要とする自己矛盾に苦労していることが分かりました。
論文参考訳（メタデータ） (2023-11-15T18:23:17Z)
What's In My Big Data? [67.04525616289949]
大規模なテキストコーパスの内容を明らかにするためのプラットフォームと16の分析セットであるWIMBD(What's In My Big Data?)を提案する。 WIMBDは2つの基本的な機能 – カウントとサーチ – を大規模に構築することで,標準的な計算ノード上で35テラバイト以上を解析することが可能になります。これらのコーパスについて, 重複, 合成, 品質の低下など, 意外かつ未発表の発見がいくつか見出された。
論文参考訳（メタデータ） (2023-10-31T17:59:38Z)
PolicyGPT: Automated Analysis of Privacy Policies with Large Language Models [41.969546784168905]
実際に使う場合、ユーザーは慎重に読むのではなく、Agreeボタンを直接クリックする傾向がある。このプラクティスは、プライバシーの漏洩や法的問題のリスクにユーザをさらけ出す。近年,ChatGPT や GPT-4 などの大規模言語モデル (LLM) が出現し,テキスト解析の新たな可能性が高まっている。
論文参考訳（メタデータ） (2023-09-19T01:22:42Z)
Stop Uploading Test Data in Plain Text: Practical Strategies for Mitigating Data Contamination by Evaluation Benchmarks [70.39633252935445]
データ汚染は、大規模な自動クロールコーパスで事前訓練されたモデルの台頭によって、普及し、課題となっている。クローズドモデルの場合、トレーニングデータはトレードシークレットになり、オープンモデルであっても汚染を検出するのは簡単ではない。 1)公開するテストデータを公開鍵で暗号化し,デリバティブ配信を許可する,(2)クローズドAPI保持者からの要求トレーニング排他的コントロールを許可する,(2)評価を拒否してテストデータを保護する,(3)インターネット上のソリューションで表示されるデータを避け,インターネット由来のWebページコンテキストを解放する,という3つの方法を提案する。
論文参考訳（メタデータ） (2023-05-17T12:23:38Z)
Micro-video Tagging via Jointly Modeling Social Influence and Tag Relation [56.23157334014773]
85.7%のマイクロビデオにはアノテーションがない。既存の手法は、主にビデオコンテンツの分析、ユーザの社会的影響やタグ関係を無視することに焦点を当てている。構築したヘテロジニアスネットワークにおけるリンク予測問題として,マイクロビデオタギングを定式化する。
論文参考訳（メタデータ） (2023-03-15T02:13:34Z)
Black-box Dataset Ownership Verification via Backdoor Watermarking [67.69308278379957]
我々は、リリースデータセットの保護を、(目立たしい)サードパーティモデルのトレーニングに採用されているかどうかの検証として定式化する。バックドアの透かしを通じて外部パターンを埋め込んでオーナシップの検証を行い,保護することを提案する。具体的には、有毒なバックドア攻撃(例えばBadNets)をデータセットのウォーターマーキングに利用し、データセット検証のための仮説テストガイダンスメソッドを設計する。
論文参考訳（メタデータ） (2022-08-04T05:32:20Z)
MATCH: Metadata-Aware Text Classification in A Large Hierarchy [60.59183151617578]
MATCHはメタデータと階層情報の両方を利用するエンドツーエンドのフレームワークである。親による各子ラベルのパラメータと出力確率を正規化するさまざまな方法を提案します。大規模なラベル階層を持つ2つの大規模なテキストデータセットの実験は、MATCHの有効性を示しています。
論文参考訳（メタデータ） (2021-02-15T05:23:08Z)
Privacy Policies over Time: Curation and Analysis of a Million-Document Dataset [6.060757543617328]
我々は,インターネットアーカイブのWayback Machineからアーカイブされたプライバシーポリシーを発見し,ダウンロードし,抽出するクローラを開発した。私たちは、20年以上にわたって、13万以上の異なるウェブサイトにまたがる、1,071,488の英語のプライバシーポリシーのデータセットをキュレートしました。我々のデータによると、サードパーティーのウェブサイトの自己規制は停滞しており、サードパーティの自己規制は増加しているが、オンライン広告取引団体が支配している。
論文参考訳（メタデータ） (2020-08-20T19:00:37Z)
Method for Customizable Automated Tagging: Addressing the Problem of Over-tagging and Under-tagging Text Documents [0.0]
著者が提供するタグを使用して、新しいドキュメントのタグを予測すると、タグのオーバージェネレーションが発生することが多い。本稿では,大規模文書コーパスに広く適用可能な,普遍的なタグセットを生成する手法を提案する。
論文参考訳（メタデータ） (2020-04-30T18:28:42Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。