論文の概要: PolicyGapper: Automated Detection of Inconsistencies Between Google Play Data Safety Sections and Privacy Policies Using LLMs
- arxiv url: http://arxiv.org/abs/2604.16128v1
- Date: Fri, 17 Apr 2026 15:02:01 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-04-20 22:00:19.967252
- Title: PolicyGapper: Automated Detection of Inconsistencies Between Google Play Data Safety Sections and Privacy Policies Using LLMs
- Title(参考訳): PolicyGapper: LLMを用いたGoogle Playデータ安全性セクションとプライバシポリシの一貫性の自動検出
- Authors: Luca Ferrari, Billel Habbati, Meriem Guerar, Mariano Ceccato, Luca Verderame,
- Abstract要約: 2022年、GoogleはGoogle Playにデータ安全セクション(DSS)を義務付け、開発者がデータプラクティスを要約することを要求した。
以前の研究では、人気アプリの80%近くが不完全あるいは誤解を招くDSS宣言を含んでいることが示されている。
本稿では,DSS開示とプライバシポリシの相違を自動的に検出するLCMベースの手法であるPolicyGapperを提案する。
- 参考スコア(独自算出の注目度): 2.854451361373021
- License: http://creativecommons.org/licenses/by-nc-nd/4.0/
- Abstract: Mobile application developers are required to disclose how they collect, use, and share user data in compliance with privacy regulations. To support transparency, major app marketplaces have introduced standardized disclosure mechanisms. In 2022, Google mandated the Data Safety Section (DSS) on Google Play, requiring developers to summarize their data practices. However, compiling accurate DSS disclosures is challenging, as they must remain consistent with the corresponding privacy policy (PP), and no automated tool currently verifies this alignment. Prior studies indicate that nearly 80% of popular apps contain incomplete or misleading DSS declarations. We present PolicyGapper, an LLM-based methodology for automatically detecting discrepancies between DSS disclosures and privacy policies. PolicyGapper operates in four stages: scraping, pre-processing, analysis, and post-processing, without requiring access to application binaries. We evaluate PolicyGapper on a dataset of 330 top-ranked apps spanning all 33 Google Play categories, collected in Q3 2025. The approach identifies 2,689 omitted disclosures, including 2,040 related to data collection and 649 to data sharing. Manual validation on a stratified 10% subset, repeated across three independent runs, yields an average Precision of 0.75, Recall of 0.77, Accuracy of 0.69, and F1-score of 0.76. To support reproducibility, we release a complete replication package, including the dataset, prompts, source code, and results available at https://github.com/Mobile-IoT-Security-Lab/PolicyGapper and https://doi.org/10.5281/zenodo.19628493.
- Abstract(参考訳): モバイルアプリケーション開発者は、プライバシ規則に従ってユーザデータを収集、使用、共有する方法を開示する必要がある。
透明性をサポートするために、主要なアプリマーケットプレースは、標準化された開示メカニズムを導入した。
2022年、GoogleはGoogle Playにデータ安全セクション(DSS)を義務付け、開発者がデータプラクティスを要約することを要求した。
しかしながら、正確なDSS開示のコンパイルは、対応するプライバシポリシ(PP)と整合性を維持する必要があり、このアライメントを検証する自動化ツールが現在存在しないため、難しい。
以前の研究では、人気アプリの80%近くが不完全あるいは誤解を招くDSS宣言を含んでいることが示されている。
本稿では,DSS開示とプライバシポリシの相違を自動的に検出するLCMベースの手法であるPolicyGapperを提案する。
PolicyGapperは、アプリケーションバイナリへのアクセスを必要とせずに、スクラップ、前処理、分析、後処理の4段階で動作する。
2025年第3四半期に収集された33のGoogle Playカテゴリにまたがる330の上位アプリのデータセット上で、PolicyGapperを評価した。
このアプローチでは,データ収集に関連する2,040件とデータ共有に関する649件を含む,2,689件の省略された開示を識別する。
3つの独立したランで繰り返される成層10%サブセットのマニュアル検証では、平均精度が0.75、リコールが0.77、精度が0.69、F1スコアが0.76である。
再現性をサポートするために、データセット、プロンプト、ソースコード、結果を含む完全なレプリケーションパッケージをhttps://github.com/Mobile-IoT-Security-Lab/PolicyGapperとhttps://doi.org/10.5281/zenodo. 19628493で公開しています。
関連論文リスト
- PrivPRISM: Automatically Detecting Discrepancies Between Google Play Data Safety Declarations and Developer Privacy Policies [8.052271364177988]
自己宣言的な開示は、実際のデータプラクティスについてユーザを非難する、完全なプライバシポリシと矛盾することが多い。
エンコーダとデコーダ言語モデルを組み合わせて,プライバシポリシから詳細なデータプラクティスを抽出し比較する,堅牢なフレームワークであるPrivPRISMを紹介した。
以上の結果から,汎用プライバシポリシの広範な再利用,曖昧/矛盾文の再利用,1億回以上ダウンロードされた著名なアプリの隠れリスクなど,システム上の課題が明らかになった。
論文 参考訳(メタデータ) (2026-03-10T05:33:40Z) - Benchmarking Fraud Detectors on Private Graph Data [70.4654745317714]
現在、多くの種類の不正は、グラフ上で動く自動検出アルゴリズムによって部分的に管理されている。
データ保有者が不正検知器の開発を第三者にアウトソースしようとするシナリオを考察する。
サードパーティは、不正検出をデータ保持者に送信し、これらのアルゴリズムをプライベートデータセットで評価し、その結果を公表する。
本システムに対する現実的なプライバシ攻撃を提案し,評価結果のみに基づいて個人データの匿名化を可能にする。
論文 参考訳(メタデータ) (2025-07-30T03:20:15Z) - Differentially Private Synthetic Data Release for Topics API Outputs [63.79476766779742]
当社では,Google ChromeのPrivacy Sandboxの一部として,1つのPrivacy-Preserving Ads API – Topics APIに注目しています。
実トピックAPIデータの再識別リスク特性と密に一致した、微分プライベートなデータセットを生成する。
これにより、外部の研究者がAPIを詳細に分析し、現実的な大規模データセットの事前および将来の作業の再現が可能になります。
論文 参考訳(メタデータ) (2025-06-30T13:46:57Z) - MAGPIE: A dataset for Multi-AGent contextual PrIvacy Evaluation [54.410825977390274]
LLMエージェントのコンテキストプライバシを評価するための既存のベンチマークは、主にシングルターン、低複雑さタスクを評価する。
まず、15ドメインにわたる158のリアルタイムハイテイクシナリオからなるベンチマーク-MAGPIEを示す。
次に、コンテキスト的にプライベートなデータに対する理解と、ユーザのプライバシを侵害することなくコラボレーションする能力に基づいて、最先端のLCMを評価します。
論文 参考訳(メタデータ) (2025-06-25T18:04:25Z) - RADS-Checker: Measuring Compliance with Right of Access by the Data Subject in Android Markets [5.598268459947247]
一般データ保護規則(RADS)のような最新のデータ保護規則は、個人データにアクセスする権利を確立している。
RADSはユーザーに対して、個人データコントローラから個人情報のコピーを取得する権利を与える。
現在、モバイルアプリケーションでRADSが効果的に実装されているかどうかを体系的に調査する研究は行われていない。
論文 参考訳(メタデータ) (2024-10-16T11:23:26Z) - An In-Depth Investigation of Data Collection in LLM App Ecosystems [24.357971856302576]
OpenAIのGPTアプリエコシステムをケーススタディとして検討する。
我々は,GPTアクションの自然言語仕様を分析し,それらのデータ収集の実践を評価するLLMベースのフレームワークを提案する。
論文 参考訳(メタデータ) (2024-08-23T17:42:06Z) - PolicyGPT: Automated Analysis of Privacy Policies with Large Language
Models [41.969546784168905]
実際に使う場合、ユーザーは慎重に読むのではなく、Agreeボタンを直接クリックする傾向がある。
このプラクティスは、プライバシーの漏洩や法的問題のリスクにユーザをさらけ出す。
近年,ChatGPT や GPT-4 などの大規模言語モデル (LLM) が出現し,テキスト解析の新たな可能性が高まっている。
論文 参考訳(メタデータ) (2023-09-19T01:22:42Z) - ATLAS: Automatically Detecting Discrepancies Between Privacy Policies
and Privacy Labels [2.457872341625575]
自動プライバシラベル解析システム(ATLAS)について紹介する。
ATLASは、モバイルアプリのプライバシーポリシーとプライバシーラベルの相違点を特定する。
平均して、アプリには5.32のコンプライアンス上の問題があることがわかっています。
論文 参考訳(メタデータ) (2023-05-24T05:27:22Z) - Stop Uploading Test Data in Plain Text: Practical Strategies for
Mitigating Data Contamination by Evaluation Benchmarks [70.39633252935445]
データ汚染は、大規模な自動クロールコーパスで事前訓練されたモデルの台頭によって、普及し、課題となっている。
クローズドモデルの場合、トレーニングデータはトレードシークレットになり、オープンモデルであっても汚染を検出するのは簡単ではない。
1)公開するテストデータを公開鍵で暗号化し,デリバティブ配信を許可する,(2)クローズドAPI保持者からの要求トレーニング排他的コントロールを許可する,(2)評価を拒否してテストデータを保護する,(3)インターネット上のソリューションで表示されるデータを避け,インターネット由来のWebページコンテキストを解放する,という3つの方法を提案する。
論文 参考訳(メタデータ) (2023-05-17T12:23:38Z) - No Free Lunch in "Privacy for Free: How does Dataset Condensation Help
Privacy" [75.98836424725437]
データプライバシを保護するために設計された新しい手法は、慎重に精査する必要がある。
プライバシ保護の失敗は検出し難いが,プライバシ保護法を実装したシステムが攻撃された場合,破滅的な結果につながる可能性がある。
論文 参考訳(メタデータ) (2022-09-29T17:50:23Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。