論文の概要: PoliGraph: Automated Privacy Policy Analysis using Knowledge Graphs (Journal Version)
- arxiv url: http://arxiv.org/abs/2210.06746v3
- Date: Thu, 06 Mar 2025 06:47:40 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-03-07 19:22:34.385079
- Title: PoliGraph: Automated Privacy Policy Analysis using Knowledge Graphs (Journal Version)
- Title(参考訳): PoliGraph:知識グラフによるプライバシーポリシー分析の自動化(日報)
- Authors: Hao Cui, Rahmadi Trimananda, Scott Jordan, Athina Markopoulou,
- Abstract要約: 私たちは、初めて、プライバシーポリシーの全文を統合的に閲覧し、分析します。
言語解析を用いてテキストからPoliGraphを自動的に抽出するNLPツールであるPoliGraphを開発した。
評価のために公開データセットを使用することで、PoliGrapherは、過去の最先端よりも40%多いコレクションステートメントを、97%の精度で識別することを示した。
- 参考スコア(独自算出の注目度): 7.10483762466065
- License:
- Abstract: Privacy policies disclose how an organization collects and handles personal information. Recent work has made progress in leveraging natural language processing (NLP) to automate privacy policy analysis and extract data collection statements from different sentences, considered in isolation from each other. In this paper, we view and analyze, for the first time, the entire text of a privacy policy in an integrated way. In terms of methodology: (1) we define PoliGraph, a type of knowledge graph that captures statements in a policy as relations between different parts of the text; and (2) we revisit the notion of ontologies, previously defined in heuristic ways, to capture subsumption relations between terms. We make a clear distinction between local and global ontologies to capture the context of individual policies, application domains, and privacy laws. We develop PoliGrapher, an NLP tool to automatically extract PoliGraph from the text using linguistic analysis. Using a public dataset for evaluation, we show that PoliGrapher identifies 40% more collection statements than prior state-of-the-art, with 97% precision. In terms of applications, PoliGraph enables automated analysis of a corpus of policies and allows us to: (1) reveal common patterns in the texts across different policies, and (2) assess the correctness of the terms as defined within a policy. We also apply PoliGraph to: (3) detect contradictions in a policy, where we show false alarms by prior work, and (4) analyze the consistency of policies and network traffic, where we identify significantly more clear disclosures than prior work. Finally, leveraging the capabilities of the emerging large language models (LLMs), we also present PoliGrapher-LM, a tool that uses LLM prompting instead of NLP linguistic analysis, to extract PoliGraph from the policy text, and we show that it further improves coverage.
- Abstract(参考訳): プライバシポリシは、組織が個人情報を収集し、処理する方法を開示する。
最近の研究は、自然言語処理(NLP)を活用して、プライバシーポリシー分析を自動化し、異なる文からデータ収集ステートメントを抽出し、互いに独立して検討している。
本稿では,プライバシポリシの全テキストを統合的に閲覧し,分析する。
方法論の観点からは,(1)政策における文をテキストの異なる部分間の関係として捉えた知識グラフであるPooliGraphを定義し,(2)以前はヒューリスティックな方法で定義されていたオントロジーの概念を再検討し,用語間の仮定関係を捉える。
我々は、個々のポリシー、アプリケーションドメイン、プライバシ法のコンテキストを捉えるために、ローカルとグローバルのオントロジーを明確に区別する。
言語解析を用いてテキストからPoliGraphを自動的に抽出するNLPツールであるPoliGrapherを開発した。
評価のために公開データセットを使用することで、PoliGrapherは、過去の最先端よりも40%多いコレクションステートメントを、97%の精度で識別することを示した。
アプリケーションの観点からは,PoliGraphはポリシーのコーパスの自動解析を可能にし,(1)異なるポリシーにまたがるテキストの共通パターンを明らかにし,(2)ポリシー内で定義された用語の正確性を評価する。
また、PoliGraphは、政策における矛盾を検知し、事前の作業による誤報を検知し、(4)ポリシーとネットワークトラフィックの整合性を解析し、事前の作業よりも明らかな開示を識別する。
最後に,新たな大規模言語モデル (LLM) の機能を活用し,NLP言語解析の代わりにLPMプロンプトを利用するツールである PoliGrapher-LM を紹介し,ポリシテキストから PoliGraph を抽出し,カバレッジをさらに向上することを示す。
関連論文リスト
- Few-shot Policy (de)composition in Conversational Question Answering [54.259440408606515]
本稿では,大規模言語モデル(LLM)を用いて数ショット設定でポリシーコンプライアンスを検出するニューラルシンボリックフレームワークを提案する。
提案手法は,回答すべきサブクエストを抽出し,文脈情報から真理値を割り当て,与えられたポリシーから論理文の集合を明示的に生成することで,政策コンプライアンスに関する会話に対して健全な理由を示す。
本手法は,PCDおよび会話機械読解ベンチマークであるShARCに適用し,タスク固有の微調整を伴わずに競合性能を示す。
論文 参考訳(メタデータ) (2025-01-20T08:40:15Z) - Privacy Policy Analysis through Prompt Engineering for LLMs [3.059256166047627]
PAPEL (Privacy Policy Analysis through Prompt Engineering for LLMs) は、Large Language Models (LLMs) の力を利用してプライバシーポリシーの分析を自動化するフレームワークである。
これらのポリシーからの情報の抽出、アノテーション、要約を合理化し、追加のモデルトレーニングを必要とせず、アクセシビリティと理解性を高めることを目的としている。
PAPELの有効性を, (i) アノテーションと (ii) 矛盾解析の2つの応用で実証した。
論文 参考訳(メタデータ) (2024-09-23T10:23:31Z) - PolicyLR: A Logic Representation For Privacy Policies [34.73520882451813]
我々は、プライバシポリシーの包括的な機械可読表現を提供する新しいパラダイムであるPolicyLRを提案する。
PolicyLRは、プライバシーポリシーを原子式の評価を用いて機械可読形式に変換する。
ポリシコンプライアンス,一貫性検出,プライバシ比較ショッピングという3つのプライバシタスクにおいて,ポリシLRを実証する。
論文 参考訳(メタデータ) (2024-08-27T07:27:16Z) - {A New Hope}: Contextual Privacy Policies for Mobile Applications and An
Approach Toward Automated Generation [19.578130824867596]
コンテキストプライバシポリシ(CPP)の目的は、プライバシポリシを簡潔なスニペットに断片化し、アプリケーションのグラフィカルユーザインターフェース(GUI)内の対応するコンテキスト内でのみ表示することである。
本稿では,モバイルアプリケーションシナリオでCPPを初めて定式化し,モバイルアプリケーション用のCPPを自動生成するSeePrivacyという新しいマルチモーダルフレームワークを提案する。
人間の評価では、抽出されたプライバシーポリシーセグメントの77%が、検出されたコンテキストと適切に一致していると認識されている。
論文 参考訳(メタデータ) (2024-02-22T13:32:33Z) - PolicyGPT: Automated Analysis of Privacy Policies with Large Language
Models [41.969546784168905]
実際に使う場合、ユーザーは慎重に読むのではなく、Agreeボタンを直接クリックする傾向がある。
このプラクティスは、プライバシーの漏洩や法的問題のリスクにユーザをさらけ出す。
近年,ChatGPT や GPT-4 などの大規模言語モデル (LLM) が出現し,テキスト解析の新たな可能性が高まっている。
論文 参考訳(メタデータ) (2023-09-19T01:22:42Z) - Privacy-Preserving Graph Machine Learning from Data to Computation: A
Survey [67.7834898542701]
我々は,グラフ機械学習のプライバシ保護手法の見直しに重点を置いている。
まずプライバシ保護グラフデータを生成する方法を検討する。
次に,プライバシ保護情報を送信する方法について述べる。
論文 参考訳(メタデータ) (2023-07-10T04:30:23Z) - Goal Representations for Instruction Following: A Semi-Supervised
Language Interface to Control [58.06223121654735]
本稿では,少数の言語データのみを用いて,共同画像と目標条件のポリシーを言語と併用する手法を提案する。
本手法は,言語を目標画像と一致させないラベル付きデータから埋め込みを学習することにより,実世界のロバストな性能を実現する。
ラベル付きデータの外部の言語命令に一般化して,様々な操作タスクをさまざまな場面で追従する命令を示す。
論文 参考訳(メタデータ) (2023-06-30T20:09:39Z) - Natural Language Processing for Policymaking [34.93331735602826]
自然言語処理(NLP)は、テキストをポリシー作成に必要な重要な情報に解析するために計算ツールを使用する。
テキスト分類,トピックモデリング,イベント抽出,テキストスケーリングなど,NLPの一般的な手法を紹介する。
我々はNLPを政策立案に使用する際の潜在的な制限と倫理的懸念を強調した。
論文 参考訳(メタデータ) (2023-02-07T14:34:39Z) - PLUE: Language Understanding Evaluation Benchmark for Privacy Policies
in English [77.79102359580702]
プライバシポリシ言語理解評価ベンチマークは,プライバシポリシ言語理解を評価するマルチタスクベンチマークである。
また、プライバシポリシの大規模なコーパスを収集し、プライバシポリシドメイン固有の言語モデル事前トレーニングを可能にします。
ドメイン固有の連続的な事前トレーニングは、すべてのタスクでパフォーマンスを改善することを実証します。
論文 参考訳(メタデータ) (2022-12-20T05:58:32Z) - Supervised Off-Policy Ranking [145.3039527243585]
オフポリシー評価(OPE)は、他のポリシーによって生成されたデータを活用して、ターゲットポリシーを評価する。
本稿では,訓練方針と既知の実績を正しくランク付けすることで,政策スコアリングモデルを学習する教師付き非政治ランキングを提案する。
本手法は,上位3つのポリシーのうち,最良と最良の双方のランク相関と性能差の両面から,強力なベースラインOPE法より優れる。
論文 参考訳(メタデータ) (2021-07-03T07:01:23Z) - Policy Evaluation Networks [50.53250641051648]
我々は,簡潔な埋め込みにおいて重要なポリシー情報を保持できる,スケーラブルで差別化可能なフィンガープリント機構を導入する。
実験の結果、これらの3つの要素を組み合わせることで、トレーニングデータを生成するものよりも優れたポリシーを作成できることが示された。
論文 参考訳(メタデータ) (2020-02-26T23:00:27Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。