論文の概要: A Fine-grained Chinese Software Privacy Policy Dataset for Sequence
Labeling and Regulation Compliant Identification
- arxiv url: http://arxiv.org/abs/2212.04357v1
- Date: Sun, 4 Dec 2022 05:59:59 GMT
- ステータス: 処理完了
- システム内更新日: 2022-12-09 16:07:56.062240
- Title: A Fine-grained Chinese Software Privacy Policy Dataset for Sequence
Labeling and Regulation Compliant Identification
- Title(参考訳): 順序ラベリングと規則に準拠した識別のためのきめ細かい中国のソフトウェアプライバシーポリシーデータセット
- Authors: Kaifa Zhao, Le Yu, Shiyao Zhou, Jing Li, Xiapu Luo, Yat Fei Aemon
Chiu, Yutong Liu
- Abstract要約: 中国初のプライバシポリシデータセットであるCA4P-483を構築し、シークエンスラベリングタスクと規制コンプライアンスの識別を容易にする。
私たちのデータセットには、中国のAndroidアプリケーションプライバシポリシ483、11K以上の文、52Kの細かいアノテーションが含まれています。
- 参考スコア(独自算出の注目度): 23.14031861460124
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Privacy protection raises great attention on both legal levels and user
awareness. To protect user privacy, countries enact laws and regulations
requiring software privacy policies to regulate their behavior. However,
privacy policies are written in natural languages with many legal terms and
software jargon that prevent users from understanding and even reading them. It
is desirable to use NLP techniques to analyze privacy policies for helping
users understand them. Furthermore, existing datasets ignore law requirements
and are limited to English. In this paper, we construct the first Chinese
privacy policy dataset, namely CA4P-483, to facilitate the sequence labeling
tasks and regulation compliance identification between privacy policies and
software. Our dataset includes 483 Chinese Android application privacy
policies, over 11K sentences, and 52K fine-grained annotations. We evaluate
families of robust and representative baseline models on our dataset. Based on
baseline performance, we provide findings and potential research directions on
our dataset. Finally, we investigate the potential applications of CA4P-483
combing regulation requirements and program analysis.
- Abstract(参考訳): プライバシー保護は、法的レベルとユーザーの意識の両方に大きな注目を集める。
ユーザのプライバシを保護するため、国は行動の規制にソフトウェアプライバシポリシーを必要とする法律や規制を制定している。
しかし、プライバシーポリシーは多くの法律用語とソフトウェア用語で自然言語で書かれており、ユーザーがそれを理解したり読むことさえできない。
ユーザの理解を支援するために,NLP技術を用いてプライバシポリシを分析することが望ましい。
さらに、既存のデータセットは法律の要件を無視し、英語に限定されている。
本稿では,プライバシポリシとソフトウェア間のシーケンスラベリング作業と規制コンプライアンスの識別を容易にするために,中国初のプライバシポリシデータセットであるCA4P-483を構築した。
私たちのデータセットには、中国のAndroidアプリケーションプライバシポリシ483、11K以上の文、52Kの細かいアノテーションが含まれています。
データセット上のロバストおよび代表的なベースラインモデルのファミリーを評価します。
ベースラインのパフォーマンスに基づいて、データセットに関する発見と潜在的研究の方向性を提供する。
最後に,CA4P-483を組み込んだ規制要件とプログラム解析の適用可能性について検討した。
関連論文リスト
- Can LLMs Keep a Secret? Testing Privacy Implications of Language Models
via Contextual Integrity Theory [86.8514623654506]
私たちは、最も有能なAIモデルでさえ、人間がそれぞれ39%と57%の確率で、プライベートな情報を公開していることを示しています。
我々の研究は、推論と心の理論に基づいて、新しい推論時プライバシー保護アプローチを即時に探求する必要性を浮き彫りにしている。
論文 参考訳(メタデータ) (2023-10-27T04:15:30Z) - The Saudi Privacy Policy Dataset [0.0]
サウジアラビアの様々なセクターから多様なプライバシーポリシーをまとめて紹介する。
最終データセットには、7つのセクターに属する1,000のウェブサイト、4,638行のテキスト、775,370トークン、コーパスサイズ8,353KBが含まれる。
本稿では、プライバシポリシ分析、自然言語処理、およびプライバシとデータ保護に関連する機械学習アプリケーションについて、さらなる研究と開発を目的としている。
論文 参考訳(メタデータ) (2023-04-05T21:40:37Z) - PLUE: Language Understanding Evaluation Benchmark for Privacy Policies
in English [77.79102359580702]
プライバシポリシ言語理解評価ベンチマークは,プライバシポリシ言語理解を評価するマルチタスクベンチマークである。
また、プライバシポリシの大規模なコーパスを収集し、プライバシポリシドメイン固有の言語モデル事前トレーニングを可能にします。
ドメイン固有の連続的な事前トレーニングは、すべてのタスクでパフォーマンスを改善することを実証します。
論文 参考訳(メタデータ) (2022-12-20T05:58:32Z) - Exploring Consequences of Privacy Policies with Narrative Generation via
Answer Set Programming [0.0]
プライバシポリシの形式化にAnswer Set Programming(ASP)を使用するフレームワークを提案する。
ASP.NETは、エンドユーザがアクターの観点からポリシーの結果を前方にシミュレートすることを可能にする。
本稿では,健康保険の可搬性と説明責任法(Health Insurance Portability and Accountability Act)の事例を通じて,様々な方法でシステムを利用する方法を紹介する。
論文 参考訳(メタデータ) (2022-12-13T16:44:46Z) - Distributed Machine Learning and the Semblance of Trust [66.1227776348216]
フェデレートラーニング(FL)により、データ所有者はデータを共有することなく、データガバナンスを維持し、モデルトレーニングをローカルで行うことができる。
FLと関連する技術は、しばしばプライバシー保護と表現される。
この用語が適切でない理由を説明し、プライバシの形式的定義を念頭に設計されていないプロトコルに対する過度な信頼に関連するリスクを概説する。
論文 参考訳(メタデータ) (2021-12-21T08:44:05Z) - AI-enabled Automation for Completeness Checking of Privacy Policies [7.707284039078785]
ヨーロッパでは、プライバシーポリシーは一般データ保護規則に準拠する。
本稿では,プライバシーポリシーの完全性チェックのためのAIベースの自動化を提案する。
論文 参考訳(メタデータ) (2021-06-10T12:10:51Z) - Detecting Compliance of Privacy Policies with Data Protection Laws [0.0]
プライバシーポリシーは、しばしば理解が難しい広範囲の法的用語で書かれる。
我々は、さまざまなデータ保護法に基づきプライバシーポリシーを分析するフレームワークを提供することで、このギャップを埋めることを目指している。
このようなツールを使用することで、ユーザーは自分の個人データがどのように管理されているかを理解することができます。
論文 参考訳(メタデータ) (2021-02-21T09:15:15Z) - PolicyQA: A Reading Comprehension Dataset for Privacy Policies [77.79102359580702]
既存のWebサイトプライバシポリシ115のコーパスから算出した,25,017の理解スタイルの例を含むデータセットであるPolicyQAを提案する。
既存の2つのニューラルQAモデルを評価し、厳密な分析を行い、ポリシQAが提供する利点と課題を明らかにする。
論文 参考訳(メタデータ) (2020-10-06T09:04:58Z) - Private Reinforcement Learning with PAC and Regret Guarantees [69.4202374491817]
エピソード強化学習(RL)のためのプライバシー保護探索ポリシーを設計する。
まず、共同微分プライバシー(JDP)の概念を用いた有意義なプライバシー定式化を提供する。
そこで我々は,強いPACと後悔境界を同時に達成し,JDP保証を享受する,プライベートな楽観主義に基づく学習アルゴリズムを開発した。
論文 参考訳(メタデータ) (2020-09-18T20:18:35Z) - PGLP: Customizable and Rigorous Location Privacy through Policy Graph [68.3736286350014]
我々はPGLPと呼ばれる新しい位置プライバシーの概念を提案し、カスタマイズ可能で厳格なプライバシー保証を備えたプライベートロケーションをリリースするためのリッチなインターフェースを提供する。
具体的には,ユーザの位置プライバシー要件を,表現的かつカスタマイズ可能なテキスト配置ポリシーグラフを用いて形式化する。
第3に、位置露光の検出、ポリシーグラフの修復、およびカスタマイズ可能な厳格な位置プライバシーを備えたプライベートな軌跡リリースをパイプライン化する、プライベートな位置トレースリリースフレームワークを設計する。
論文 参考訳(メタデータ) (2020-05-04T04:25:59Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。