論文の概要: EROS: Entity-Driven Controlled Policy Document Summarization
- arxiv url: http://arxiv.org/abs/2403.00141v1
- Date: Thu, 29 Feb 2024 21:44:50 GMT
- ステータス: 処理完了
- システム内更新日: 2024-03-05 18:52:37.689958
- Title: EROS: Entity-Driven Controlled Policy Document Summarization
- Title(参考訳): EROS:Entity-Driven Controled Policy Document Summarization
- Authors: Joykirat Singh, Sehban Fazili, Rohan Jain, Md Shad Akhtar
- Abstract要約: 制御された抽象要約を用いてポリシー文書の解釈可能性と可読性を向上させることを提案する。
プライバシー関連エンティティラベルをマークしたポリシー文書要約データセットであるPD-Sumを開発した。
提案モデルであるEROSは,スパン型エンティティ抽出モデルを用いて重要なエンティティを識別し,それらを用いて要約情報の内容を制御する。
- 参考スコア(独自算出の注目度): 16.661448437719464
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Privacy policy documents have a crucial role in educating individuals about
the collection, usage, and protection of users' personal data by organizations.
However, they are notorious for their lengthy, complex, and convoluted language
especially involving privacy-related entities. Hence, they pose a significant
challenge to users who attempt to comprehend organization's data usage policy.
In this paper, we propose to enhance the interpretability and readability of
policy documents by using controlled abstractive summarization -- we enforce
the generated summaries to include critical privacy-related entities (e.g.,
data and medium) and organization's rationale (e.g.,target and reason) in
collecting those entities. To achieve this, we develop PD-Sum, a
policy-document summarization dataset with marked privacy-related entity
labels. Our proposed model, EROS, identifies critical entities through a
span-based entity extraction model and employs them to control the information
content of the summaries using proximal policy optimization (PPO). Comparison
shows encouraging improvement over various baselines. Furthermore, we furnish
qualitative and human evaluations to establish the efficacy of EROS.
- Abstract(参考訳): プライバシーポリシー文書は、個人に組織によるユーザーの個人情報の収集、使用、保護について教育する上で重要な役割を持つ。
しかし、それらは特にプライバシー関連のエンティティを含む長く、複雑で、複雑な言語で有名である。
したがって、組織のデータ利用ポリシーを理解しようとするユーザにとって、大きな課題となる。
本稿では,管理された抽象要約を用いて,ポリシー文書の解釈性と可読性を向上させることを提案する。我々は生成した要約を,プライバシ関連の重要なエンティティ(データや媒体など)と,それらのエンティティを収集するための組織の根拠(ターゲットや理由など)を含むように強制する。
そこで我々は,プライバシー関連エンティティラベルをマークしたポリシ文書要約データセットPD-Sumを開発した。
提案するモデルであるerosは,スパンベースのエンティティ抽出モデルを用いて重要なエンティティを特定し,ppo(proximal policy optimization)を用いて要約情報の内容を制御する。
比較は、様々な基準よりも改善を奨励している。
さらに,EROSの有効性を確立するために質的評価と人的評価を行う。
関連論文リスト
- Robust Utility-Preserving Text Anonymization Based on Large Language Models [80.5266278002083]
テキストの匿名化は、プライバシーを維持しながら機密データを共有するために重要である。
既存の技術は、大規模言語モデルの再識別攻撃能力の新たな課題に直面している。
本稿では,3つのLCMベースコンポーネント – プライバシ評価器,ユーティリティ評価器,最適化コンポーネント – で構成されるフレームワークを提案する。
論文 参考訳(メタデータ) (2024-07-16T14:28:56Z) - Collection, usage and privacy of mobility data in the enterprise and public administrations [55.2480439325792]
個人のプライバシーを守るためには、匿名化などのセキュリティ対策が必要である。
本研究では,現場における実践の洞察を得るために,専門家によるインタビューを行った。
我々は、一般的には最先端の差分プライバシー基準に準拠しない、使用中のプライバシー強化手法を調査した。
論文 参考訳(メタデータ) (2024-07-04T08:29:27Z) - Cloaked Classifiers: Pseudonymization Strategies on Sensitive Classification Tasks [4.66054169739129]
本稿では,データ保護と堅牢なプライバシ保護のバランスについて検討する。
我々は,多言語急進化データセットを手動で偽名化する手法を共有し,元のデータに匹敵する性能を確保する。
論文 参考訳(メタデータ) (2024-06-25T18:30:25Z) - The Privacy Policy Permission Model: A Unified View of Privacy Policies [0.5371337604556311]
プライバシポリシ(英: privacy policy)とは、組織がどのようにクライアントのデータを収集し、利用し、開示し、保持するかを指定するステートメントのセットである。
ほとんどのプライバシポリシには、データプロバイダの情報の使用方法に関する明確で完全な説明が欠けている。
本稿では,プライバシーポリシーの統一的かつ理解しやすい表現を提供するプライバシポリシ許可モデル(PPPM)を提案する。
論文 参考訳(メタデータ) (2024-03-26T06:12:38Z) - PrivacyMind: Large Language Models Can Be Contextual Privacy Protection Learners [81.571305826793]
コンテキストプライバシ保護言語モデル(PrivacyMind)を紹介する。
我々の研究はモデル設計に関する理論的分析を提供し、様々な手法をベンチマークする。
特に、肯定的な例と否定的な例の両方による命令チューニングは、有望な方法である。
論文 参考訳(メタデータ) (2023-10-03T22:37:01Z) - Retrieval Enhanced Data Augmentation for Question Answering on Privacy
Policies [74.01792675564218]
本研究では,ラベルのないポリシー文書から関連するテキストセグメントを抽出する検索モデルに基づくデータ拡張フレームワークを開発する。
拡張データの多様性と品質を改善するために,複数の事前学習言語モデル(LM)を活用し,ノイズ低減フィルタモデルでそれらをカスケードする。
PrivacyQAベンチマークの強化データを使用して、既存のベースラインを大きなマージン(10% F1)に高め、新しい最先端のF1スコアを50%達成します。
論文 参考訳(メタデータ) (2022-04-19T15:45:23Z) - Decision Making with Differential Privacy under a Fairness Lens [65.16089054531395]
アメリカ国勢調査局は、多くの重要な意思決定プロセスの入力として使用される個人のグループに関するデータセットと統計を公表している。
プライバシと機密性要件に従うために、これらの機関は、しばしば、プライバシを保存するバージョンのデータを公開する必要がある。
本稿では,差分的プライベートデータセットのリリースについて検討し,公平性の観点から重要な資源配分タスクに与える影響を考察する。
論文 参考訳(メタデータ) (2021-05-16T21:04:19Z) - Second layer data governance for permissioned blockchains: the privacy
management challenge [58.720142291102135]
新型コロナウイルス(COVID-19)やエボラウイルス(エボラ出血熱)のようなパンデミックの状況では、医療データを共有することに関連する行動は、大規模な感染を避け、死亡者を減らすために重要である。
この意味において、許可されたブロックチェーン技術は、スマートコントラクトが管理する不変で統一された分散データベースを通じて、データのオーナシップ、透明性、セキュリティを提供する権利をユーザに与えるために登場します。
論文 参考訳(メタデータ) (2020-10-22T13:19:38Z) - Beyond The Text: Analysis of Privacy Statements through Syntactic and
Semantic Role Labeling [12.74252812104216]
本稿では,プライバシポリシからコンテキスト整合性(Contextual Integrity)のレンズを通じて,プライバシパラメータを抽出する新たなタスクを定式化する。
最近提案された質問応答に基づくソリューションを含む従来のNLPタスクは、プライバシパラメータ抽出の問題に対処するには不十分であることを示す。
論文 参考訳(メタデータ) (2020-10-01T20:48:37Z) - APPCorp: A Corpus for Android Privacy Policy Document Structure Analysis [16.618995752616296]
この作業では,166ドルのプライバシポリシを含む,手作業によるラベル付きコーパスを作成します。
注釈付きコーパスのアノテーションプロセスと詳細を報告する。
データコーパスを4ドルの文書分類モデルでベンチマークし、結果を徹底的に分析し、研究委員会がコーパスを使用するための課題と機会について議論する。
論文 参考訳(メタデータ) (2020-05-14T13:25:11Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。