論文の概要: Demystifying Legalese: An Automated Approach for Summarizing and Analyzing Overlaps in Privacy Policies and Terms of Service
- arxiv url: http://arxiv.org/abs/2404.13087v1
- Date: Wed, 17 Apr 2024 19:53:59 GMT
- ステータス: 処理完了
- システム内更新日: 2024-04-23 20:28:09.501366
- Title: Demystifying Legalese: An Automated Approach for Summarizing and Analyzing Overlaps in Privacy Policies and Terms of Service
- Title(参考訳): Demystifying Legalese:プライバシポリシとサービス条件のオーバーラップを要約し分析するための自動化アプローチ
- Authors: Shikha Soneji, Mitchell Hoesing, Sujay Koujalgi, Jonathan Dodge,
- Abstract要約: 我々の研究は、このような文書に自動でアクセス可能な要約とスコアを提供する言語モデルを開発することで、この問題を軽減することを目指している。
我々はデータセットのトレーニング中にトランスフォーマーベースのモデルと従来のモデルを比較し、RoBERTaは0.74F1スコアで全体的なパフォーマンスを改善した。
- 参考スコア(独自算出の注目度): 0.6240153531166704
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: The complexities of legalese in terms and policy documents can bind individuals to contracts they do not fully comprehend, potentially leading to uninformed data sharing. Our work seeks to alleviate this issue by developing language models that provide automated, accessible summaries and scores for such documents, aiming to enhance user understanding and facilitate informed decisions. We compared transformer-based and conventional models during training on our dataset, and RoBERTa performed better overall with a remarkable 0.74 F1-score. Leveraging our best-performing model, RoBERTa, we highlighted redundancies and potential guideline violations by identifying overlaps in GDPR-required documents, underscoring the necessity for stricter GDPR compliance.
- Abstract(参考訳): 法律の用語や政策文書の複雑さは、完全に理解されていない契約に個人を縛り付けることができ、おそらくは非情報共有につながる。
本研究は,このような文書に自動でアクセス可能な要約とスコアを提供する言語モデルを開発し,ユーザの理解を深め,情報的意思決定を促進することを目的としている。
我々はデータセットのトレーニング中にトランスフォーマーベースのモデルと従来のモデルを比較し、RoBERTaは0.74F1スコアで全体的なパフォーマンスを改善した。
最高のパフォーマンスモデルであるRoBERTaを活用して、GDPRが要求するドキュメントの重複を特定し、より厳格なGDPRコンプライアンスの必要性を強調することで、冗長性と潜在的ガイドライン違反を強調しました。
関連論文リスト
- Rethinking Legal Compliance Automation: Opportunities with Large Language Models [2.9088208525097365]
我々は、(テキスト)法的アーティファクトの試験は、まず文よりも広い文脈で行うべきであると論じる。
これらの制約に対処するために,コンプライアンス分析手法を提案する。
論文 参考訳(メタデータ) (2024-04-22T17:10:27Z) - Modelling Technique for GDPR-compliance: Toward a Comprehensive Solution [0.0]
EU/UKにおける新たなデータ保護法が施行された。
既存の脅威モデリング技術は、コンプライアンスをモデル化するために設計されていない。
非コンプライアンス脅威に対する知識基盤の原則と統合した新しいデータフローを提案する。
論文 参考訳(メタデータ) (2024-04-22T08:41:43Z) - Towards an Enforceable GDPR Specification [49.1574468325115]
プライバシ・バイ・デザイン(PbD)は、EUなどの現代的なプライバシー規制によって規定されている。
PbDを実現する1つの新しい技術は強制(RE)である
法律規定の正式な仕様を作成するための一連の要件と反復的な方法論を提示する。
論文 参考訳(メタデータ) (2024-02-27T09:38:51Z) - A Multi-solution Study on GDPR AI-enabled Completeness Checking of DPAs [3.1002416427168304]
一般データ保護規則(DPA、General Data Protection Regulation)は、個人データが保護されたまま処理を規制するデータ処理契約(DPA)を必要とする。
したがって、前提条件に従ってDPAの完全性を確認することは、要求が完全であることを保証するために不可欠である。
本稿では,規定事項に対するDPAの完全性チェックに対処する自動化戦略を提案する。
論文 参考訳(メタデータ) (2023-11-23T10:05:52Z) - Information Association for Language Model Updating by Mitigating
LM-Logical Discrepancy [68.31760483418901]
大規模言語モデル(LLM)は、時代遅れの事前学習データのために現在の情報を提供するのに苦労する。
知識編集や連続的な微調整など,従来のLCMの更新方法は,新たな情報の一般化に重大な欠点がある。
これらの欠点の中核となる課題は,言語モデリングの確率と論理的確率の差を特徴とするLM論理的相違である。
論文 参考訳(メタデータ) (2023-05-29T19:48:37Z) - Auditing and Generating Synthetic Data with Controllable Trust
Trade-offs [54.262044436203965]
合成データセットとAIモデルを包括的に評価する総合監査フレームワークを導入する。
バイアスや差別の防止、ソースデータへの忠実性の確保、実用性、堅牢性、プライバシ保護などに焦点を当てている。
多様なユースケースにまたがる様々な生成モデルを監査することにより,フレームワークの有効性を実証する。
論文 参考訳(メタデータ) (2023-04-21T09:03:18Z) - Relational Action Bases: Formalization, Effective Safety Verification,
and Invariants (Extended Version) [67.99023219822564]
我々はリレーショナルアクションベース(RAB)の一般的な枠組みを紹介する。
RABは両方の制限を解除することで既存のモデルを一般化する。
データ対応ビジネスプロセスのベンチマークにおいて、このアプローチの有効性を実証する。
論文 参考訳(メタデータ) (2022-08-12T17:03:50Z) - SAIS: Supervising and Augmenting Intermediate Steps for Document-Level
Relation Extraction [51.27558374091491]
本稿では,関係抽出のための中間ステップ(SAIS)を監督し,拡張することにより,関連コンテキストやエンティティタイプをキャプチャするモデルを明示的に教えることを提案する。
そこで本提案手法は,より効果的な管理を行うため,より優れた品質の関係を抽出するだけでなく,それに対応する証拠をより正確に抽出する。
論文 参考訳(メタデータ) (2021-09-24T17:37:35Z) - Investigating Crowdsourcing Protocols for Evaluating the Factual
Consistency of Summaries [59.27273928454995]
要約に適用される現在の事前学習モデルは、ソーステキストを誤って表現したり、外部情報を導入したりする事実上の矛盾がちである。
評価ベースのLikertスケールとランキングベースのBest-Worst Scalingプロトコルを用いた,事実整合性のためのクラウドソーシング評価フレームワークを構築した。
ランキングベースのプロトコルは、データセット間の要約品質をより信頼性の高い尺度を提供するのに対して、Likertレーティングの信頼性はターゲットデータセットと評価設計に依存する。
論文 参考訳(メタデータ) (2021-09-19T19:05:00Z) - Compliance Generation for Privacy Documents under GDPR: A Roadmap for
Implementing Automation and Machine Learning [2.1485350418225244]
Privatechプロジェクトはコンプライアンスのエージェントとして企業や法律会社に焦点を当てている。
データプロセッサはコンプライアンスの評価と文書化のために説明責任対策を実行しなければならない。
コンプライアンスの問題を特定し,コンプライアンス評価と生成のロードマップを提供する。
論文 参考訳(メタデータ) (2020-12-23T14:46:51Z) - Towards a Semantic Model of the GDPR Register of Processing Activities [0.3441021278275805]
分析テンプレート間の共通概念と関係に基づく統合データモデルを提案する。
DPVは現在、ROPAデータモデルを表現するのに十分な概念を提供していません。
これにより、組織と規制機関間のコンプライアンスのためのパンEU情報管理フレームワークの作成が可能になる。
論文 参考訳(メタデータ) (2020-08-03T13:54:47Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。