論文の概要: Helping Code Reviewer Prioritize: Pinpointing Personal Data and its
Processing
- arxiv url: http://arxiv.org/abs/2306.11495v1
- Date: Tue, 20 Jun 2023 12:30:46 GMT
- ステータス: 処理完了
- システム内更新日: 2023-10-23 19:14:18.582632
- Title: Helping Code Reviewer Prioritize: Pinpointing Personal Data and its
Processing
- Title(参考訳): コードレビュアの優先順位付けを支援する - 個人データのピンポイントとその処理
- Authors: Feiyang Tang, Bjarte M. {\O}stvold, Magiel Bruntink
- Abstract要約: 我々は、コードレビュアーが個人データに関連する作業の優先順位付けを支援するために、2つの専門的なビューを設計しました。
当社のアプローチは、4つのオープンソースGitHubアプリケーションで評価され、個人データフローを識別する精度が0.87であることを示した。
このソリューションは、ROPA(Record of Processing Activity)のようなプライバシ関連の分析タスクの効率を高めるために設計されており、リソースの保存、時間節約、コードレビュアーの生産性向上を目的としている。
- 参考スコア(独自算出の注目度): 0.9238700679836852
- License: http://creativecommons.org/licenses/by-sa/4.0/
- Abstract: Ensuring compliance with the General Data Protection Regulation (GDPR) is a
crucial aspect of software development. This task, due to its time-consuming
nature and requirement for specialized knowledge, is often deferred or
delegated to specialized code reviewers. These reviewers, particularly when
external to the development organization, may lack detailed knowledge of the
software under review, necessitating the prioritization of their resources.
To address this, we have designed two specialized views of a codebase to help
code reviewers in prioritizing their work related to personal data: one view
displays the types of personal data representation, while the other provides an
abstract depiction of personal data processing, complemented by an optional
detailed exploration of specific code snippets. Leveraging static analysis, our
method identifies personal data-related code segments, thereby expediting the
review process. Our approach, evaluated on four open-source GitHub
applications, demonstrated a precision rate of 0.87 in identifying personal
data flows. Additionally, we fact-checked the privacy statements of 15 Android
applications. This solution, designed to augment the efficiency of GDPR-related
privacy analysis tasks such as the Record of Processing Activities (ROPA), aims
to conserve resources, thereby saving time and enhancing productivity for code
reviewers.
- Abstract(参考訳): GDPR(General Data Protection Regulation)への準拠を保証することは、ソフトウェア開発の重要な側面である。
このタスクは、その時間を要する性質と専門知識の要求のため、しばしば特別なコードレビュアーに延期または委譲される。
これらのレビュアーは、特に開発組織外部の場合には、レビュー中のソフトウェアに関する詳細な知識を欠き、リソースの優先順位付けを必要とします。
これを解決するために,コードレビュアーが個人データに関する作業の優先順位付けを支援するために,コードベースの2つの特別なビューを設計した。一方のビューは個人データ表現のタイプを表示し,他方のビューは、特定のコードスニペットのオプションで詳細な調査によって補完された個人データ処理の抽象的な描写を提供する。
静的解析を利用することで、個人データ関連コードセグメントを識別し、レビュープロセスを迅速化する。
4つのオープンソースgithubアプリケーションで評価したこのアプローチは、個人データフローの識別において0.18パーセントの精度を示した。
さらに15のAndroidアプリケーションのプライバシーステートメントも事実チェックしました。
このソリューションは、ROPA(Record of Processing Activity)のようなGDPR関連のプライバシ分析タスクの効率を高めるために設計されたもので、リソースの保存を目的としており、これにより、コードレビュアーの時間を節約し、生産性を向上させる。
関連論文リスト
- An Empirical Study of Sensitive Information in Logs [12.980238412281471]
ソフトウェアログにおける機密情報の存在は、重大なプライバシー上の懸念を生じさせる。
この研究は、複数の観点からソフトウェアログのプライバシーを包括的に分析する。
当社の調査結果は、ログのプライバシーに関するさまざまな視点に光を当て、業界の課題を明らかにしました。
論文 参考訳(メタデータ) (2024-09-17T16:12:23Z) - Collection, usage and privacy of mobility data in the enterprise and public administrations [55.2480439325792]
個人のプライバシーを守るためには、匿名化などのセキュリティ対策が必要である。
本研究では,現場における実践の洞察を得るために,専門家によるインタビューを行った。
我々は、一般的には最先端の差分プライバシー基準に準拠しない、使用中のプライバシー強化手法を調査した。
論文 参考訳(メタデータ) (2024-07-04T08:29:27Z) - Step-Back Profiling: Distilling User History for Personalized Scientific Writing [50.481041470669766]
大きな言語モデル(LLM)は、さまざまな自然言語処理タスクに優れていますが、個人向けにパーソナライズされたコンテンツを生成するのに苦労しています。
ユーザ履歴を簡潔なプロファイルに抽出することで,LSMをパーソナライズするためのSTEP-BACK ProFIlingを導入する。
本手法は,一般パーソナライゼーションベンチマークにおいて,ベースラインを最大3.6ポイント向上させる。
論文 参考訳(メタデータ) (2024-06-20T12:58:26Z) - Provable Privacy with Non-Private Pre-Processing [56.770023668379615]
非プライベートなデータ依存前処理アルゴリズムによって生じる追加のプライバシーコストを評価するための一般的なフレームワークを提案する。
当社のフレームワークは,2つの新しい技術的概念を活用することにより,全体的なプライバシー保証の上限を確立する。
論文 参考訳(メタデータ) (2024-03-19T17:54:49Z) - Finding Privacy-relevant Source Code [0.0]
本稿では、個人情報の処理に直接関与するコードの特定の方法であるプライバシー関連手法について紹介する。
次に、ソースコード内のこれらのプライバシ関連メソッドを特定し分類することで、コードレビューを支援する自動アプローチを提案する。
評価の結果,100個のオープンソースアプリケーションについて検討した結果,個人データ処理のプライバシ関連性は5%未満であることが判明した。
論文 参考訳(メタデータ) (2024-01-14T15:38:29Z) - FedDMF: Privacy-Preserving User Attribute Prediction using Deep Matrix
Factorization [1.9181612035055007]
本稿では,ユーザマッチングを必要とせず,ユーザの属性を予測する新しいアルゴリズムを提案する。
我々のアプローチは、異なるクライアント上で深い行列分解モデルを訓練し、属性項目ベクトルのみを共有することである。
これにより、ユーザベクトル自体を共有することなく、ユーザ属性を予測できます。
論文 参考訳(メタデータ) (2023-12-24T06:49:00Z) - PrivacyMind: Large Language Models Can Be Contextual Privacy Protection Learners [81.571305826793]
コンテキストプライバシ保護言語モデル(PrivacyMind)を紹介する。
我々の研究はモデル設計に関する理論的分析を提供し、様々な手法をベンチマークする。
特に、肯定的な例と否定的な例の両方による命令チューニングは、有望な方法である。
論文 参考訳(メタデータ) (2023-10-03T22:37:01Z) - Scalable Discovery and Continuous Inventory of Personal Data at Rest in
Cloud Native Systems [0.0]
クラウドネイティブシステムは、多数の多パラダイムデータストアを通じて大量の個人データを処理している。
プライバシーエンジニアリングの観点では、個人情報が保存されているすべての正確な場所を追跡することが重要な課題だ。
i) 個人データの安静時のスケーラブルな発見のためのワークフローパターンと,i) クラウドネイティブシステムアーキテクチャと,そのワークフローパターンのオープンソースプロトタイプ実装からなるTeresiasを提案する。
論文 参考訳(メタデータ) (2022-09-09T10:45:34Z) - Task-aware Privacy Preservation for Multi-dimensional Data [4.138783926370621]
ローカルディファレンシャルプライバシ(LDP)は、プライバシ保護のための最先端技術である。
将来的には、よりリッチなユーザデータ属性を匿名化するために、LCPを採用することができる。
課題認識型プライバシ保存問題を考慮し,多次元ユーザデータの究極のタスク性能を大幅に向上させる方法について述べる。
論文 参考訳(メタデータ) (2021-10-05T20:03:53Z) - Partial sensitivity analysis in differential privacy [58.730520380312676]
それぞれの入力特徴が個人のプライバシ損失に与える影響について検討する。
プライベートデータベース上でのクエリに対する我々のアプローチを実験的に評価する。
また、合成データにおけるニューラルネットワークトレーニングの文脈における知見についても検討する。
論文 参考訳(メタデータ) (2021-09-22T08:29:16Z) - TIPRDC: Task-Independent Privacy-Respecting Data Crowdsourcing Framework
for Deep Learning with Anonymized Intermediate Representations [49.20701800683092]
本稿では,匿名化中間表現を用いたタスク非依存型プライバシ参照データクラウドソーシングフレームワークTIPRDCを提案する。
このフレームワークの目的は、中間表現からプライバシー情報を隠蔽できる機能抽出器を学習することであり、データコレクターの生データに埋め込まれた元の情報を最大限に保持し、未知の学習タスクを達成することである。
論文 参考訳(メタデータ) (2020-05-23T06:21:26Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。