Fugu-MT 論文翻訳(概要): Helping Code Reviewer Prioritize: Pinpointing Personal Data and its Processing

論文の概要: Helping Code Reviewer Prioritize: Pinpointing Personal Data and its Processing

arxiv url: http://arxiv.org/abs/2306.11495v1
Date: Tue, 20 Jun 2023 12:30:46 GMT
ステータス: 翻訳完了
システム内更新日: 2023-10-23 19:14:18.582632
Title: Helping Code Reviewer Prioritize: Pinpointing Personal Data and its Processing
Title（参考訳）: コードレビュアの優先順位付けを支援する - 個人データのピンポイントとその処理
Authors: Feiyang Tang, Bjarte M. {\O}stvold, Magiel Bruntink
Abstract要約: 我々は、コードレビュアーが個人データに関連する作業の優先順位付けを支援するために、2つの専門的なビューを設計しました。当社のアプローチは、4つのオープンソースGitHubアプリケーションで評価され、個人データフローを識別する精度が0.87であることを示した。このソリューションは、ROPA(Record of Processing Activity)のようなプライバシ関連の分析タスクの効率を高めるために設計されており、リソースの保存、時間節約、コードレビュアーの生産性向上を目的としている。
参考スコア（独自算出の注目度）: 0.9238700679836852
License: http://creativecommons.org/licenses/by-sa/4.0/
Abstract: Ensuring compliance with the General Data Protection Regulation (GDPR) is a crucial aspect of software development. This task, due to its time-consuming nature and requirement for specialized knowledge, is often deferred or delegated to specialized code reviewers. These reviewers, particularly when external to the development organization, may lack detailed knowledge of the software under review, necessitating the prioritization of their resources. To address this, we have designed two specialized views of a codebase to help code reviewers in prioritizing their work related to personal data: one view displays the types of personal data representation, while the other provides an abstract depiction of personal data processing, complemented by an optional detailed exploration of specific code snippets. Leveraging static analysis, our method identifies personal data-related code segments, thereby expediting the review process. Our approach, evaluated on four open-source GitHub applications, demonstrated a precision rate of 0.87 in identifying personal data flows. Additionally, we fact-checked the privacy statements of 15 Android applications. This solution, designed to augment the efficiency of GDPR-related privacy analysis tasks such as the Record of Processing Activities (ROPA), aims to conserve resources, thereby saving time and enhancing productivity for code reviewers.
Abstract（参考訳）: GDPR(General Data Protection Regulation)への準拠を保証することは、ソフトウェア開発の重要な側面である。このタスクは、その時間を要する性質と専門知識の要求のため、しばしば特別なコードレビュアーに延期または委譲される。これらのレビュアーは、特に開発組織外部の場合には、レビュー中のソフトウェアに関する詳細な知識を欠き、リソースの優先順位付けを必要とします。これを解決するために,コードレビュアーが個人データに関する作業の優先順位付けを支援するために,コードベースの2つの特別なビューを設計した。一方のビューは個人データ表現のタイプを表示し,他方のビューは、特定のコードスニペットのオプションで詳細な調査によって補完された個人データ処理の抽象的な描写を提供する。静的解析を利用することで、個人データ関連コードセグメントを識別し、レビュープロセスを迅速化する。 4つのオープンソースgithubアプリケーションで評価したこのアプローチは、個人データフローの識別において0.18パーセントの精度を示した。さらに15のAndroidアプリケーションのプライバシーステートメントも事実チェックしました。このソリューションは、ROPA(Record of Processing Activity)のようなGDPR関連のプライバシ分析タスクの効率を高めるために設計されたもので、リソースの保存を目的としており、これにより、コードレビュアーの時間を節約し、生産性を向上させる。

関連論文リスト

LADFA: A Framework of Using Large Language Models and Retrieval-Augmented Generation for Personal Data Flow Analysis in Privacy Policies [3.1079404628759306]
LADFAはプライバシーポリシーを分析するためのエンドツーエンドの計算フレームワークである。特定のプライバシポリシで非構造化テキストを処理し、個人データフローを抽出し、個人データフローグラフを構築することができる。プライバシーポリシー分析以外のテキストベースの分析タスクにも適している。
論文参考訳（メタデータ） (2026-01-15T14:03:22Z)
DRBench: A Realistic Benchmark for Enterprise Deep Research [81.49694432639406]
DRBenchは、エンタープライズ環境で複雑でオープンなディープリサーチタスクでAIエージェントを評価するためのベンチマークである。セールス、サイバーセキュリティ、コンプライアンスなど10のドメインにわたる15のディープリサーチタスクをリリースしています。
論文参考訳（メタデータ） (2025-09-30T18:47:20Z)
Differentially Private Synthetic Data Release for Topics API Outputs [63.79476766779742]
当社では,Google ChromeのPrivacy Sandboxの一部として,1つのPrivacy-Preserving Ads API – Topics APIに注目しています。実トピックAPIデータの再識別リスク特性と密に一致した、微分プライベートなデータセットを生成する。これにより、外部の研究者がAPIを詳細に分析し、現実的な大規模データセットの事前および将来の作業の再現が可能になります。
論文参考訳（メタデータ） (2025-06-30T13:46:57Z)
Generating Privacy Stories From Software Documentation [1.2094859111770522]
CoT, in-context-learning (ICL), Large Language Models (LLMs) に基づく新しいアプローチを開発する。 GPT-4o や Llama 3 などの LLM は,プライバシの振る舞いを識別し,F1 スコア 0.8 を超えるプライバシユーザストーリーを生成する。
論文参考訳（メタデータ） (2025-06-28T20:55:21Z)
PersonaBench: Evaluating AI Models on Understanding Personal Information through Accessing (Synthetic) Private User Data [76.21047984886273]
パーソナライゼーションは、AIアシスタント、特に個々のユーザーと連携するプライベートAIモデルのコンテキストにおいて重要である。このようなデータのセンシティブな性質のため、AIモデルのユーザ理解能力を評価するためのデータセットは公開されていない。多様なユーザプロファイルを作成する合成データ生成パイプラインと、人間の活動をシミュレートするプライベートドキュメントを導入する。
論文参考訳（メタデータ） (2025-02-28T00:43:35Z)
An Empirical Study of Sensitive Information in Logs [12.980238412281471]
ソフトウェアログにおける機密情報の存在は、重大なプライバシー上の懸念を生じさせる。この研究は、複数の観点からソフトウェアログのプライバシーを包括的に分析する。当社の調査結果は、ログのプライバシーに関するさまざまな視点に光を当て、業界の課題を明らかにしました。
論文参考訳（メタデータ） (2024-09-17T16:12:23Z)
Collection, usage and privacy of mobility data in the enterprise and public administrations [55.2480439325792]
個人のプライバシーを守るためには、匿名化などのセキュリティ対策が必要である。本研究では,現場における実践の洞察を得るために,専門家によるインタビューを行った。我々は、一般的には最先端の差分プライバシー基準に準拠しない、使用中のプライバシー強化手法を調査した。
論文参考訳（メタデータ） (2024-07-04T08:29:27Z)
Step-Back Profiling: Distilling User History for Personalized Scientific Writing [50.481041470669766]
大きな言語モデル(LLM)は、さまざまな自然言語処理タスクに優れていますが、個人向けにパーソナライズされたコンテンツを生成するのに苦労しています。ユーザ履歴を簡潔なプロファイルに抽出することで,LSMをパーソナライズするためのSTEP-BACK ProFIlingを導入する。本手法は,一般パーソナライゼーションベンチマークにおいて,ベースラインを最大3.6ポイント向上させる。
論文参考訳（メタデータ） (2024-06-20T12:58:26Z)
Provable Privacy with Non-Private Pre-Processing [56.770023668379615]
非プライベートなデータ依存前処理アルゴリズムによって生じる追加のプライバシーコストを評価するための一般的なフレームワークを提案する。当社のフレームワークは,2つの新しい技術的概念を活用することにより,全体的なプライバシー保証の上限を確立する。
論文参考訳（メタデータ） (2024-03-19T17:54:49Z)
Finding Privacy-relevant Source Code [0.0]
本稿では、個人情報の処理に直接関与するコードの特定の方法であるプライバシー関連手法について紹介する。次に、ソースコード内のこれらのプライバシ関連メソッドを特定し分類することで、コードレビューを支援する自動アプローチを提案する。評価の結果,100個のオープンソースアプリケーションについて検討した結果,個人データ処理のプライバシ関連性は5%未満であることが判明した。
論文参考訳（メタデータ） (2024-01-14T15:38:29Z)
FedDMF: Privacy-Preserving User Attribute Prediction using Deep Matrix Factorization [1.9181612035055007]
本稿では,ユーザマッチングを必要とせず,ユーザの属性を予測する新しいアルゴリズムを提案する。我々のアプローチは、異なるクライアント上で深い行列分解モデルを訓練し、属性項目ベクトルのみを共有することである。これにより、ユーザベクトル自体を共有することなく、ユーザ属性を予測できます。
論文参考訳（メタデータ） (2023-12-24T06:49:00Z)
PrivacyMind: Large Language Models Can Be Contextual Privacy Protection Learners [81.571305826793]
コンテキストプライバシ保護言語モデル(PrivacyMind)を紹介する。我々の研究はモデル設計に関する理論的分析を提供し、様々な手法をベンチマークする。特に、肯定的な例と否定的な例の両方による命令チューニングは、有望な方法である。
論文参考訳（メタデータ） (2023-10-03T22:37:01Z)
Scalable Discovery and Continuous Inventory of Personal Data at Rest in Cloud Native Systems [0.0]
クラウドネイティブシステムは、多数の多パラダイムデータストアを通じて大量の個人データを処理している。プライバシーエンジニアリングの観点では、個人情報が保存されているすべての正確な場所を追跡することが重要な課題だ。 i) 個人データの安静時のスケーラブルな発見のためのワークフローパターンと,i) クラウドネイティブシステムアーキテクチャと,そのワークフローパターンのオープンソースプロトタイプ実装からなるTeresiasを提案する。
論文参考訳（メタデータ） (2022-09-09T10:45:34Z)
Task-aware Privacy Preservation for Multi-dimensional Data [4.138783926370621]
ローカルディファレンシャルプライバシ(LDP)は、プライバシ保護のための最先端技術である。将来的には、よりリッチなユーザデータ属性を匿名化するために、LCPを採用することができる。課題認識型プライバシ保存問題を考慮し,多次元ユーザデータの究極のタスク性能を大幅に向上させる方法について述べる。
論文参考訳（メタデータ） (2021-10-05T20:03:53Z)
Partial sensitivity analysis in differential privacy [58.730520380312676]
それぞれの入力特徴が個人のプライバシ損失に与える影響について検討する。プライベートデータベース上でのクエリに対する我々のアプローチを実験的に評価する。また、合成データにおけるニューラルネットワークトレーニングの文脈における知見についても検討する。
論文参考訳（メタデータ） (2021-09-22T08:29:16Z)
TIPRDC: Task-Independent Privacy-Respecting Data Crowdsourcing Framework for Deep Learning with Anonymized Intermediate Representations [49.20701800683092]
本稿では,匿名化中間表現を用いたタスク非依存型プライバシ参照データクラウドソーシングフレームワークTIPRDCを提案する。このフレームワークの目的は、中間表現からプライバシー情報を隠蔽できる機能抽出器を学習することであり、データコレクターの生データに埋め込まれた元の情報を最大限に保持し、未知の学習タスクを達成することである。
論文参考訳（メタデータ） (2020-05-23T06:21:26Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。