論文の概要: The whos, whats, and whys of issues related to personal data and data protection in open-source projects on GitHub
- arxiv url: http://arxiv.org/abs/2304.06367v2
- Date: Tue, 14 Oct 2025 15:30:01 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-10-15 19:02:31.873286
- Title: The whos, whats, and whys of issues related to personal data and data protection in open-source projects on GitHub
- Title(参考訳): GitHub上のオープンソースプロジェクトにおける個人データとデータ保護に関する問題の原因と原因
- Authors: Anne Henning, Lukas Schulte, Steffen Herbold, Oksana Kulyk, Peter Mayer,
- Abstract要約: インダクティブコーディングを使用して、オープンソースのGitHubプロジェクトから652の問題を解析しています。
データ保護規制が施行された際には,レポートの大幅な増加が見られた。
すべての調査結果から、データ保護規則は、プライバシーソフトウェア開発コミュニティに関する議論を効果的に開始することを示している。
- 参考スコア(独自算出の注目度): 6.733786687734259
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Data protection regulations such as the General Data Protection Regulation (GDPR) in the European Union and the California Consumer Privacy Act (CCPA) in the US affect how software may handle the personal data of its users. Prior literature focused on how data protection regulations are discussed for software in operation, or how this topic is discussed in various channels outside of the software development process. Yet, what is missing, is a perspective on the impact of such regulations on the software development process. In our work, we address this gap, and explore how discussions during the development of software are impacted by regulations, who reports and discusses issues related to personal data and data protection, and how developers react to those issues. To that end, we used inductive coding to analyze 652 issues from Open Source GitHub projects and used the codes to quantitatively analyze the relation between the roles, resolutions, and data protection issues to understand correlations and predict resolutions of issues. Most notably we observed a significant increase in reporting when GDPR came into effect. The most common issue types were feature requests for privacy enhancement, which were mainly reported and discussed by frequent reporters and frequent committers. But especially issues regarding privacy enhancement were also frequently reported by one-time reporters. Most of the requests were solved without opposing votes. All in all, our findings indicate that data protection regulations effectively start discussions about privacy within the software development community.
- Abstract(参考訳): 欧州連合(EU)の一般データ保護規則(GDPR)や米国のカリフォルニア州消費者プライバシ法(CCPA)などのデータ保護規則は、ソフトウェアがユーザーの個人情報をどのように扱うかに影響する。
以前の文献では、運用中のソフトウェアに対して、どのようにデータ保護規制が議論されるか、あるいは、このトピックがソフトウェア開発プロセス以外の様々なチャネルでどのように議論されるかに焦点が当てられていた。
しかし、欠けているのは、そのような規制がソフトウェア開発プロセスに与える影響についてである。
我々の研究では、このギャップに対処し、ソフトウェア開発中の議論が、個人データやデータ保護に関する問題を報告し、議論する規制によってどのように影響を受けるか、そして開発者がこれらの問題にどのように反応するかを考察する。
そのために、インダクティブコーディングを使用して、オープンソースのGitHubプロジェクトから652の問題を分析し、コードを使用して、役割、解決、データ保護の問題の関係を定量的に分析して、相関を理解し、問題の解決を予測しました。
とくに、GDPRが施行されたときの報告が顕著に増加した。
最も一般的な問題はプライバシー強化のための機能要求であり、主にレポーターや頻繁なコミッターによって報告され議論された。
しかし、プライバシー強化に関する問題も、一度限りの記者によって頻繁に報告された。
ほとんどの要求は反対票なしで解決された。
全体としては、データ保護規制がソフトウェア開発コミュニティ内でのプライバシーに関する議論を効果的に開始することを示している。
関連論文リスト
- Evolution of repositories and privacy laws: commit activities in the GDPR and CCPA era [2.1331883629523634]
2016年以降、12,391のリポジトリから37,213のコミットを分析しました。
私たちは、ほとんどのコミットが、法律が施行された日に実行され、プライバシーに関する用語がコミットメッセージに現れるのを観察します。
調査によると、プライバシーユーザーの権利に関する教育活動はもっと必要で、プライバシー勧告のためのツールも必要だ。
論文 参考訳(メタデータ) (2025-05-28T11:10:58Z) - Protecting Privacy in Software Logs: What Should Be Anonymized? [12.980238412281471]
ソフトウェアログにおける機密情報の存在は、重大なプライバシー上の懸念を生じさせる。
この研究は、複数の観点からソフトウェアログのプライバシーを包括的に分析する。
当社の調査結果は、ログのプライバシーに関するさまざまな視点に光を当て、業界の課題を明らかにしました。
論文 参考訳(メタデータ) (2024-09-17T16:12:23Z) - PrivacyLens: Evaluating Privacy Norm Awareness of Language Models in Action [54.11479432110771]
PrivacyLensは、プライバシに敏感な種子を表現的なヴィグネットに拡張し、さらにエージェントの軌跡に拡張するために設計された新しいフレームワークである。
プライバシの文献とクラウドソーシングされたシードに基づいて、プライバシの規範のコレクションをインスタンス化する。
GPT-4やLlama-3-70Bのような最先端のLMは、プライバシー強化の指示が出されたとしても、機密情報を25.68%、38.69%のケースでリークしている。
論文 参考訳(メタデータ) (2024-08-29T17:58:38Z) - An Exploratory Mixed-Methods Study on General Data Protection Regulation (GDPR) Compliance in Open-Source Software [4.2610816955137]
欧州連合(EU)の一般データ保護規則では、ソフトウェア開発者はユーザーのデータと相互作用するプライバシー要件を満たす必要がある。
先行研究は、そのような法律が開発に与える影響を説明しているが、商用ソフトウェアの場合のみである。
論文 参考訳(メタデータ) (2024-06-20T20:38:33Z) - A First Look at the General Data Protection Regulation (GDPR) in
Open-Source Software [4.844017045823075]
このポスターは、オープンソースソフトウェアにおける規制されたデータ保護に関する研究について記述している。
彼らの経験を理解するために、オープンソース開発者を調査しました。
我々は、ポリシー関連のコンプライアンスリソースの改善を要求します。
論文 参考訳(メタデータ) (2024-01-26T03:49:13Z) - Distributed Machine Learning and the Semblance of Trust [66.1227776348216]
フェデレートラーニング(FL)により、データ所有者はデータを共有することなく、データガバナンスを維持し、モデルトレーニングをローカルで行うことができる。
FLと関連する技術は、しばしばプライバシー保護と表現される。
この用語が適切でない理由を説明し、プライバシの形式的定義を念頭に設計されていないプロトコルに対する過度な信頼に関連するリスクを概説する。
論文 参考訳(メタデータ) (2021-12-21T08:44:05Z) - Decision Making with Differential Privacy under a Fairness Lens [65.16089054531395]
アメリカ国勢調査局は、多くの重要な意思決定プロセスの入力として使用される個人のグループに関するデータセットと統計を公表している。
プライバシと機密性要件に従うために、これらの機関は、しばしば、プライバシを保存するバージョンのデータを公開する必要がある。
本稿では,差分的プライベートデータセットのリリースについて検討し,公平性の観点から重要な資源配分タスクに与える影響を考察する。
論文 参考訳(メタデータ) (2021-05-16T21:04:19Z) - Second layer data governance for permissioned blockchains: the privacy
management challenge [58.720142291102135]
新型コロナウイルス(COVID-19)やエボラウイルス(エボラ出血熱)のようなパンデミックの状況では、医療データを共有することに関連する行動は、大規模な感染を避け、死亡者を減らすために重要である。
この意味において、許可されたブロックチェーン技術は、スマートコントラクトが管理する不変で統一された分散データベースを通じて、データのオーナシップ、透明性、セキュリティを提供する権利をユーザに与えるために登場します。
論文 参考訳(メタデータ) (2020-10-22T13:19:38Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。