論文の概要: Digital trace data collection through data donation
- arxiv url: http://arxiv.org/abs/2011.09851v1
- Date: Fri, 13 Nov 2020 11:19:25 GMT
- ステータス: 処理完了
- システム内更新日: 2023-04-24 05:20:43.823473
- Title: Digital trace data collection through data donation
- Title(参考訳): データ提供によるデジタルトレースデータ収集
- Authors: Laura Boeschoten and Jef Ausloos and Judith Moeller and Theo Araujo
and Daniel L. Oberski
- Abstract要約: EUの一般データ保護規則(General Data Protection Regulation: 2018)第15条では、個人が個人データへの電子的アクセスを義務付けている。
主要なデジタルプラットフォームはすべて,ユーザによる“データダウンロードパッケージ(DDP)”の法律に準拠している。
公共機関や民間機関が収集したすべてのデータを通じて、市民のデジタル生活を入手し、分析して社会科学的疑問に答えることができる。
DDPを用いたデジタルトレースデータ収集のための青写真を提供し、そのようなプロジェクトのための「Total error framework」を考案する。
- 参考スコア(独自算出の注目度): 0.4499833362998487
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: A potentially powerful method of social-scientific data collection and
investigation has been created by an unexpected institution: the law. Article
15 of the EU's 2018 General Data Protection Regulation (GDPR) mandates that
individuals have electronic access to a copy of their personal data, and all
major digital platforms now comply with this law by providing users with "data
download packages" (DDPs). Through voluntary donation of DDPs, all data
collected by public and private entities during the course of citizens' digital
life can be obtained and analyzed to answer social-scientific questions - with
consent. Thus, consented DDPs open the way for vast new research opportunities.
However, while this entirely new method of data collection will undoubtedly
gain popularity in the coming years, it also comes with its own questions of
representativeness and measurement quality, which are often evaluated
systematically by means of an error framework. Therefore, in this paper we
provide a blueprint for digital trace data collection using DDPs, and devise a
"total error framework" for such projects. Our error framework for digital
trace data collection through data donation is intended to facilitate high
quality social-scientific investigations using DDPs while critically reflecting
its unique methodological challenges and sources of error. In addition, we
provide a quality control checklist to guide researchers in leveraging the vast
opportunities afforded by this new mode of investigation.
- Abstract(参考訳): 社会科学的データ収集と調査の潜在的に強力な方法は、予期せぬ機関である法律によって作成されている。
2018年eu一般データ保護規則(gdpr)第15条では、個人が個人データのコピーに電子的にアクセスすることを義務付けており、主要なデジタルプラットフォームはすべて、ユーザに対して"data download package"(ddps)を提供することでこの法律に準拠している。
DDPの自発的な寄付を通じて、市民のデジタル生活の過程で市民や民間団体が収集したすべてのデータを取得し、社会科学的な質問に答えるために分析することができる。
このように、合意されたDDPは、大きな新しい研究機会の道を開く。
しかし、この全く新しいデータ収集手法が今後数年で確実に普及することは間違いないが、表現性や測定品質に関する独自の疑問も伴い、しばしばエラーフレームワークによって体系的に評価される。
そこで本稿では,DDPを用いたデジタルトレースデータ収集のための青写真を提供し,そのようなプロジェクトのための「Total error framework」を考案する。
データ提供によるデジタルトレースデータ収集のためのエラーフレームワークは,DDPを用いた高品質な社会科学的調査を促進することを目的としている。
さらに,この新たな調査方法によって得られる膨大な機会を活用するために,研究者を指導するための品質管理チェックリストを提供する。
関連論文リスト
- How to Drill Into Silos: Creating a Free-to-Use Dataset of Data Subject Access Packages [0.0]
欧州連合(EU)の一般データ保護規則は、個人データへのアクセス権を強化した。
コントローラが提供する被写体アクセス要求パッケージ(SARP)を実際に使用する可能性は非常に制限されている。
このデータセットは一般に提供され、将来、SARPの実用化に向けた新しいアプローチの研究および比較の出発点として機能する。
論文 参考訳(メタデータ) (2024-07-05T12:39:51Z) - A Survey on Data Selection for Language Models [148.300726396877]
データ選択方法は、トレーニングデータセットに含まれるデータポイントを決定することを目的としている。
ディープラーニングは、主に実証的な証拠によって駆動され、大規模なデータに対する実験は高価である。
広範なデータ選択研究のリソースを持つ組織はほとんどない。
論文 参考訳(メタデータ) (2024-02-26T18:54:35Z) - CaPS: Collaborative and Private Synthetic Data Generation from Distributed Sources [5.898893619901382]
分散データホルダから合成データの協調的かつプライベートな生成のためのフレームワークを提案する。
我々は信頼されたアグリゲータをセキュアなマルチパーティ計算プロトコルに置き換え、差分プライバシー(DP)を介してプライバシを出力する。
MWEM+PGMおよびAIMの最先端選択測度生成アルゴリズムに対するアプローチの適用性とスケーラビリティを実証する。
論文 参考訳(メタデータ) (2024-02-13T17:26:32Z) - A Unified View of Differentially Private Deep Generative Modeling [60.72161965018005]
プライバシー上の懸念のあるデータには、データアクセスとデータ共有を頻繁に禁止する厳格な規制が伴う。
これらの障害を克服することは、プライバシーに敏感なデータを含む多くの現実世界のアプリケーションシナリオにおいて、技術的進歩の鍵となる。
差分的プライベート(DP)データパブリッシングは、データの衛生化された形式のみを公開する、魅力的なソリューションを提供する。
論文 参考訳(メタデータ) (2023-09-27T14:38:16Z) - Releasing survey microdata with exact cluster locations and additional
privacy safeguards [77.34726150561087]
本稿では,プライバシ保護を付加した独自のマイクロデータの有用性を活用した,代替的なマイクロデータ配信戦略を提案する。
当社の戦略は, 再識別の試みにおいても, 任意の属性に対する再識別リスクを60~80%削減する。
論文 参考訳(メタデータ) (2022-05-24T19:37:11Z) - Algorithmic Fairness Datasets: the Story so Far [68.45921483094705]
データ駆動アルゴリズムは、人々の幸福に直接影響し、批判的な決定をサポートするために、さまざまな領域で研究されている。
研究者のコミュニティは、既存のアルゴリズムの株式を調査し、新しいアルゴリズムを提案し、歴史的に不利な人口に対する自動意思決定のリスクと機会の理解を深めてきた。
公正な機械学習の進歩はデータに基づいており、適切に文書化された場合にのみ適切に使用できる。
残念なことに、アルゴリズムフェアネスコミュニティは、特定のリソース(オパシティ)に関する情報の不足と利用可能な情報の分散(スパーシティ)によって引き起こされる、集合的なデータドキュメント負債に悩まされている。
論文 参考訳(メタデータ) (2022-02-03T17:25:46Z) - Yes-Yes-Yes: Donation-based Peer Reviewing Data Collection for ACL
Rolling Review and Beyond [58.71736531356398]
本稿では、ピアレビューデータについて詳細な議論を行い、ピアレビューデータ収集のための倫理的・法的デシダータの概要を述べるとともに、最初の継続的な寄付ベースのデータ収集ワークフローを提案する。
本稿では、ACL Rolling Reviewにおいて、このワークフローの現在進行中の実装について報告し、新たに収集したデータから得られた最初の洞察を提供する。
論文 参考訳(メタデータ) (2022-01-27T11:02:43Z) - Protecting Privacy and Transforming COVID-19 Case Surveillance Datasets
for Public Use [0.4462475518267084]
CDCは、個人レベルの未確認データを管轄区域から収集し、現在800万件以上の記録を保有している。
データ要素は、有用性、公開要求、およびプライバシーの影響に基づいて含まれた。
機密情報の再識別や暴露のリスクを低減するため、特定のフィールド値が抑制された。
論文 参考訳(メタデータ) (2021-01-13T14:24:20Z) - Data Mining with Big Data in Intrusion Detection Systems: A Systematic
Literature Review [68.15472610671748]
クラウドコンピューティングは、複雑で高性能でスケーラブルな計算のために、強力で必要不可欠な技術になっている。
データ生成の迅速化とボリュームは、データ管理とセキュリティに重大な課題をもたらし始めている。
ビッグデータ設定における侵入検知システム(IDS)の設計と展開が重要視されている。
論文 参考訳(メタデータ) (2020-05-23T20:57:12Z) - PrivGen: Preserving Privacy of Sequences Through Data Generation [14.579475552088688]
シークエンシャルデータは、研究の基盤として機能し、プロセスの改善につながる可能性がある。
このようなデータへのアクセスと利用は、通常、ユーザーのプライバシーを侵害する懸念のために制限されるか、まったく許可されない。
そこで我々はPrivGenを提案する。PrivGenは、ソースデータのパターンと特徴を保守するデータを生成する革新的な方法である。
論文 参考訳(メタデータ) (2020-02-23T05:43:15Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。