論文の概要: Scalable Discovery and Continuous Inventory of Personal Data at Rest in
Cloud Native Systems
- arxiv url: http://arxiv.org/abs/2209.10412v1
- Date: Fri, 9 Sep 2022 10:45:34 GMT
- ステータス: 処理完了
- システム内更新日: 2023-02-19 11:18:12.897679
- Title: Scalable Discovery and Continuous Inventory of Personal Data at Rest in
Cloud Native Systems
- Title(参考訳): クラウドネイティブシステムにおけるスケーラブルな発見と個人データの継続的インベントリ
- Authors: Elias Gr\"unewald and Leonard Schurbert
- Abstract要約: クラウドネイティブシステムは、多数の多パラダイムデータストアを通じて大量の個人データを処理している。
プライバシーエンジニアリングの観点では、個人情報が保存されているすべての正確な場所を追跡することが重要な課題だ。
i) 個人データの安静時のスケーラブルな発見のためのワークフローパターンと,i) クラウドネイティブシステムアーキテクチャと,そのワークフローパターンのオープンソースプロトタイプ実装からなるTeresiasを提案する。
- 参考スコア(独自算出の注目度): 0.0
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Cloud native systems are processing large amounts of personal data through
numerous and possibly multi-paradigmatic data stores (e.g., relational and
non-relational databases). From a privacy engineering perspective, a core
challenge is to keep track of all exact locations, where personal data is being
stored, as required by regulatory frameworks such as the European General Data
Protection Regulation. In this paper, we present Teiresias, comprising i) a
workflow pattern for scalable discovery of personal data at rest, and ii) a
cloud native system architecture and open source prototype implementation of
said workflow pattern. To this end, we enable a continuous inventory of
personal data featuring transparency and accountability following
DevOps/DevPrivOps practices. In particular, we scope version-controlled
Infrastructure as Code definitions, cloud-based storages, and how to integrate
the process into CI/CD pipelines. Thereafter, we provide iii) a comparative
performance evaluation demonstrating both appropriate execution times for
real-world settings, and a promising personal data detection accuracy
outperforming existing proprietary tools in public clouds.
- Abstract(参考訳): クラウドネイティブなシステムは、多数の並列データストア(リレーショナルデータベースや非リレーショナルデータベースなど)を通じて、大量の個人データを処理しています。
プライバシエンジニアリングの観点からは、欧州一般データ保護規則のような規制フレームワークが要求するように、個人情報が格納されているすべての正確な場所を追跡することが、重要な課題である。
本稿では,ティレシア(teiresias)について述べる。
一 安静時の個人データのスケーラブルな発見のためのワークフローパターン
ii) クラウドネイティブなシステムアーキテクチャと,そのワークフローパターンのオープンソースプロトタイプ実装。
この目的のために、DevOps/DevPrivOpsプラクティスに従って、透明性と説明責任を特徴とする個人データの継続的なインベントリを可能にします。
特に、バージョン管理されたインフラストラクチャをコード定義、クラウドベースのストレージ、プロセスをどのようにci/cdパイプラインに統合するかを対象としています。
その後は
三 実世界の設定に適切な実行時間と、クラウド上の既存のプロプライエタリツールに匹敵する有望な個人データ検出精度の両方を示す比較性能評価。
関連論文リスト
- Enhancing Pavement Sensor Data Acquisition for AI-Driven Transportation Research [1.22995445255292]
本稿では,交通センサデータ管理のための包括的ガイドラインを提案する。
アーカイブされた静的データとリアルタイムデータストリームの両方をカバーする。
この提案は、I-65とI-69グリーンフィールドを含むINDOTの現実世界のケーススタディに適用された。
論文 参考訳(メタデータ) (2025-02-20T03:37:46Z) - Object as a Service: Simplifying Cloud-Native Development through Serverless Object Abstraction [1.7416288134936873]
我々は、アプリケーションデータと関数をクラウドオブジェクトの抽象化にカプセル化する、Object as a Service (O)と呼ばれる新しいパラダイムを提案する。
Oは、組み込み最適化機能を提供しながら、開発者がリソースとデータ管理の負担を軽減します。
我々は、一貫性とフォールトトレラント保証を備えた構造化データと非構造化データの状態抽象化を提供する、Oparacaという名前のプラットフォームを開発した。
論文 参考訳(メタデータ) (2024-08-09T06:55:00Z) - PeFAD: A Parameter-Efficient Federated Framework for Time Series Anomaly Detection [51.20479454379662]
私たちはaを提案します。
フェデレートされた異常検出フレームワークであるPeFADは、プライバシーの懸念が高まっている。
我々は、4つの実際のデータセットに対して広範な評価を行い、PeFADは既存の最先端ベースラインを最大28.74%上回っている。
論文 参考訳(メタデータ) (2024-06-04T13:51:08Z) - Federated Learning Empowered by Generative Content [55.576885852501775]
フェデレートラーニング(FL)は、プライバシ保護方法でモデルのトレーニングに分散プライベートデータを活用可能にする。
本稿では,FedGCと呼ばれる新しいFLフレームワークを提案する。
我々は、さまざまなベースライン、データセット、シナリオ、モダリティをカバーする、FedGCに関する体系的な実証的研究を行う。
論文 参考訳(メタデータ) (2023-12-10T07:38:56Z) - Hawk: DevOps-driven Transparency and Accountability in Cloud Native
Systems [0.0]
透明性は現代のプライバシー規制の最も重要な原則の1つである。
データコントローラは、個人データの収集、処理、保管、転送に関する正確な情報を提供する必要がある。
論文 参考訳(メタデータ) (2023-06-04T22:09:42Z) - Privacy-Preserving Machine Learning for Collaborative Data Sharing via
Auto-encoder Latent Space Embeddings [57.45332961252628]
データ共有プロセスにおけるプライバシ保護機械学習は、極めて重要なタスクである。
本稿では、オートエンコーダによる表現学習を用いて、プライバシーを保護した組込みデータを生成する革新的なフレームワークを提案する。
論文 参考訳(メタデータ) (2022-11-10T17:36:58Z) - Private Set Generation with Discriminative Information [63.851085173614]
異なるプライベートなデータ生成は、データプライバシの課題に対する有望な解決策である。
既存のプライベートな生成モデルは、合成サンプルの有用性に苦慮している。
我々は,最先端アプローチのサンプルユーティリティを大幅に改善する,シンプルで効果的な手法を提案する。
論文 参考訳(メタデータ) (2022-11-07T10:02:55Z) - Outsourcing Training without Uploading Data via Efficient Collaborative
Open-Source Sampling [49.87637449243698]
従来のアウトソーシングでは、デバイスデータをクラウドサーバにアップロードする必要がある。
我々は、公開および異種ソースから収集された膨大なデータセットである、広く利用可能なオープンソースデータを活用することを提案する。
我々は,オープンソースデータからクラウドトレーニングのためのプロキシデータセットを構築するための,ECOS(Efficient Collaborative Open-source Sampling)と呼ばれる新しい戦略を開発した。
論文 参考訳(メタデータ) (2022-10-23T00:12:18Z) - Reasoning over Public and Private Data in Retrieval-Based Systems [29.515915401413334]
State-of-the-artシステムは、回答を生成する前に、背景コーパスからユーザ質問に関連する情報を明示的に検索する。
今日の検索システムは、コーパスが完全にアクセス可能であることを前提としているが、ユーザーはプライベートデータを公開データをホストするエンティティに公開することを望んでいないことが多い。
PAIR(Public-PRIVATE AUTOREGRESSIVE Information RetriEVAL) のプライバシ・フレームワークを,複数のプライバシ・スコープにまたがる新規検索設定のために最初に定義する。
論文 参考訳(メタデータ) (2022-03-14T13:08:51Z) - On-Device Learning with Cloud-Coordinated Data Augmentation for Extreme
Model Personalization in Recommender Systems [39.41506296601779]
我々は、純粋にクラウドベースの学習とデバイス上での学習のジレンマを解消するために、CoDAと呼ばれる新しいデバイス-クラウド協調学習フレームワークを提案する。
CoDAはクラウドのグローバルプールから同様のサンプルを取得し、各ユーザのローカルデータセットを拡張してレコメンデーションモデルをトレーニングする。
オンラインA/Bテストの結果は、モデルパーソナライゼーションなしのクラウドベースの学習と、データ拡張なしのデバイス上でのトレーニングの両方に対して、CoDAの顕著なパフォーマンス向上を示している。
論文 参考訳(メタデータ) (2022-01-24T04:59:04Z) - Unsupervised Model Personalization while Preserving Privacy and
Scalability: An Open Problem [55.21502268698577]
本研究では,非教師なしモデルパーソナライゼーションの課題について検討する。
この問題を探求するための新しいDual User-Adaptation Framework(DUA)を提供する。
このフレームワークは、サーバ上のモデルパーソナライズとユーザデバイス上のローカルデータ正規化に柔軟にユーザ適応を分散させる。
論文 参考訳(メタデータ) (2020-03-30T09:35:12Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。