Fugu-MT 論文翻訳(概要): Scalable Discovery and Continuous Inventory of Personal Data at Rest in Cloud Native Systems

論文の概要: Scalable Discovery and Continuous Inventory of Personal Data at Rest in Cloud Native Systems

arxiv url: http://arxiv.org/abs/2209.10412v1
Date: Fri, 9 Sep 2022 10:45:34 GMT
ステータス: 翻訳完了
システム内更新日: 2023-02-19 11:18:12.897679
Title: Scalable Discovery and Continuous Inventory of Personal Data at Rest in Cloud Native Systems
Title（参考訳）: クラウドネイティブシステムにおけるスケーラブルな発見と個人データの継続的インベントリ
Authors: Elias Gr\"unewald and Leonard Schurbert
Abstract要約: クラウドネイティブシステムは、多数の多パラダイムデータストアを通じて大量の個人データを処理している。プライバシーエンジニアリングの観点では、個人情報が保存されているすべての正確な場所を追跡することが重要な課題だ。 i) 個人データの安静時のスケーラブルな発見のためのワークフローパターンと,i) クラウドネイティブシステムアーキテクチャと,そのワークフローパターンのオープンソースプロトタイプ実装からなるTeresiasを提案する。
参考スコア（独自算出の注目度）: 0.0
License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
Abstract: Cloud native systems are processing large amounts of personal data through numerous and possibly multi-paradigmatic data stores (e.g., relational and non-relational databases). From a privacy engineering perspective, a core challenge is to keep track of all exact locations, where personal data is being stored, as required by regulatory frameworks such as the European General Data Protection Regulation. In this paper, we present Teiresias, comprising i) a workflow pattern for scalable discovery of personal data at rest, and ii) a cloud native system architecture and open source prototype implementation of said workflow pattern. To this end, we enable a continuous inventory of personal data featuring transparency and accountability following DevOps/DevPrivOps practices. In particular, we scope version-controlled Infrastructure as Code definitions, cloud-based storages, and how to integrate the process into CI/CD pipelines. Thereafter, we provide iii) a comparative performance evaluation demonstrating both appropriate execution times for real-world settings, and a promising personal data detection accuracy outperforming existing proprietary tools in public clouds.
Abstract（参考訳）: クラウドネイティブなシステムは、多数の並列データストア(リレーショナルデータベースや非リレーショナルデータベースなど)を通じて、大量の個人データを処理しています。プライバシエンジニアリングの観点からは、欧州一般データ保護規則のような規制フレームワークが要求するように、個人情報が格納されているすべての正確な場所を追跡することが、重要な課題である。本稿では,ティレシア(teiresias)について述べる。一安静時の個人データのスケーラブルな発見のためのワークフローパターン ii) クラウドネイティブなシステムアーキテクチャと,そのワークフローパターンのオープンソースプロトタイプ実装。この目的のために、DevOps/DevPrivOpsプラクティスに従って、透明性と説明責任を特徴とする個人データの継続的なインベントリを可能にします。特に、バージョン管理されたインフラストラクチャをコード定義、クラウドベースのストレージ、プロセスをどのようにci/cdパイプラインに統合するかを対象としています。その後は三実世界の設定に適切な実行時間と、クラウド上の既存のプロプライエタリツールに匹敵する有望な個人データ検出精度の両方を示す比較性能評価。

関連論文リスト

Governing Cloud Data Pipelines with Agentic AI [0.0]
Agentic Cloud Data Engineeringは、バウンドAIエージェントをクラウドデータパイプラインのガバナンスとコントロールプレーンに統合する、ポリシー対応のコントロールアーキテクチャである。 Agentic Cloud Data Engineeringプラットフォームは、平均パイプラインリカバリ時間を最大45%削減し、運用コストを約25%削減し、静的オーケストレーションと比較して手動の介入イベントを70%以上削減する。
論文参考訳（メタデータ） (2025-12-24T19:30:32Z)
CPSLint: A Domain-Specific Language Providing Data Validation and Sanitisation for Industrial Cyber-Physical Systems [0.5499796332553707]
本稿では,産業用CPSのデータ準備を目的としたドメイン特化言語CPSLintを紹介する。主な機能は型チェックとデータ列の検証と修正による制約の強制である。より高度な機能は、カラムワイドと行ワイドの両方で追加のCPS固有のデータ構造を推測する。
論文参考訳（メタデータ） (2025-10-21T13:59:56Z)
CoSteer: Collaborative Decoding-Time Personalization via Local Delta Steering [68.91862701376155]
CoSteerは、ローカライズされたデルタステアリングを通じてデコード時のパーソナライズを可能にする、新しいコラボレーティブフレームワークである。トークンレベルの最適化をオンライン学習問題として定式化し、ローカルデルタベクトルがリモートLLMのロジットを動的に調整する。このアプローチは、生のデータや中間ベクトルではなく、最後のステアリングトークンのみを送信することで、プライバシを保護します。
論文参考訳（メタデータ） (2025-07-07T08:32:29Z)
PyTupli: A Scalable Infrastructure for Collaborative Offline Reinforcement Learning Projects [5.744272697629195]
オフライン強化学習(RL)は,事前収集データから制御ポリシを学習するための強力なパラダイムとして注目を集めている。 PyTupliはPythonベースのツールで、ベンチマーク環境の作成、ストレージ、普及を効率化する。
論文参考訳（メタデータ） (2025-05-22T14:59:20Z)
Do You Really Need Public Data? Surrogate Public Data for Differential Privacy on Tabular Data [10.1687640711587]
これは、プライバシ損失の予算を消費せず、公開スキーマやメタデータからのみ構築される。大規模言語モデル(LLM)を用いたサロゲート公開データ生成プロセスを自動化する。特に,CSVファイルとして直接レコード生成を行う方法と,サンプリングのための自動構造因果モデル(SCM)の構築を提案する。
論文参考訳（メタデータ） (2025-04-19T17:55:10Z)
Enhancing Pavement Sensor Data Acquisition for AI-Driven Transportation Research [1.22995445255292]
本稿では,交通センサデータ管理のための包括的ガイドラインを提案する。アーカイブされた静的データとリアルタイムデータストリームの両方をカバーする。この提案は、I-65とI-69グリーンフィールドを含むINDOTの現実世界のケーススタディに適用された。
論文参考訳（メタデータ） (2025-02-20T03:37:46Z)
Data-Juicer 2.0: Cloud-Scale Adaptive Data Processing for and with Foundation Models [64.28420991770382]
Data-Juicer 2.0は、テキスト、画像、ビデオ、オーディオのモダリティにまたがるデータ処理オペレーターがバックアップするデータ処理システムである。データ分析、アノテーション、基礎モデルポストトレーニングなど、より重要なタスクをサポートする。さまざまな研究分野やAlibaba Cloud PAIのような現実世界の製品で広く採用されている。
論文参考訳（メタデータ） (2024-12-23T08:29:57Z)
Object as a Service: Simplifying Cloud-Native Development through Serverless Object Abstraction [1.7416288134936873]
我々は、アプリケーションデータと関数をクラウドオブジェクトの抽象化にカプセル化する、Object as a Service (O)と呼ばれる新しいパラダイムを提案する。 Oは、組み込み最適化機能を提供しながら、開発者がリソースとデータ管理の負担を軽減します。我々は、一貫性とフォールトトレラント保証を備えた構造化データと非構造化データの状態抽象化を提供する、Oparacaという名前のプラットフォームを開発した。
論文参考訳（メタデータ） (2024-08-09T06:55:00Z)
PeFAD: A Parameter-Efficient Federated Framework for Time Series Anomaly Detection [51.20479454379662]
私たちはaを提案します。フェデレートされた異常検出フレームワークであるPeFADは、プライバシーの懸念が高まっている。我々は、4つの実際のデータセットに対して広範な評価を行い、PeFADは既存の最先端ベースラインを最大28.74%上回っている。
論文参考訳（メタデータ） (2024-06-04T13:51:08Z)
ST-DPGAN: A Privacy-preserving Framework for Spatiotemporal Data Generation [19.18074489351738]
プライバシー保護データを生成するグラフモデルを提案する。 3つの実時間データセットを用いて実験を行い,本モデルの有効性を検証した。生成されたデータに基づいてトレーニングされた予測モデルは、元のデータでトレーニングされたモデルと比較して、競争力のあるエッジを維持している。
論文参考訳（メタデータ） (2024-06-04T04:43:54Z)
Federated Learning Empowered by Generative Content [55.576885852501775]
フェデレートラーニング(FL)は、プライバシ保護方法でモデルのトレーニングに分散プライベートデータを活用可能にする。本稿では,FedGCと呼ばれる新しいFLフレームワークを提案する。我々は、さまざまなベースライン、データセット、シナリオ、モダリティをカバーする、FedGCに関する体系的な実証的研究を行う。
論文参考訳（メタデータ） (2023-12-10T07:38:56Z)
Hawk: DevOps-driven Transparency and Accountability in Cloud Native Systems [0.0]
透明性は現代のプライバシー規制の最も重要な原則の1つである。データコントローラは、個人データの収集、処理、保管、転送に関する正確な情報を提供する必要がある。
論文参考訳（メタデータ） (2023-06-04T22:09:42Z)
Privacy-Preserving Machine Learning for Collaborative Data Sharing via Auto-encoder Latent Space Embeddings [57.45332961252628]
データ共有プロセスにおけるプライバシ保護機械学習は、極めて重要なタスクである。本稿では、オートエンコーダによる表現学習を用いて、プライバシーを保護した組込みデータを生成する革新的なフレームワークを提案する。
論文参考訳（メタデータ） (2022-11-10T17:36:58Z)
Private Set Generation with Discriminative Information [63.851085173614]
異なるプライベートなデータ生成は、データプライバシの課題に対する有望な解決策である。既存のプライベートな生成モデルは、合成サンプルの有用性に苦慮している。我々は,最先端アプローチのサンプルユーティリティを大幅に改善する,シンプルで効果的な手法を提案する。
論文参考訳（メタデータ） (2022-11-07T10:02:55Z)
Outsourcing Training without Uploading Data via Efficient Collaborative Open-Source Sampling [49.87637449243698]
従来のアウトソーシングでは、デバイスデータをクラウドサーバにアップロードする必要がある。我々は、公開および異種ソースから収集された膨大なデータセットである、広く利用可能なオープンソースデータを活用することを提案する。我々は,オープンソースデータからクラウドトレーニングのためのプロキシデータセットを構築するための,ECOS(Efficient Collaborative Open-source Sampling)と呼ばれる新しい戦略を開発した。
論文参考訳（メタデータ） (2022-10-23T00:12:18Z)
Reasoning over Public and Private Data in Retrieval-Based Systems [29.515915401413334]
State-of-the-artシステムは、回答を生成する前に、背景コーパスからユーザ質問に関連する情報を明示的に検索する。今日の検索システムは、コーパスが完全にアクセス可能であることを前提としているが、ユーザーはプライベートデータを公開データをホストするエンティティに公開することを望んでいないことが多い。 PAIR(Public-PRIVATE AUTOREGRESSIVE Information RetriEVAL) のプライバシ・フレームワークを,複数のプライバシ・スコープにまたがる新規検索設定のために最初に定義する。
論文参考訳（メタデータ） (2022-03-14T13:08:51Z)
On-Device Learning with Cloud-Coordinated Data Augmentation for Extreme Model Personalization in Recommender Systems [39.41506296601779]
我々は、純粋にクラウドベースの学習とデバイス上での学習のジレンマを解消するために、CoDAと呼ばれる新しいデバイス-クラウド協調学習フレームワークを提案する。 CoDAはクラウドのグローバルプールから同様のサンプルを取得し、各ユーザのローカルデータセットを拡張してレコメンデーションモデルをトレーニングする。オンラインA/Bテストの結果は、モデルパーソナライゼーションなしのクラウドベースの学習と、データ拡張なしのデバイス上でのトレーニングの両方に対して、CoDAの顕著なパフォーマンス向上を示している。
論文参考訳（メタデータ） (2022-01-24T04:59:04Z)
Unsupervised Model Personalization while Preserving Privacy and Scalability: An Open Problem [55.21502268698577]
本研究では,非教師なしモデルパーソナライゼーションの課題について検討する。この問題を探求するための新しいDual User-Adaptation Framework(DUA)を提供する。このフレームワークは、サーバ上のモデルパーソナライズとユーザデバイス上のローカルデータ正規化に柔軟にユーザ適応を分散させる。
論文参考訳（メタデータ） (2020-03-30T09:35:12Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。