論文の概要: GlucoSynth: Generating Differentially-Private Synthetic Glucose Traces
- arxiv url: http://arxiv.org/abs/2303.01621v3
- Date: Fri, 27 Oct 2023 18:28:22 GMT
- ステータス: 処理完了
- システム内更新日: 2023-10-31 23:19:17.397950
- Title: GlucoSynth: Generating Differentially-Private Synthetic Glucose Traces
- Title(参考訳): グルコシンス(GlucoSynth:GlucoSynth:GlucoSynth)
- Authors: Josephine Lamp, Mark Derdzinski, Christopher Hannemann, Joost van der
Linden, Lu Feng, Tianhao Wang, David Evans
- Abstract要約: 本稿では,Gluco Synthについて紹介する。Gluco Synthは,合成グルコーストレースを生成するための新しいプライバシー保護GANフレームワークである。
当社のフレームワークは、強力な形式的なプライバシ保証を提供するために、差分プライバシメカニズムを組み込んでいる。
我々は,120万のグルコーストレースを用いて,実世界のデータの有用性を総合的に評価する。
- 参考スコア(独自算出の注目度): 8.54024975108641
- License: http://creativecommons.org/licenses/by-nc-nd/4.0/
- Abstract: We focus on the problem of generating high-quality, private synthetic glucose
traces, a task generalizable to many other time series sources. Existing
methods for time series data synthesis, such as those using Generative
Adversarial Networks (GANs), are not able to capture the innate characteristics
of glucose data and cannot provide any formal privacy guarantees without
severely degrading the utility of the synthetic data. In this paper we present
GlucoSynth, a novel privacy-preserving GAN framework to generate synthetic
glucose traces. The core intuition behind our approach is to conserve
relationships amongst motifs (glucose events) within the traces, in addition to
temporal dynamics. Our framework incorporates differential privacy mechanisms
to provide strong formal privacy guarantees. We provide a comprehensive
evaluation on the real-world utility of the data using 1.2 million glucose
traces; GlucoSynth outperforms all previous methods in its ability to generate
high-quality synthetic glucose traces with strong privacy guarantees.
- Abstract(参考訳): 我々は,高品質でプライベートな合成グルコーストレースを生成するという課題に焦点をあてる。
GAN(Generative Adversarial Networks)のような既存の時系列データ合成手法では、グルコースデータの固有の特性を捉えることができず、合成データの利便性を著しく低下させることなく、正式なプライバシー保証を提供することはできない。
本稿では,合成グルコーストレースを生成するための新しいプライバシ保存ganフレームワークglucosynthを提案する。
このアプローチの背後にある中核的な直感は、時間的ダイナミクスに加えて、トレース内のモチーフ(グルコースイベント)間の関係を保存することである。
我々のフレームワークは、強力な正式なプライバシー保証を提供するために、差分プライバシー機構を組み込んでいる。
glucosynthは、強力なプライバシ保証によって高品質な合成グルコーストレースを生成する能力において、これまでのすべての方法よりも優れています。
関連論文リスト
- From Glucose Patterns to Health Outcomes: A Generalizable Foundation Model for Continuous Glucose Monitor Data Analysis [50.80532910808962]
GluFormerは、トランスフォーマーアーキテクチャに基づく生体医学的時間的データの生成基盤モデルである。
GluFormerは5つの地理的領域にまたがる4936人を含む15の異なる外部データセットに一般化されている。
今後4年間の健康状態も予測できる。
論文 参考訳(メタデータ) (2024-08-20T13:19:06Z) - Mitigating the Privacy Issues in Retrieval-Augmented Generation (RAG) via Pure Synthetic Data [51.41288763521186]
Retrieval-augmented Generation (RAG)は、外部知識ソースから取得した関連情報を統合することにより、言語モデルの出力を強化する。
RAGシステムは、プライベートデータを取得する際に深刻なプライバシーリスクに直面する可能性がある。
検索データに対するプライバシー保護の代替として,合成データを用いる方法を提案する。
論文 参考訳(メタデータ) (2024-06-20T22:53:09Z) - Toward Short-Term Glucose Prediction Solely Based on CGM Time Series [4.7066018521459725]
TimeGluは、CGM時系列データに基づく短期的なグルコース予測のためのエンドツーエンドパイプラインである。
患者の個人データを追加することなく、最先端のパフォーマンスを達成する。
論文 参考訳(メタデータ) (2024-04-18T06:02:12Z) - Best Practices and Lessons Learned on Synthetic Data [83.63271573197026]
AIモデルの成功は、大規模で多様な、高品質なデータセットの可用性に依存している。
合成データは、現実世界のパターンを模倣する人工データを生成することによって、有望なソリューションとして現れてきた。
論文 参考訳(メタデータ) (2024-04-11T06:34:17Z) - Protect and Extend -- Using GANs for Synthetic Data Generation of
Time-Series Medical Records [1.9749268648715583]
本研究は、認知症患者の時系列合成医療記録を生成するために、現在最先端のGANベースの合成データ生成モデルと比較する。
本実験は,プライバシ保護に関する他のモデルよりも,プライバシ保護GAN(PPGAN)モデルの方が優れていることを示す。
論文 参考訳(メタデータ) (2024-02-21T10:24:34Z) - Fast and Functional Structured Data Generators Rooted in
Out-of-Equilibrium Physics [62.997667081978825]
エネルギーモデルを用いて、構造化データセットで高品質なラベル特化データを生成するという課題に対処する。
伝統的な訓練方法は、マルコフ連鎖モンテカルロ混合による困難に遭遇する。
非平衡効果を利用した新しいトレーニングアルゴリズムを用いる。
論文 参考訳(メタデータ) (2023-07-13T15:08:44Z) - Synthcity: facilitating innovative use cases of synthetic data in
different data modalities [86.52703093858631]
Synthcityは、MLフェアネス、プライバシ、拡張における合成データの革新的なユースケースのための、オープンソースのソフトウェアパッケージである。
Synthcityは、実践者に対して、合成データにおける最先端の研究とツールへの単一のアクセスポイントを提供する。
論文 参考訳(メタデータ) (2023-01-18T14:49:54Z) - Synthetic Text Generation with Differential Privacy: A Simple and
Practical Recipe [32.63295550058343]
テキスト領域におけるシンプルで実用的なレシピは、強力なプライバシー保護を備えた有用な合成テキストを生成するのに有効であることを示す。
提案手法は,非私的テキストと実用性で競合する合成テキストを生成する。
論文 参考訳(メタデータ) (2022-10-25T21:21:17Z) - Enabling Synthetic Data adoption in regulated domains [1.9512796489908306]
Model-CentricからData-Centricへの転換は、アルゴリズムよりもデータとその品質に重点を置いている。
特に、高度に規制されたシナリオにおける情報のセンシティブな性質を考慮する必要がある。
このようなコンウンドラムをバイパスする巧妙な方法は、生成プロセスから得られたデータであるSynthetic Dataに依存し、実際のデータプロパティを学習する。
論文 参考訳(メタデータ) (2022-04-13T10:53:54Z) - Hide-and-Seek Privacy Challenge [88.49671206936259]
NeurIPS 2020 Hide-and-Seek Privacy Challengeは、両方の問題を解決するための新しい2トラックの競争だ。
我々の頭から頭までのフォーマットでは、新しい高品質な集中ケア時系列データセットを用いて、合成データ生成トラック(「ヒッシャー」)と患者再識別トラック(「シーカー」)の参加者が直接対決する。
論文 参考訳(メタデータ) (2020-07-23T15:50:59Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。