論文の概要: GlucoSynth: Generating Differentially-Private Synthetic Glucose Traces
- arxiv url: http://arxiv.org/abs/2303.01621v1
- Date: Thu, 2 Mar 2023 23:08:31 GMT
- ステータス: 処理完了
- システム内更新日: 2023-03-06 16:37:14.984470
- Title: GlucoSynth: Generating Differentially-Private Synthetic Glucose Traces
- Title(参考訳): グルコシンス(GlucoSynth:GlucoSynth:GlucoSynth)
- Authors: Josephine Lamp, Mark Derdzinski, Christopher Hannemann, Joost van der
Linden, Lu Feng, Tianhao Wang, David Evans
- Abstract要約: 本稿では,Gluco Synthについて紹介する。Gluco Synthは,合成グルコーストレースを生成するための新しいプライバシー保護GANフレームワークである。
差分プライバシーをフレームワークに統合し、強力な正式なプライバシー保証を提供します。
- 参考スコア(独自算出の注目度): 9.476514532285345
- License: http://creativecommons.org/licenses/by-nc-nd/4.0/
- Abstract: In this paper we focus on the problem of generating high-quality, private
synthetic glucose traces, a task generalizable to many other time series
sources. Existing methods for time series data synthesis, such as those using
Generative Adversarial Networks (GANs), are not able to capture the innate
characteristics of glucose data and, in terms of privacy, either do not include
any formal privacy guarantees or, in order to uphold a strong formal privacy
guarantee, severely degrade the utility of the synthetic data. Therefore, in
this paper we present GlucoSynth, a novel privacy-preserving GAN framework to
generate synthetic glucose traces. The core intuition in our approach is to
conserve relationships amongst motifs (glucose events) within the traces, in
addition to typical temporal dynamics. Moreover, we integrate differential
privacy into the framework to provide strong formal privacy guarantees.
Finally, we provide a comprehensive evaluation on the real-world utility of the
data using 1.2 million glucose traces
- Abstract(参考訳): 本稿では,他の多くの時系列ソースに一般化可能な課題である,高品質でプライベートな合成グルコーストレースの生成問題に焦点をあてる。
GAN(Generative Adversarial Networks)のような時系列データ合成の既存の方法は、グルコースデータの固有の特性を捉えることができず、プライバシに関しては、正式なプライバシ保証を一切含まないか、あるいは強力な正式なプライバシ保証を保持するために、合成データの有用性を著しく低下させる。
そこで本稿では,合成グルコーストレースを生成するための新しいプライバシ保存ganフレームワークglucosynthを提案する。
我々のアプローチの中核的な直感は、典型的な時間的ダイナミクスに加えて、トレース内のモチーフ(グルコースイベント)間の関係を保存することである。
さらに、差分プライバシーをフレームワークに統合し、強力な正式なプライバシー保証を提供します。
最後に,120万のグルコーストレースを用いた実世界のデータの有用性に関する包括的評価を行う。
関連論文リスト
- Protect and Extend -- Using GANs for Synthetic Data Generation of
Time-Series Medical Records [1.9749268648715583]
本研究は、認知症患者の時系列合成医療記録を生成するために、現在最先端のGANベースの合成データ生成モデルと比較する。
本実験は,プライバシ保護に関する他のモデルよりも,プライバシ保護GAN(PPGAN)モデルの方が優れていることを示す。
論文 参考訳(メタデータ) (2024-02-21T10:24:34Z) - Generating Synthetic Health Sensor Data for Privacy-Preserving Wearable
Stress Detection [1.529040771430363]
ストレスの瞬間に関連するマルチセンサ型スマートウォッチのヘルスリーダーのプライバシ・アウェア・シンセサイザー化について紹介する。
我々の手法はGAN(Generative Adversarial Networks)による合成シーケンスデータの生成を伴う。
非プライベート (0.45% F1) とプライベート (11.90-15.48% F1) のトレーニングシナリオの両方において、モデル性能の改善を観察する。
論文 参考訳(メタデータ) (2024-01-24T09:44:57Z) - Fast and Functional Structured Data Generators Rooted in
Out-of-Equilibrium Physics [62.997667081978825]
エネルギーモデルを用いて、構造化データセットで高品質なラベル特化データを生成するという課題に対処する。
伝統的な訓練方法は、マルコフ連鎖モンテカルロ混合による困難に遭遇する。
非平衡効果を利用した新しいトレーニングアルゴリズムを用いる。
論文 参考訳(メタデータ) (2023-07-13T15:08:44Z) - Beyond Privacy: Navigating the Opportunities and Challenges of Synthetic
Data [91.52783572568214]
合成データは、機械学習の世界において支配的な力となり、データセットを個々のニーズに合わせて調整できる未来を約束する。
合成データのより広範な妥当性と適用のために,コミュニティが克服すべき根本的な課題について論じる。
論文 参考訳(メタデータ) (2023-04-07T16:38:40Z) - Differentially Private Diffusion Models Generate Useful Synthetic Images [53.94025967603649]
近年の研究では、いくつかの拡散モデルの出力がトレーニングデータのプライバシを保持していないことが報告されている。
CIFAR-10 と Camelyon17 のSOTA 結果を得た。
以上の結果から,差分プライバシーで微調整された拡散モデルが有用かつ実証可能なプライベートな合成データを生成できることが示唆された。
論文 参考訳(メタデータ) (2023-02-27T15:02:04Z) - Synthcity: facilitating innovative use cases of synthetic data in
different data modalities [86.52703093858631]
Synthcityは、MLフェアネス、プライバシ、拡張における合成データの革新的なユースケースのための、オープンソースのソフトウェアパッケージである。
Synthcityは、実践者に対して、合成データにおける最先端の研究とツールへの単一のアクセスポイントを提供する。
論文 参考訳(メタデータ) (2023-01-18T14:49:54Z) - Synthetic Text Generation with Differential Privacy: A Simple and
Practical Recipe [32.63295550058343]
テキスト領域におけるシンプルで実用的なレシピは、強力なプライバシー保護を備えた有用な合成テキストを生成するのに有効であることを示す。
提案手法は,非私的テキストと実用性で競合する合成テキストを生成する。
論文 参考訳(メタデータ) (2022-10-25T21:21:17Z) - Delving into High-Quality Synthetic Face Occlusion Segmentation Datasets [83.749895930242]
そこで本研究では,高品質な自然主義的合成隠蔽顔を製造するための2つの手法を提案する。
両手法の有効性とロバスト性を実証的に示す。
我々は,RealOccとRealOcc-Wildという,微細なアノテーションを付加した高精細な実世界の顔データセットを2つ提示する。
論文 参考訳(メタデータ) (2022-05-12T17:03:57Z) - Enabling Synthetic Data adoption in regulated domains [1.9512796489908306]
Model-CentricからData-Centricへの転換は、アルゴリズムよりもデータとその品質に重点を置いている。
特に、高度に規制されたシナリオにおける情報のセンシティブな性質を考慮する必要がある。
このようなコンウンドラムをバイパスする巧妙な方法は、生成プロセスから得られたデータであるSynthetic Dataに依存し、実際のデータプロパティを学習する。
論文 参考訳(メタデータ) (2022-04-13T10:53:54Z) - Hide-and-Seek Privacy Challenge [88.49671206936259]
NeurIPS 2020 Hide-and-Seek Privacy Challengeは、両方の問題を解決するための新しい2トラックの競争だ。
我々の頭から頭までのフォーマットでは、新しい高品質な集中ケア時系列データセットを用いて、合成データ生成トラック(「ヒッシャー」)と患者再識別トラック(「シーカー」)の参加者が直接対決する。
論文 参考訳(メタデータ) (2020-07-23T15:50:59Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。