論文の概要: Hide-and-Seek Privacy Challenge
- arxiv url: http://arxiv.org/abs/2007.12087v2
- Date: Fri, 24 Jul 2020 17:10:18 GMT
- ステータス: 処理完了
- システム内更新日: 2022-11-07 12:11:31.137535
- Title: Hide-and-Seek Privacy Challenge
- Title(参考訳): 隠れて見るプライバシー問題
- Authors: James Jordon, Daniel Jarrett, Jinsung Yoon, Tavian Barnes, Paul
Elbers, Patrick Thoral, Ari Ercole, Cheng Zhang, Danielle Belgrave and
Mihaela van der Schaar
- Abstract要約: NeurIPS 2020 Hide-and-Seek Privacy Challengeは、両方の問題を解決するための新しい2トラックの競争だ。
我々の頭から頭までのフォーマットでは、新しい高品質な集中ケア時系列データセットを用いて、合成データ生成トラック(「ヒッシャー」)と患者再識別トラック(「シーカー」)の参加者が直接対決する。
- 参考スコア(独自算出の注目度): 88.49671206936259
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: The clinical time-series setting poses a unique combination of challenges to
data modeling and sharing. Due to the high dimensionality of clinical time
series, adequate de-identification to preserve privacy while retaining data
utility is difficult to achieve using common de-identification techniques. An
innovative approach to this problem is synthetic data generation. From a
technical perspective, a good generative model for time-series data should
preserve temporal dynamics, in the sense that new sequences respect the
original relationships between high-dimensional variables across time. From the
privacy perspective, the model should prevent patient re-identification by
limiting vulnerability to membership inference attacks. The NeurIPS 2020
Hide-and-Seek Privacy Challenge is a novel two-tracked competition to
simultaneously accelerate progress in tackling both problems. In our
head-to-head format, participants in the synthetic data generation track (i.e.
"hiders") and the patient re-identification track (i.e. "seekers") are directly
pitted against each other by way of a new, high-quality intensive care
time-series dataset: the AmsterdamUMCdb dataset. Ultimately, we seek to advance
generative techniques for dense and high-dimensional temporal data streams that
are (1) clinically meaningful in terms of fidelity and predictivity, as well as
(2) capable of minimizing membership privacy risks in terms of the concrete
notion of patient re-identification.
- Abstract(参考訳): 臨床時系列設定は、データモデリングと共有に固有の課題の組み合わせをもたらす。
臨床時系列の次元が高いため、データの有効性を維持しながらプライバシーを維持するための適切な非識別は、共通の非識別技術を用いて達成することは困難である。
この問題に対する革新的なアプローチは、合成データ生成である。
技術的な観点からは、時系列データの優れた生成モデルは、時間間の高次元変数間の元の関係を新しいシーケンスが尊重するという意味で、時間的ダイナミクスを保存すべきである。
プライバシの観点からは、脆弱性をメンバーシップ推論攻撃に限定することで、患者の再識別を防止する必要がある。
NeurIPS 2020 Hide-and-Seek Privacy Challengeは、両問題を同時に解決する新しい2トラックの競争だ。
私たちの頭から頭へのフォーマットでは、合成データ生成トラック(すなわち「ハイドラー」)と患者再識別トラック(すなわち「シーカー」)の参加者は、新たな高品質集中治療時系列データセットであるアムステルダムumcdbデータセットによって、直接対決されます。
最終的には,(1)忠実性と予測性の観点から臨床的に有意な,(2)患者の再同定という具体的な概念によって,会員プライバシーリスクを最小化することが可能な,高密度かつ高次元の時間データストリーム生成手法の進歩を目指す。
関連論文リスト
- Zero-shot and Few-shot Generation Strategies for Artificial Clinical Records [1.338174941551702]
本研究は,Llama 2 LLMが患者情報を正確に反映した合成医療記録を作成する能力を評価するものである。
筆者らは,MIMIC-IVデータセットから得られたデータを用いて,現在史の物語を生成することに重点を置いている。
このチェーン・オブ・シークレットのアプローチにより、ゼロショットモデルが、ルージュのメトリクス評価に基づいて、微調整されたモデルと同等の結果が得られることが示唆された。
論文 参考訳(メタデータ) (2024-03-13T16:17:09Z) - Protect and Extend -- Using GANs for Synthetic Data Generation of
Time-Series Medical Records [1.9749268648715583]
本研究は、認知症患者の時系列合成医療記録を生成するために、現在最先端のGANベースの合成データ生成モデルと比較する。
本実験は,プライバシ保護に関する他のモデルよりも,プライバシ保護GAN(PPGAN)モデルの方が優れていることを示す。
論文 参考訳(メタデータ) (2024-02-21T10:24:34Z) - MedDiffusion: Boosting Health Risk Prediction via Diffusion-based Data
Augmentation [58.93221876843639]
本稿では,MedDiffusion という,エンドツーエンドの拡散に基づくリスク予測モデルを提案する。
トレーニング中に合成患者データを作成し、サンプルスペースを拡大することで、リスク予測性能を向上させる。
ステップワイズ・アテンション・メカニズムを用いて患者の来訪者間の隠れた関係を識別し、高品質なデータを生成する上で最も重要な情報をモデルが自動的に保持することを可能にする。
論文 参考訳(メタデータ) (2023-10-04T01:36:30Z) - T-Phenotype: Discovering Phenotypes of Predictive Temporal Patterns in
Disease Progression [82.85825388788567]
我々は、ラベル付き時系列データから予測時相パターンの表現型を発見するために、新しい時間的クラスタリング手法T-Phenotypeを開発した。
T-フェノタイプは, 評価ベースラインのすべてに対して, 最良の表現型発見性能を示す。
論文 参考訳(メタデータ) (2023-02-24T13:30:35Z) - Differentially-Private Data Synthetisation for Efficient
Re-Identification Risk Control [2.3964255330849356]
$epsilon$-Private-SMOTEは、ノイズによって引き起こされる逆数による合成データ生成と高リスクケースの難読化を組み合わせたものだ。
プライバシのリスクと、生成ネットワーク、変分オートエンコーダ、差分プライバシーベースラインよりも優れた予測性能の競合的な結果を達成する。
論文 参考訳(メタデータ) (2022-12-01T13:20:37Z) - Delving into High-Quality Synthetic Face Occlusion Segmentation Datasets [83.749895930242]
そこで本研究では,高品質な自然主義的合成隠蔽顔を製造するための2つの手法を提案する。
両手法の有効性とロバスト性を実証的に示す。
我々は,RealOccとRealOcc-Wildという,微細なアノテーションを付加した高精細な実世界の顔データセットを2つ提示する。
論文 参考訳(メタデータ) (2022-05-12T17:03:57Z) - Generating Synthetic Mixed-type Longitudinal Electronic Health Records
for Artificial Intelligent Applications [9.374416143268892]
EHR-M-GAN (Generative Adversarial Network, GAN) は、EHRデータを合成する。
EHR-M-GANは,141,488名の患者を対象とし,3つの公用集中治療単位データベース上で検証した。
論文 参考訳(メタデータ) (2021-12-22T17:17:34Z) - Differentially Private Synthetic Medical Data Generation using
Convolutional GANs [7.2372051099165065]
R'enyiの差分プライバシーを用いた合成データ生成のための差分プライベートフレームワークを開発する。
提案手法は, 畳み込み自己エンコーダと畳み込み生成対向ネットワークを利用して, 生成した合成データの重要な特性をある程度保存する。
私たちのモデルは、同じプライバシー予算の下で既存の最新モデルを上回ることを実証します。
論文 参考訳(メタデータ) (2020-12-22T01:03:49Z) - DeepRite: Deep Recurrent Inverse TreatmEnt Weighting for Adjusting
Time-varying Confounding in Modern Longitudinal Observational Data [68.29870617697532]
時系列データにおける時間変化の相違に対するDeep Recurrent Inverse TreatmEnt重み付け(DeepRite)を提案する。
DeepRiteは、合成データから基底的真理を復元し、実際のデータから偏りのない処理効果を推定する。
論文 参考訳(メタデータ) (2020-10-28T15:05:08Z) - Temporal Phenotyping using Deep Predictive Clustering of Disease
Progression [97.88605060346455]
我々は、時系列データをクラスタリングするためのディープラーニングアプローチを開発し、各クラスタは、同様の将来的な結果を共有する患者から構成される。
2つの実世界のデータセットに対する実験により、我々のモデルは最先端のベンチマークよりも優れたクラスタリング性能が得られることが示された。
論文 参考訳(メタデータ) (2020-06-15T20:48:43Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。