論文の概要: Hide-and-Seek Privacy Challenge
- arxiv url: http://arxiv.org/abs/2007.12087v2
- Date: Fri, 24 Jul 2020 17:10:18 GMT
- ステータス: 処理完了
- システム内更新日: 2022-11-07 12:11:31.137535
- Title: Hide-and-Seek Privacy Challenge
- Title(参考訳): 隠れて見るプライバシー問題
- Authors: James Jordon, Daniel Jarrett, Jinsung Yoon, Tavian Barnes, Paul
Elbers, Patrick Thoral, Ari Ercole, Cheng Zhang, Danielle Belgrave and
Mihaela van der Schaar
- Abstract要約: NeurIPS 2020 Hide-and-Seek Privacy Challengeは、両方の問題を解決するための新しい2トラックの競争だ。
我々の頭から頭までのフォーマットでは、新しい高品質な集中ケア時系列データセットを用いて、合成データ生成トラック(「ヒッシャー」)と患者再識別トラック(「シーカー」)の参加者が直接対決する。
- 参考スコア(独自算出の注目度): 88.49671206936259
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: The clinical time-series setting poses a unique combination of challenges to
data modeling and sharing. Due to the high dimensionality of clinical time
series, adequate de-identification to preserve privacy while retaining data
utility is difficult to achieve using common de-identification techniques. An
innovative approach to this problem is synthetic data generation. From a
technical perspective, a good generative model for time-series data should
preserve temporal dynamics, in the sense that new sequences respect the
original relationships between high-dimensional variables across time. From the
privacy perspective, the model should prevent patient re-identification by
limiting vulnerability to membership inference attacks. The NeurIPS 2020
Hide-and-Seek Privacy Challenge is a novel two-tracked competition to
simultaneously accelerate progress in tackling both problems. In our
head-to-head format, participants in the synthetic data generation track (i.e.
"hiders") and the patient re-identification track (i.e. "seekers") are directly
pitted against each other by way of a new, high-quality intensive care
time-series dataset: the AmsterdamUMCdb dataset. Ultimately, we seek to advance
generative techniques for dense and high-dimensional temporal data streams that
are (1) clinically meaningful in terms of fidelity and predictivity, as well as
(2) capable of minimizing membership privacy risks in terms of the concrete
notion of patient re-identification.
- Abstract(参考訳): 臨床時系列設定は、データモデリングと共有に固有の課題の組み合わせをもたらす。
臨床時系列の次元が高いため、データの有効性を維持しながらプライバシーを維持するための適切な非識別は、共通の非識別技術を用いて達成することは困難である。
この問題に対する革新的なアプローチは、合成データ生成である。
技術的な観点からは、時系列データの優れた生成モデルは、時間間の高次元変数間の元の関係を新しいシーケンスが尊重するという意味で、時間的ダイナミクスを保存すべきである。
プライバシの観点からは、脆弱性をメンバーシップ推論攻撃に限定することで、患者の再識別を防止する必要がある。
NeurIPS 2020 Hide-and-Seek Privacy Challengeは、両問題を同時に解決する新しい2トラックの競争だ。
私たちの頭から頭へのフォーマットでは、合成データ生成トラック(すなわち「ハイドラー」)と患者再識別トラック(すなわち「シーカー」)の参加者は、新たな高品質集中治療時系列データセットであるアムステルダムumcdbデータセットによって、直接対決されます。
最終的には,(1)忠実性と予測性の観点から臨床的に有意な,(2)患者の再同定という具体的な概念によって,会員プライバシーリスクを最小化することが可能な,高密度かつ高次元の時間データストリーム生成手法の進歩を目指す。
関連論文リスト
- SeqRisk: Transformer-augmented latent variable model for improved survival prediction with longitudinal data [4.1476925904032464]
本研究では,変分オートエンコーダ (VAE) と長手VAE (LVAE) をトランスフォーマーエンコーダとコックス比例ハザードモジュールに結合してリスク予測を行う手法であるSeqRiskを提案する。
SeqRiskは、シミュレーションと実世界の両方のデータセットにおける既存のアプローチと比較して、競合的に機能することを示した。
論文 参考訳(メタデータ) (2024-09-19T12:35:25Z) - Mitigating the Privacy Issues in Retrieval-Augmented Generation (RAG) via Pure Synthetic Data [51.41288763521186]
Retrieval-augmented Generation (RAG)は、外部知識ソースから取得した関連情報を統合することにより、言語モデルの出力を強化する。
RAGシステムは、プライベートデータを取得する際に深刻なプライバシーリスクに直面する可能性がある。
検索データに対するプライバシー保護の代替として,合成データを用いる方法を提案する。
論文 参考訳(メタデータ) (2024-06-20T22:53:09Z) - Privacy-Preserving Heterogeneous Federated Learning for Sensitive Healthcare Data [12.30620268528346]
我々は、AAFV(Abstention-Aware Federated Voting)と呼ばれる新しいフレームワークを提案する。
AAFVは、データのプライバシを同時に保護しながら、共同で機密的に異質なローカルモデルをトレーニングすることができる。
特に,提案手法では,不均一な局所モデルから高信頼投票を選択するために,しきい値に基づく棄権方式を採用している。
論文 参考訳(メタデータ) (2024-06-15T08:43:40Z) - Second Edition FRCSyn Challenge at CVPR 2024: Face Recognition Challenge in the Era of Synthetic Data [104.45155847778584]
本稿では,合成データ時代における第2回顔認識チャレンジの概要について述べる。
FRCSynは、現在の技術的制限に対処するために、顔認識における合成データの使用について調査することを目的としている。
論文 参考訳(メタデータ) (2024-04-16T08:15:10Z) - Zero-shot and Few-shot Generation Strategies for Artificial Clinical Records [1.338174941551702]
本研究は,Llama 2 LLMが患者情報を正確に反映した合成医療記録を作成する能力を評価するものである。
筆者らは,MIMIC-IVデータセットから得られたデータを用いて,現在史の物語を生成することに重点を置いている。
このチェーン・オブ・シークレットのアプローチにより、ゼロショットモデルが、ルージュのメトリクス評価に基づいて、微調整されたモデルと同等の結果が得られることが示唆された。
論文 参考訳(メタデータ) (2024-03-13T16:17:09Z) - Protect and Extend -- Using GANs for Synthetic Data Generation of
Time-Series Medical Records [1.9749268648715583]
本研究は、認知症患者の時系列合成医療記録を生成するために、現在最先端のGANベースの合成データ生成モデルと比較する。
本実験は,プライバシ保護に関する他のモデルよりも,プライバシ保護GAN(PPGAN)モデルの方が優れていることを示す。
論文 参考訳(メタデータ) (2024-02-21T10:24:34Z) - T-Phenotype: Discovering Phenotypes of Predictive Temporal Patterns in
Disease Progression [82.85825388788567]
我々は、ラベル付き時系列データから予測時相パターンの表現型を発見するために、新しい時間的クラスタリング手法T-Phenotypeを開発した。
T-フェノタイプは, 評価ベースラインのすべてに対して, 最良の表現型発見性能を示す。
論文 参考訳(メタデータ) (2023-02-24T13:30:35Z) - Differentially-Private Data Synthetisation for Efficient Re-Identification Risk Control [3.8811062755861956]
$epsilon$-PrivateSMOTEは、再識別とリンケージ攻撃を防ぐためのテクニックである。
提案手法は,ノイズに起因した逆数による合成データ生成と,高リスクケースを難読化するための差分プライバシー原則を組み合わせたものである。
論文 参考訳(メタデータ) (2022-12-01T13:20:37Z) - Delving into High-Quality Synthetic Face Occlusion Segmentation Datasets [83.749895930242]
そこで本研究では,高品質な自然主義的合成隠蔽顔を製造するための2つの手法を提案する。
両手法の有効性とロバスト性を実証的に示す。
我々は,RealOccとRealOcc-Wildという,微細なアノテーションを付加した高精細な実世界の顔データセットを2つ提示する。
論文 参考訳(メタデータ) (2022-05-12T17:03:57Z) - Temporal Phenotyping using Deep Predictive Clustering of Disease
Progression [97.88605060346455]
我々は、時系列データをクラスタリングするためのディープラーニングアプローチを開発し、各クラスタは、同様の将来的な結果を共有する患者から構成される。
2つの実世界のデータセットに対する実験により、我々のモデルは最先端のベンチマークよりも優れたクラスタリング性能が得られることが示された。
論文 参考訳(メタデータ) (2020-06-15T20:48:43Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。