論文の概要: TETRIS: Composing FHE Techniques for Private Functional Exploration Over Large Datasets
- arxiv url: http://arxiv.org/abs/2412.13269v1
- Date: Tue, 17 Dec 2024 19:04:51 GMT
- ステータス: 翻訳完了
- システム内更新日: 2024-12-19 13:22:42.354436
- Title: TETRIS: Composing FHE Techniques for Private Functional Exploration Over Large Datasets
- Title(参考訳): TETRIS:大規模データセット上でのプライベート関数探索のためのFHE技術の構築
- Authors: Malika Izabachène, Jean-Philippe Bossuat,
- Abstract要約: 構成可能なホモモルフィック演算の集合を導入し、完全ホモモルフィック暗号を用いて、プライベート関数の評価とプライベートしきい値の組み合わせ方法を示す。
これにより、大規模データベースのプライベートな機能探索の現実的なユースケースを解決するTETRISという新しいシステムを設計できる。
単一のスレッドで数分で数十万の患者記録のデータベースからプライベートな洞察を抽出することが可能である。
- 参考スコア(独自算出の注目度): 1.0815754632303864
- License:
- Abstract: To derive valuable insights from statistics, machine learning applications frequently analyze substantial amounts of data. In this work, we address the problem of designing efficient secure techniques to probe large datasets which allow a scientist to conduct large-scale medical studies over specific attributes of patients' records, while maintaining the privacy of his model. We introduce a set of composable homomorphic operations and show how to combine private functions evaluation with private thresholds via approximate fully homomorphic encryption. This allows us to design a new system named TETRIS, which solves the real-world use case of private functional exploration of large databases, where the statistical criteria remain private to the server owning the patients' records. Our experiments show that TETRIS achieves practical performance over a large dataset of patients even for the evaluation of elaborate statements composed of linear and nonlinear functions. It is possible to extract private insights from a database of hundreds of thousands of patient records within only a few minutes on a single thread, with an amortized time per database entry smaller than 2ms.
- Abstract(参考訳): 統計から貴重な洞察を得るため、機械学習アプリケーションは大量のデータを頻繁に分析する。
本研究では,患者記録の特定の属性に関する大規模医学研究を科学者が行えながら,そのモデルのプライバシを維持しながら行うことのできる,大規模なデータセットを探索する効率的なセキュアな手法を設計することの課題に対処する。
構成可能な準同型演算の集合を導入し、近似完全同型暗号を用いて、プライベート関数の評価とプライベートしきい値の組み合わせ方法を示す。
これにより,患者の記録を保有するサーバに対して,統計基準が非公開である大規模データベースのプライベート機能探索の現実的なユースケースを解決する,TETRISという新しいシステムを設計することができる。
以上の結果から,TETRISは,線形および非線形機能からなる精巧な文の評価においても,大量の患者データセットに対して実用的性能を達成できることが示唆された。
単一のスレッドでわずか数分で数十万の患者記録のデータベースからプライベートな洞察を抽出することができ、データベースのエントリあたりの保存時間は2ms未満である。
関連論文リスト
- An Efficient Contrastive Unimodal Pretraining Method for EHR Time Series Data [35.943089444017666]
本稿では,長期臨床経過データに適した比較事前学習法を提案する。
本モデルでは, 臨床医が患者の症状についてより深い知見を得られるように, 欠損測定をインプットする能力を示す。
論文 参考訳(メタデータ) (2024-10-11T19:05:25Z) - Controllable Synthetic Clinical Note Generation with Privacy Guarantees [7.1366477372157995]
本稿では、PHI(Personal Health Information)を含む「クローン」データセットに対する新しい手法を提案する。
我々のアプローチは、クローン化されたデータセットが患者のプライバシを損なうことなく、元のデータの本質的な特性と有用性を保っていることを保証します。
クローン化されたデータセットでトレーニングされた機械学習モデルの性能を評価するために,ユーティリティテストを実施している。
論文 参考訳(メタデータ) (2024-09-12T07:38:34Z) - Feature Selection from Differentially Private Correlations [35.187113265093615]
高次元回帰はデータセット内の個々のデータポイントに関する情報をリークすることができる。
相関に基づく順序統計を用いて、データセットから重要な特徴を選択し、それらを民営化する。
提案手法は,多くのデータセット上でのプライベートな特徴選択において,確立されたベースラインを著しく上回っていることがわかった。
論文 参考訳(メタデータ) (2024-08-20T13:54:07Z) - Development and validation of a natural language processing algorithm to
pseudonymize documents in the context of a clinical data warehouse [53.797797404164946]
この研究は、この領域でツールやリソースを共有する際に直面する困難を浮き彫りにしている。
臨床文献のコーパスを12種類に分類した。
私たちは、ディープラーニングモデルと手動ルールの結果をマージして、ハイブリッドシステムを構築します。
論文 参考訳(メタデータ) (2023-03-23T17:17:46Z) - Estimating Model Performance on External Samples from Their Limited
Statistical Characteristics [0.26107298043931193]
本稿では,その限られた統計特性から,外部サンプルのモデル性能を推定する手法を提案する。
シミュレーションデータと電子カルテデータを2つのリスクモデルで評価する。
論文 参考訳(メタデータ) (2022-02-28T11:05:30Z) - Practical Challenges in Differentially-Private Federated Survival
Analysis of Medical Data [57.19441629270029]
本稿では,ニューラルネットワークの本質的特性を活用し,生存分析モデルの訓練過程を関連づける。
小さな医療データセットと少数のデータセンターの現実的な設定では、このノイズはモデルを収束させるのが難しくなります。
DPFed-post は,私的フェデレート学習方式に後処理の段階を追加する。
論文 参考訳(メタデータ) (2022-02-08T10:03:24Z) - SANSformers: Self-Supervised Forecasting in Electronic Health Records
with Attention-Free Models [48.07469930813923]
本研究は,医療施設への患者訪問数を予測することにより,医療サービスの需要を予測することを目的とする。
SNSformerは、特定の帰納バイアスを設計し、EHRデータの特異な特徴を考慮に入れた、注意のない逐次モデルである。
本研究は, 各種患者集団を対象とした医療利用予測の修正における, 注意力のないモデルと自己指導型事前訓練の有望な可能性について考察した。
論文 参考訳(メタデータ) (2021-08-31T08:23:56Z) - FLOP: Federated Learning on Medical Datasets using Partial Networks [84.54663831520853]
新型コロナウイルスの感染拡大で医療資源が不足している。
新型コロナウイルスの診断を緩和するために、さまざまなデータ駆動型ディープラーニングモデルが開発されている。
患者のプライバシー上の懸念から、データそのものはまだ乏しい。
我々は、textbfPartial Networks (FLOP) を用いた、シンプルで効果的な textbfFederated textbfL textbfon Medical データセットを提案する。
論文 参考訳(メタデータ) (2021-02-10T01:56:58Z) - Shared Space Transfer Learning for analyzing multi-site fMRI data [83.41324371491774]
マルチボクセルパターン解析(MVPA)は、タスクベース機能磁気共鳴画像(fMRI)データから予測モデルを学習する。
MVPAはよく設計された機能セットと十分なサンプルサイズで機能する。
ほとんどのfMRIデータセットはノイズが多く、高次元で、収集するのに高価で、サンプルサイズも小さい。
本稿では,新しい伝達学習手法として共有空間移動学習(SSTL)を提案する。
論文 参考訳(メタデータ) (2020-10-24T08:50:26Z) - Select-ProtoNet: Learning to Select for Few-Shot Disease Subtype
Prediction [55.94378672172967]
本研究は, 類似患者のサブグループを同定し, 数発の疾患のサブタイプ予測問題に焦点を当てた。
新しいモデルを開発するためにメタラーニング技術を導入し、関連する臨床課題から共通の経験や知識を抽出する。
我々の新しいモデルは、単純だが効果的なメタ学習マシンであるPrototypeal Networkと呼ばれる、慎重に設計されたメタラーナーに基づいて構築されている。
論文 参考訳(メタデータ) (2020-09-02T02:50:30Z) - Generating Electronic Health Records with Multiple Data Types and
Constraints [17.32526100692928]
電子健康記録(EHR)を大規模に共有することは、プライバシー侵害につながる可能性がある。
近年の研究では、GAN(Generative Adversarial Network)フレームワークを通じてEHRをシミュレートすることでリスクを軽減できることが示されている。
本稿では,1)GANモデルの精細化,2)特徴制約の説明,3)そのような生成タスクに対する重要なユーティリティ対策の導入により,複数のデータタイプからなるEHRをシミュレートする手法を提案する。
論文 参考訳(メタデータ) (2020-03-17T19:25:16Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。