論文の概要: A Privacy-Preserving Unsupervised Domain Adaptation Framework for
Clinical Text Analysis
- arxiv url: http://arxiv.org/abs/2201.07317v1
- Date: Tue, 18 Jan 2022 21:23:28 GMT
- ステータス: 処理完了
- システム内更新日: 2022-01-20 13:58:22.828392
- Title: A Privacy-Preserving Unsupervised Domain Adaptation Framework for
Clinical Text Analysis
- Title(参考訳): 臨床テキスト分析のためのプライバシー保護型ドメイン適応フレームワーク
- Authors: Qiyuan An, Ruijiang Li, Lin Gu, Hao Zhang, Qingyu Chen, Zhiyong Lu,
Fei Wang, and Yingying Zhu
- Abstract要約: プライバシ保護ドメイン適応の未解決問題について検討する。
本稿では,ソースデータのプライバシを保護するために,新たな差分プライバシートレーニング手法を提案する。
その結果,提案手法は,テキスト分類タスクにわずかな性能の影響を伴って,ソースデータのプライバシを保持できることが示唆された。
- 参考スコア(独自算出の注目度): 16.22078034183147
- License: http://creativecommons.org/licenses/by-nc-nd/4.0/
- Abstract: Unsupervised domain adaptation (UDA) generally aligns the unlabeled target
domain data to the distribution of the source domain to mitigate the
distribution shift problem. The standard UDA requires sharing the source data
with the target, having potential data privacy leaking risks. To protect the
source data's privacy, we first propose to share the source feature
distribution instead of the source data. However, sharing only the source
feature distribution may still suffer from the membership inference attack who
can infer an individual's membership by the black-box access to the source
model. To resolve this privacy issue, we further study the under-explored
problem of privacy-preserving domain adaptation and propose a method with a
novel differential privacy training strategy to protect the source data
privacy. We model the source feature distribution by Gaussian Mixture Models
(GMMs) under the differential privacy setting and send it to the target client
for adaptation. The target client resamples differentially private source
features from GMMs and adapts on target data with several state-of-art UDA
backbones. With our proposed method, the source data provider could avoid
leaking source data privacy during domain adaptation as well as reserve the
utility. To evaluate our proposed method's utility and privacy loss, we apply
our model on a medical report disease label classification task using two noisy
challenging clinical text datasets. The results show that our proposed method
can preserve source data's privacy with a minor performance influence on the
text classification task.
- Abstract(参考訳): 教師なし領域適応 (unsupervised domain adaptation, uda) は一般にラベルなしのターゲット領域データをソースドメインの分布に合わせ、分散シフト問題を緩和する。
標準的なUDAでは、ソースデータをターゲットと共有する必要がある。
ソースデータのプライバシを保護するため,まずソースデータの代わりにソースの特徴分布を共有することを提案する。
しかしながら、ソースの特徴分布のみを共有することは、ソースモデルへのブラックボックスアクセスによって個人のメンバシップを推測できるメンバーシップ推論攻撃に悩まされる可能性がある。
このプライバシー問題を解決するために,プライバシ保護ドメイン適応の未検討の問題をさらに研究し,ソースデータのプライバシを保護するための新たな差分プライバシートレーニング手法を提案する。
差分プライバシー設定下でガウス混合モデル(gmms)によってソース特徴分布をモデル化し、ターゲットクライアントに適応させるために送信する。
ターゲットクライアントはGMMから異なるプライベートソース機能を再サンプリングし、最先端のUDAバックボーンを持つターゲットデータに適応する。
提案手法により、ソースデータプロバイダは、ドメイン適応時にソースデータのプライバシの漏洩を回避し、ユーティリティを予約することができる。
提案手法の有用性とプライバシの損失を評価するために,2つの難易度の高い臨床テキストデータセットを用いて医療報告病名分類タスクに適用した。
提案手法は,テキスト分類タスクにわずかな性能の影響を伴って,ソースデータのプライバシを保存することができることを示す。
関連論文リスト
- CaPS: Collaborative and Private Synthetic Data Generation from Distributed Sources [5.898893619901382]
分散データホルダから合成データの協調的かつプライベートな生成のためのフレームワークを提案する。
我々は信頼されたアグリゲータをセキュアなマルチパーティ計算プロトコルに置き換え、差分プライバシー(DP)を介してプライバシを出力する。
MWEM+PGMおよびAIMの最先端選択測度生成アルゴリズムに対するアプローチの適用性とスケーラビリティを実証する。
論文 参考訳(メタデータ) (2024-02-13T17:26:32Z) - Private Domain Adaptation from a Public Source [48.83724068578305]
我々は、公開ラベル付きデータを持つソースドメインから、未ラベル付きプライベートデータを持つターゲットドメインへの適応のための差分プライベート離散性に基づくアルゴリズムを設計する。
我々の解は、Frank-WolfeとMirror-Descentアルゴリズムのプライベートな変種に基づいている。
論文 参考訳(メタデータ) (2022-08-12T06:52:55Z) - Source-free Unsupervised Domain Adaptation for Blind Image Quality
Assessment [20.28784839680503]
既存の学習ベースのブラインド画像品質評価法(BIQA)は、大量の注釈付きトレーニングデータに大きく依存している。
本稿では,ソースフリーな非教師付きドメイン適応(SFUDA)への第一歩を,シンプルで効率的な方法で進める。
本稿では、BNアフィンパラメータのターゲット領域への適応を導くための、十分に設計された自己教師対象のグループを示す。
論文 参考訳(メタデータ) (2022-07-17T09:42:36Z) - Source-Free Domain Adaptation via Distribution Estimation [106.48277721860036]
ドメイン適応は、ラベル付きソースドメインから学んだ知識を、データ分散が異なるラベル付きターゲットドメインに転送することを目的としています。
近年,ソースフリードメイン適応 (Source-Free Domain Adaptation, SFDA) が注目されている。
本研究では,SFDA-DEと呼ばれる新しいフレームワークを提案し,ソース分布推定によるSFDAタスクに対処する。
論文 参考訳(メタデータ) (2022-04-24T12:22:19Z) - Unsupervised Adaptation of Semantic Segmentation Models without Source
Data [14.66682099621276]
意味的セグメンテーションのためのソースデータにアクセスすることなく、ソースモデルの教師なしドメイン適応という新しい問題を考察する。
本稿では,ソースモデルから知識を抽出する自己学習手法を提案する。
我々のフレームワークは、ターゲットデータに直接ソースモデルを適用した場合と比較して、大幅なパフォーマンス向上を実現できます。
論文 参考訳(メタデータ) (2021-12-04T15:13:41Z) - Source-Free Domain Adaptive Fundus Image Segmentation with Denoised
Pseudo-Labeling [56.98020855107174]
ドメイン適応は通常、ソースドメインデータにアクセスして、ターゲットデータとのドメインアライメントのために配布情報を利用する必要があります。
多くの実世界のシナリオでは、プライバシの問題により、ターゲットドメインのモデル適応中にソースデータがアクセスできない場合がある。
本稿では,本問題に対する新たな擬似ラベル付け手法を提案する。
論文 参考訳(メタデータ) (2021-09-19T06:38:21Z) - Uncertainty-Guided Mixup for Semi-Supervised Domain Adaptation without
Source Data [37.26484185691251]
ソースフリーなドメイン適応は、ソースデータにアクセスせずにドメイン適応を行うことによって問題を解決することを目的としている。
提案する不確実性誘導型Mixupは,表現のドメイン内差を低減し,ソースデータに直接アクセスすることなくドメイン間アライメントを行う。
提案手法は,最近の半教師付きベースラインよりも優れており,教師なし変種は競争性能を達成する。
論文 参考訳(メタデータ) (2021-07-14T13:54:02Z) - Distill and Fine-tune: Effective Adaptation from a Black-box Source
Model [138.12678159620248]
Unsupervised Domain Adapt (UDA) は、既存のラベル付きデータセット (source) の知識を新しいラベル付きデータセット (target) に転送することを目的としています。
Distill and Fine-tune (Dis-tune) という新しい二段階適応フレームワークを提案する。
論文 参考訳(メタデータ) (2021-04-04T05:29:05Z) - Source Data-absent Unsupervised Domain Adaptation through Hypothesis
Transfer and Labeling Transfer [137.36099660616975]
Unsupervised Adapt Adaptation (UDA) は、関連性のある異なるラベル付きソースドメインから新しいラベルなしターゲットドメインへの知識の転送を目標としている。
既存のudaメソッドの多くはソースデータへのアクセスを必要としており、プライバシ上の懸念からデータが機密で共有できない場合は適用できない。
本稿では、ソースデータにアクセスする代わりに、トレーニング済みの分類モデルのみを用いて現実的な設定に取り組むことを目的とする。
論文 参考訳(メタデータ) (2020-12-14T07:28:50Z) - Do We Really Need to Access the Source Data? Source Hypothesis Transfer
for Unsupervised Domain Adaptation [102.67010690592011]
Unsupervised adaptUDA (UDA) は、ラベル付きソースデータセットから学んだ知識を活用して、新しいラベル付きドメインで同様のタスクを解決することを目的としている。
従来のUDAメソッドは、モデルに適応するためには、通常、ソースデータにアクセスする必要がある。
この作業は、訓練済みのソースモデルのみが利用できる実践的な環境に取り組み、ソースデータなしでそのようなモデルを効果的に活用してUDA問題を解決する方法に取り組みます。
論文 参考訳(メタデータ) (2020-02-20T03:13:58Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。