論文の概要: Collaborative causal inference on distributed data
- arxiv url: http://arxiv.org/abs/2208.07898v5
- Date: Fri, 12 Jan 2024 04:38:19 GMT
- ステータス: 処理完了
- システム内更新日: 2024-01-16 00:27:26.368947
- Title: Collaborative causal inference on distributed data
- Title(参考訳): 分散データにおける協調因果推論
- Authors: Yuji Kawamata, Ryoki Motai, Yukihiko Okada, Akira Imakura, Tetsuya
Sakurai
- Abstract要約: 本研究では,データ協調実験(DC-QE)を提案し,対象と共変量の欠如を解消し,推定におけるランダムな誤りやバイアスを低減する。
提案手法では, 個人データから生成した中間表現を局所的データから構築し, プライバシ保存のためにプライベートデータの代わりに中間表現を共有し, 共有中間表現から適合度スコアを推定し, 最終的に, 適合度スコアから治療効果を推定する。
- 参考スコア(独自算出の注目度): 7.293479909193382
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: In recent years, the development of technologies for causal inference with
privacy preservation of distributed data has gained considerable attention.
Many existing methods for distributed data focus on resolving the lack of
subjects (samples) and can only reduce random errors in estimating treatment
effects. In this study, we propose a data collaboration quasi-experiment
(DC-QE) that resolves the lack of both subjects and covariates, reducing random
errors and biases in the estimation. Our method involves constructing
dimensionality-reduced intermediate representations from private data from
local parties, sharing intermediate representations instead of private data for
privacy preservation, estimating propensity scores from the shared intermediate
representations, and finally, estimating the treatment effects from propensity
scores. Through numerical experiments on both artificial and real-world data,
we confirm that our method leads to better estimation results than individual
analyses. While dimensionality reduction loses some information in the private
data and causes performance degradation, we observe that sharing intermediate
representations with many parties to resolve the lack of subjects and
covariates sufficiently improves performance to overcome the degradation caused
by dimensionality reduction. Although external validity is not necessarily
guaranteed, our results suggest that DC-QE is a promising method. With the
widespread use of our method, intermediate representations can be published as
open data to help researchers find causalities and accumulate a knowledge base.
- Abstract(参考訳): 近年,分散データのプライバシ保護に伴う因果推論技術の発展が注目されている。
既存の分散データの方法の多くは、被験者の欠如(サンプル)を解決することに集中しており、治療効果の推定においてランダムなエラーを減らすことしかできない。
本研究では,データ協調実験(DC-QE)を提案し,被験者と共変者の両方の欠如を解消し,ランダムな誤差と推定の偏りを低減させる。
本手法は,ローカルパーティの個人データから次元的に縮小した中間表現を構築し,プライバシ保存のためにプライベートデータの代わりに中間表現を共有すること,共有中間表現からプロパシティスコアを推定すること,最後にプロパサリティスコアから治療効果を推定することを含む。
実世界の人工データと実世界のデータの両方に関する数値実験により,本手法が個人分析よりも優れた推定結果をもたらすことを確認した。
次元減少は,個人データ内の情報を失い,性能低下を引き起こすが,中間表現の共有によって被検者不足を解消し,共変量化によって性能が改善され,次元減少に起因する劣化を克服できる。
外的妥当性は必ずしも保証されていないが,本研究の結果はDC-QEが有望な方法であることを示している。
この手法を広く利用することで、中間表現をオープンデータとして公開することで、研究者が因果関係を発見し、知識ベースを蓄積するのに役立つ。
関連論文リスト
- Multiply Robust Federated Estimation of Targeted Average Treatment
Effects [0.0]
多地点データを用いて,対象個体群に対する有効な因果推論を導出する手法を提案する。
提案手法では,移動学習を組み込んでアンサンブル重みを推定し,ソースサイトからの情報を組み合わせる。
論文 参考訳(メタデータ) (2023-09-22T03:15:08Z) - Federated Learning of Causal Effects from Incomplete Observational Data [7.070214955483121]
不完全なデータソースからのフェデレーション因果推論のための新しいアプローチを提案する。
我々のアプローチは、損失関数を複数のコンポーネントに切り離し、それぞれが欠落した値を持つ特定のデータソースに対応する。
本フレームワークは、ソース間で生データを共有することなく、異種因果効果を推定する。
論文 参考訳(メタデータ) (2023-08-24T19:27:59Z) - D-BIAS: A Causality-Based Human-in-the-Loop System for Tackling
Algorithmic Bias [57.87117733071416]
D-BIASは、人間のループ内AIアプローチを具現化し、社会的バイアスを監査し軽減する視覚対話型ツールである。
ユーザは、因果ネットワークにおける不公平な因果関係を識別することにより、グループに対する偏見の存在を検出することができる。
それぞれのインタラクション、例えばバイアスのある因果縁の弱体化/削除は、新しい(偏りのある)データセットをシミュレートするために、新しい方法を用いている。
論文 参考訳(メタデータ) (2022-08-10T03:41:48Z) - CEDAR: Communication Efficient Distributed Analysis for Regressions [9.50726756006467]
患者レベルのデータを共有することなく、複数のEHRデータベース上での分散学習への関心が高まっている。
本稿では,局所的な最適推定値を集約する通信効率のよい新しい手法を提案する。
本稿では,統計的推測法と差分プライバシーに関する理論的検討を行い,シミュレーションおよび実データ解析におけるその性能評価を行う。
論文 参考訳(メタデータ) (2022-07-01T09:53:44Z) - Learning Bias-Invariant Representation by Cross-Sample Mutual
Information Minimization [77.8735802150511]
対象タスクが誤用したバイアス情報を除去するために,クロスサンプル対逆脱バイアス法(CSAD)を提案する。
相関測定は, 対向的偏り評価において重要な役割を担い, クロスサンプル型相互情報推定器によって行われる。
我々は,提案手法の最先端手法に対する利点を検証するために,公開データセットの徹底的な実験を行った。
論文 参考訳(メタデータ) (2021-08-11T21:17:02Z) - Federated Estimation of Causal Effects from Observational Data [19.657789891394504]
フェデレートされたデータソースを用いた因果推論のための新しいフレームワークを提案する。
我々は、異なるプライベートデータソースからの局所因果効果を中央集権化せずに評価し、統合する。
論文 参考訳(メタデータ) (2021-05-31T08:06:00Z) - Graph-Homomorphic Perturbations for Private Decentralized Learning [64.26238893241322]
ローカルな見積もりの交換は、プライベートデータに基づくデータの推測を可能にする。
すべてのエージェントで独立して選択された摂動により、パフォーマンスが著しく低下する。
本稿では,特定のヌル空間条件に従って摂動を構成する代替スキームを提案する。
論文 参考訳(メタデータ) (2020-10-23T10:35:35Z) - Learning while Respecting Privacy and Robustness to Distributional
Uncertainties and Adversarial Data [66.78671826743884]
分散ロバストな最適化フレームワークはパラメトリックモデルのトレーニングのために検討されている。
目的は、逆操作された入力データに対して頑健なトレーニングモデルを提供することである。
提案されたアルゴリズムは、オーバーヘッドがほとんどない堅牢性を提供する。
論文 参考訳(メタデータ) (2020-07-07T18:25:25Z) - Unlabelled Data Improves Bayesian Uncertainty Calibration under
Covariate Shift [100.52588638477862]
後続正則化に基づく近似ベイズ推定法を開発した。
前立腺癌の予後モデルを世界規模で導入する上で,本手法の有用性を実証する。
論文 参考訳(メタデータ) (2020-06-26T13:50:19Z) - On the Benefits of Invariance in Neural Networks [56.362579457990094]
データ拡張によるトレーニングは、リスクとその勾配をよりよく見積もることを示し、データ拡張でトレーニングされたモデルに対して、PAC-Bayes一般化を提供する。
また,データ拡張と比べ,平均化は凸損失を伴う場合の一般化誤差を低減し,PAC-Bayes境界を狭めることを示した。
論文 参考訳(メタデータ) (2020-05-01T02:08:58Z) - A Critical Overview of Privacy-Preserving Approaches for Collaborative
Forecasting [0.0]
異なるデータ所有者間の協力は、予測品質の改善につながる可能性がある。
ビジネス上の競争要因と個人データ保護の問題から、データ所有者はデータの共有を望まないかもしれない。
本稿では、現状を解析し、データプライバシを保証する既存の方法の欠点をいくつか明らかにする。
論文 参考訳(メタデータ) (2020-04-20T20:21:04Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。