論文の概要: Collaborative causal inference on distributed data
- arxiv url: http://arxiv.org/abs/2208.07898v2
- Date: Thu, 3 Aug 2023 05:55:38 GMT
- ステータス: 処理完了
- システム内更新日: 2023-08-04 19:55:35.231410
- Title: Collaborative causal inference on distributed data
- Title(参考訳): 分散データにおける協調因果推論
- Authors: Yuji Kawamata, Ryoki Motai, Yukihiko Okada, Akira Imakura, Tetsuya
Sakurai
- Abstract要約: 本稿では,分散データからの因果推論とプライバシ保護を実現するためのデータコラボレーション準実験(DC-QE)を提案する。
提案手法はランダムな誤差とバイアスの両方を低減できるが,既存の手法では処理効果の推定においてランダムな誤差を低減できる。
- 参考スコア(独自算出の注目度): 7.45472393803416
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: The development of technologies for causal inference with the privacy
preservation of distributed data has attracted considerable attention in recent
years. To address this issue, we propose a data collaboration quasi-experiment
(DC-QE) that enables causal inference from distributed data with privacy
preservation. In our method, first, local parties construct
dimensionality-reduced intermediate representations from the private data.
Second, they share intermediate representations, instead of private data for
privacy preservation. Third, propensity scores were estimated from the shared
intermediate representations. Finally, the treatment effects were estimated
from propensity scores. Our method can reduce both random errors and biases,
whereas existing methods can only reduce random errors in the estimation of
treatment effects. Through numerical experiments on both artificial and
real-world data, we confirmed that our method can lead to better estimation
results than individual analyses. Dimensionality-reduction loses some of the
information in the private data and causes performance degradation. However, we
observed that in the experiments, sharing intermediate representations with
many parties to resolve the lack of subjects and covariates, our method
improved performance enough to overcome the degradation caused by
dimensionality-reduction. With the spread of our method, intermediate
representations can be published as open data to help researchers find
causalities and accumulated as a knowledge base.
- Abstract(参考訳): 近年,分散データのプライバシ保護に伴う因果推論技術の発展が注目されている。
本稿では,プライバシ保護を伴う分散データからの因果推論を可能にするデータコラボレーション擬似実験(dc-qe)を提案する。
提案手法では,まず,個人データから次元再現された中間表現を構成する。
次に、プライバシー保護のためのプライベートデータではなく、中間表現を共有する。
第3に,中間表現の共有から確率スコアを推定した。
最後に, 治療効果を妥当性スコアから推定した。
本手法はランダムエラーとバイアスの両方を低減できるが,既存の手法では治療効果の推定においてのみランダムエラーを低減できる。
人工および実世界のデータを用いた数値実験により,本手法が個々の解析値よりも優れた推定結果をもたらすことを確認した。
次元性推論は、プライベートデータのいくつかの情報を失い、性能劣化を引き起こす。
しかし, 実験では, 対象と共変量の欠如を解消するために, 中間表現を多くの関係者と共有することで, 次元還元による劣化を克服する性能を十分に向上することを示した。
提案手法の普及により,中間表現をオープンデータとして公開することで,研究者が因果関係を見つけ,知識ベースとして蓄積することができる。
関連論文リスト
- Source-Free Domain-Invariant Performance Prediction [68.39031800809553]
本研究では,不確実性に基づく推定を主軸としたソースフリー手法を提案する。
オブジェクト認識データセットのベンチマーク実験により、既存のソースベースの手法は、限られたソースサンプルの可用性で不足していることが判明した。
提案手法は,現在の最先端のソースフリーおよびソースベース手法よりも優れており,ドメイン不変性能推定の有効性が確認されている。
論文 参考訳(メタデータ) (2024-08-05T03:18:58Z) - Multi-Source Conformal Inference Under Distribution Shift [41.701790856201036]
複数のバイアスのあるデータソースを活用することにより,対象個体数の分布自由な予測区間を得るという課題を考察する。
対象集団および源集団における未観測結果の定量値に対する効率的な影響関数を導出する。
本稿では、効率向上のための重み付き情報ソースとバイアス低減のための重み付き非情報ソースに対するデータ適応戦略を提案する。
論文 参考訳(メタデータ) (2024-05-15T13:33:09Z) - Collaborative Heterogeneous Causal Inference Beyond Meta-analysis [68.4474531911361]
異種データを用いた因果推論のための協調的逆確率スコア推定器を提案する。
異質性の増加に伴うメタアナリシスに基づく手法に対して,本手法は有意な改善を示した。
論文 参考訳(メタデータ) (2024-04-24T09:04:36Z) - Multiply Robust Federated Estimation of Targeted Average Treatment
Effects [0.0]
多地点データを用いて,対象個体群に対する有効な因果推論を導出する手法を提案する。
提案手法では,移動学習を組み込んでアンサンブル重みを推定し,ソースサイトからの情報を組み合わせる。
論文 参考訳(メタデータ) (2023-09-22T03:15:08Z) - CEDAR: Communication Efficient Distributed Analysis for Regressions [9.50726756006467]
患者レベルのデータを共有することなく、複数のEHRデータベース上での分散学習への関心が高まっている。
本稿では,局所的な最適推定値を集約する通信効率のよい新しい手法を提案する。
本稿では,統計的推測法と差分プライバシーに関する理論的検討を行い,シミュレーションおよび実データ解析におけるその性能評価を行う。
論文 参考訳(メタデータ) (2022-07-01T09:53:44Z) - Learning Bias-Invariant Representation by Cross-Sample Mutual
Information Minimization [77.8735802150511]
対象タスクが誤用したバイアス情報を除去するために,クロスサンプル対逆脱バイアス法(CSAD)を提案する。
相関測定は, 対向的偏り評価において重要な役割を担い, クロスサンプル型相互情報推定器によって行われる。
我々は,提案手法の最先端手法に対する利点を検証するために,公開データセットの徹底的な実験を行った。
論文 参考訳(メタデータ) (2021-08-11T21:17:02Z) - Federated Estimation of Causal Effects from Observational Data [19.657789891394504]
フェデレートされたデータソースを用いた因果推論のための新しいフレームワークを提案する。
我々は、異なるプライベートデータソースからの局所因果効果を中央集権化せずに評価し、統合する。
論文 参考訳(メタデータ) (2021-05-31T08:06:00Z) - Graph-Homomorphic Perturbations for Private Decentralized Learning [64.26238893241322]
ローカルな見積もりの交換は、プライベートデータに基づくデータの推測を可能にする。
すべてのエージェントで独立して選択された摂動により、パフォーマンスが著しく低下する。
本稿では,特定のヌル空間条件に従って摂動を構成する代替スキームを提案する。
論文 参考訳(メタデータ) (2020-10-23T10:35:35Z) - Learning while Respecting Privacy and Robustness to Distributional
Uncertainties and Adversarial Data [66.78671826743884]
分散ロバストな最適化フレームワークはパラメトリックモデルのトレーニングのために検討されている。
目的は、逆操作された入力データに対して頑健なトレーニングモデルを提供することである。
提案されたアルゴリズムは、オーバーヘッドがほとんどない堅牢性を提供する。
論文 参考訳(メタデータ) (2020-07-07T18:25:25Z) - On the Benefits of Invariance in Neural Networks [56.362579457990094]
データ拡張によるトレーニングは、リスクとその勾配をよりよく見積もることを示し、データ拡張でトレーニングされたモデルに対して、PAC-Bayes一般化を提供する。
また,データ拡張と比べ,平均化は凸損失を伴う場合の一般化誤差を低減し,PAC-Bayes境界を狭めることを示した。
論文 参考訳(メタデータ) (2020-05-01T02:08:58Z) - A Critical Overview of Privacy-Preserving Approaches for Collaborative
Forecasting [0.0]
異なるデータ所有者間の協力は、予測品質の改善につながる可能性がある。
ビジネス上の競争要因と個人データ保護の問題から、データ所有者はデータの共有を望まないかもしれない。
本稿では、現状を解析し、データプライバシを保証する既存の方法の欠点をいくつか明らかにする。
論文 参考訳(メタデータ) (2020-04-20T20:21:04Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。