論文の概要: Synthetic Combinations: A Causal Inference Framework for Combinatorial
Interventions
- arxiv url: http://arxiv.org/abs/2303.14226v1
- Date: Fri, 24 Mar 2023 18:45:44 GMT
- ステータス: 処理完了
- システム内更新日: 2023-03-28 21:16:37.018436
- Title: Synthetic Combinations: A Causal Inference Framework for Combinatorial
Interventions
- Title(参考訳): 合成結合:組合せ介入のための因果推論フレームワーク
- Authors: Abhineet Agarwal, Anish Agarwal, Suhas Vijaykumar
- Abstract要約: 我々は、$N$不均一単位と$p$介入の設定を考える。
私たちのゴールは、これらの$p$の介入の組み合わせについて、ユニット固有の潜在的な結果を学ぶことです。
- 参考スコア(独自算出の注目度): 8.486713415198972
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: We consider a setting with $N$ heterogeneous units and $p$ interventions. Our
goal is to learn unit-specific potential outcomes for any combination of these
$p$ interventions, i.e., $N \times 2^p$ causal parameters. Choosing
combinations of interventions is a problem that naturally arises in many
applications such as factorial design experiments, recommendation engines
(e.g., showing a set of movies that maximizes engagement for users),
combination therapies in medicine, selecting important features for ML models,
etc. Running $N \times 2^p$ experiments to estimate the various parameters is
infeasible as $N$ and $p$ grow. Further, with observational data there is
likely confounding, i.e., whether or not a unit is seen under a combination is
correlated with its potential outcome under that combination. To address these
challenges, we propose a novel model that imposes latent structure across both
units and combinations. We assume latent similarity across units (i.e., the
potential outcomes matrix is rank $r$) and regularity in how combinations
interact (i.e., the coefficients in the Fourier expansion of the potential
outcomes is $s$ sparse). We establish identification for all causal parameters
despite unobserved confounding. We propose an estimation procedure, Synthetic
Combinations, and establish finite-sample consistency under precise conditions
on the observation pattern. Our results imply Synthetic Combinations
consistently estimates unit-specific potential outcomes given $\text{poly}(r)
\times (N + s^2p)$ observations. In comparison, previous methods that do not
exploit structure across both units and combinations have sample complexity
scaling as $\min(N \times s^2p, \ \ r \times (N + 2^p))$. We use Synthetic
Combinations to propose a data-efficient experimental design mechanism for
combinatorial causal inference. We corroborate our theoretical findings with
numerical simulations.
- Abstract(参考訳): 我々は、$N$不均一単位と$p$介入の設定を考える。
我々の目標は、これらの$p$介入の任意の組み合わせ、すなわち$N \times 2^p$因果パラメータについて、単位固有の潜在的な結果を学ぶことである。
介入の組み合わせの選択は、要因設計実験、レコメンデーションエンジン(例えば、ユーザのエンゲージメントを最大化する一連の映画を表示する)、医学における組み合わせ療法、MLモデルの重要な特徴の選択など、多くのアプリケーションで自然に発生する問題である。
様々なパラメータを推定するために$N \times 2^p$実験を実行すると、$N$と$p$が成長するので不可能である。
また、観測データにより、単位が組み合わせで見られるか否かが、その組み合わせ下での潜在的結果と相関している可能性が高い。
これらの課題に対処するため,我々は単位と組合せの両方に潜伏構造を課す新しいモデルを提案する。
我々は、単位間の潜在類似性(すなわち、潜在的な結果行列はランクr$)と組み合わせがどのように相互作用するか(つまり、潜在的な結果のフーリエ展開の係数は$s$ sparse)を仮定する。
我々は、観察不能な一致にもかかわらず、すべての因果パラメータの識別を確立する。
本稿では,観察パターン上の精密な条件下で推定手順,合成組合せ,有限サンプル一貫性を確立することを提案する。
この結果から、Synthetic Combinations は$\text{poly}(r) \times (N + s^2p)$ の単位固有ポテンシャルを一貫して推定する。
比較して、両単位と組合せをまたいで構造を活用しない以前の手法では、サンプル複雑性のスケーリングは$\min(n \times s^2p, \ \r \times (n + 2^p))$である。
合成組合せを用いて組合せ因果推論のためのデータ効率の高い実験設計機構を提案する。
我々は数値シミュレーションで理論的な結果を裏付ける。
関連論文リスト
- Robustly estimating heterogeneity in factorial data using Rashomon Partitions [4.76518127830168]
我々は、羅生門分割集合(RPS)と呼ばれる別の視点を開発する。
RPSは、たとえ実質的に異なる説明を提供するとしても、最大アフターディパーティションの近くに後続値を持つすべてのパーティションを組み込む。
提案手法を,チャリタブルギフトの価格効果,染色体構造(テロメア長),マイクロファイナンス導入の3つの経験的設定に適用した。
論文 参考訳(メタデータ) (2024-04-02T17:53:28Z) - EM for Mixture of Linear Regression with Clustered Data [6.948976192408852]
分散データにおけるクラスタ構造をどのように活用して学習手法を改善するかについて議論する。
我々は、既知の期待値最大化(EM)法を用いて、依存サンプルの$m$バッチから最大値パラメータを推定する。
構造化データ上のEMが適切であれば、$m$が$eo(n)$になる限り、同じ統計的精度に達するのに$O(1)$しか必要としないことを示す。
論文 参考訳(メタデータ) (2023-08-22T15:47:58Z) - A Scale-Invariant Sorting Criterion to Find a Causal Order in Additive
Noise Models [49.038420266408586]
分散の増加による変数のソートは、しばしば因果順序に近い順序になることを示す。
本稿ではR2$-SortnRegressと呼ばれる,高いR2$-sortabilityを利用する効率的なベースラインアルゴリズムを提案する。
その結果,因果発見に関連するデータ生成プロセスの仮定として,R2$-sortabilityが高額であることが判明した。
論文 参考訳(メタデータ) (2023-03-31T17:05:46Z) - Replicable Clustering [57.19013971737493]
我々は,統計学的な$k$-medians,統計学的な$k$-means,統計学的な$k$-centers問題のアルゴリズムをブラックボックス方式で近似ルーチンを用いて提案する。
理論的結果を検証するブラックボックスとしてsklearnの$k$-means++実装を用いた2次元合成分布の実験も行っている。
論文 参考訳(メタデータ) (2023-02-20T23:29:43Z) - On counterfactual inference with unobserved confounding [36.18241676876348]
独立だが不均一な単位を持つ観測的研究を前提として、各単位の反実分布を学習することが目的である。
我々は、すべての$n$サンプルをプールして、すべての$n$パラメータベクトルを共同で学習する凸目的を導入する。
対数的ソボレフ不等式を満たすためにコンパクトに支持された分布に対して十分な条件を導出する。
論文 参考訳(メタデータ) (2022-11-14T04:14:37Z) - Metric Entropy Duality and the Sample Complexity of Outcome
Indistinguishability [7.727052811126007]
結果の不一致性において、目標は、ターゲット予測子と区別できない予測子を出力することである。
結果の不一致性のサンプル複雑性は、$P$ w.r.tの計量エントロピーによって特徴づけられる。
この同値性は凸幾何学における長年の計量エントロピー双対性予想と興味深い関係を持つ。
論文 参考訳(メタデータ) (2022-03-09T06:02:31Z) - Permutation Compressors for Provably Faster Distributed Nonconvex
Optimization [68.8204255655161]
本稿では,Gorbunov et al (2021) の MARINA 法が,理論的な通信複雑性の観点から最先端の手法とみなすことができることを示す。
MARINAの理論は、古典的な独立圧縮機設定を超えて、潜在的にエミュレートされた圧縮機の理論を支持するものである。
論文 参考訳(メタデータ) (2021-10-07T09:38:15Z) - Under-bagging Nearest Neighbors for Imbalanced Classification [63.026765294759876]
我々は,不均衡な分類問題に対して,textitunder-bagging $k$-NN (textitunder-bagging $k$-NN) というアンサンブル学習アルゴリズムを提案する。
論文 参考訳(メタデータ) (2021-09-01T14:10:38Z) - An Online Riemannian PCA for Stochastic Canonical Correlation Analysis [37.8212762083567]
投影行列の再パラメータ化を用いた正準相関解析(CCA)のための効率的なアルゴリズム(RSG+)を提案する。
本論文は,その特性の定式化と技術的解析に主眼を置いているが,本実験により,一般的なデータセットに対する経験的挙動が極めて有望であることが確認された。
論文 参考訳(メタデータ) (2021-06-08T23:38:29Z) - Fuzzy Clustering with Similarity Queries [56.96625809888241]
ファジィ(fuzzy, soft objective)は、よく知られた$k$-means問題の一般化である。
クエリを少なくすることで、問題の解決が容易になる。
論文 参考訳(メタデータ) (2021-06-04T02:32:26Z) - Robustly Learning any Clusterable Mixture of Gaussians [55.41573600814391]
本研究では,高次元ガウス混合系の対向ロバスト条件下での効率的な学習性について検討する。
理論的に最適に近い誤り証明である$tildeO(epsilon)$の情報を、$epsilon$-corrupted $k$-mixtureで学習するアルゴリズムを提供する。
我々の主な技術的貢献は、ガウス混合系からの新しい頑健な識別可能性証明クラスターであり、これは正方形の定度証明システムによって捉えることができる。
論文 参考訳(メタデータ) (2020-05-13T16:44:12Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。