論文の概要: Synthetic Combinations: A Causal Inference Framework for Combinatorial
Interventions
- arxiv url: http://arxiv.org/abs/2303.14226v2
- Date: Mon, 15 Jan 2024 09:14:09 GMT
- ステータス: 処理完了
- システム内更新日: 2024-01-18 03:09:25.679828
- Title: Synthetic Combinations: A Causal Inference Framework for Combinatorial
Interventions
- Title(参考訳): 合成結合:組合せ介入のための因果推論フレームワーク
- Authors: Abhineet Agarwal, Anish Agarwal, Suhas Vijaykumar
- Abstract要約: 介入の任意の組み合わせ、すなわち$N×2p$因果パラメータについて、単位特異的な潜在的な結果を学ぶ。
様々なパラメーターを推定するために$N×2p$の実験を実行すると、$N$と$p$が成長するほど高価で/または実現不可能である。
- 参考スコア(独自算出の注目度): 8.491098180590447
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Consider a setting where there are $N$ heterogeneous units and $p$
interventions. Our goal is to learn unit-specific potential outcomes for any
combination of these $p$ interventions, i.e., $N \times 2^p$ causal parameters.
Choosing a combination of interventions is a problem that naturally arises in a
variety of applications such as factorial design experiments, recommendation
engines, combination therapies in medicine, conjoint analysis, etc. Running $N
\times 2^p$ experiments to estimate the various parameters is likely expensive
and/or infeasible as $N$ and $p$ grow. Further, with observational data there
is likely confounding, i.e., whether or not a unit is seen under a combination
is correlated with its potential outcome under that combination. To address
these challenges, we propose a novel latent factor model that imposes structure
across units (i.e., the matrix of potential outcomes is approximately rank
$r$), and combinations of interventions (i.e., the coefficients in the Fourier
expansion of the potential outcomes is approximately $s$ sparse). We establish
identification for all $N \times 2^p$ parameters despite unobserved
confounding. We propose an estimation procedure, Synthetic Combinations, and
establish it is finite-sample consistent and asymptotically normal under
precise conditions on the observation pattern. Our results imply consistent
estimation given $\text{poly}(r) \times \left( N + s^2p\right)$ observations,
while previous methods have sample complexity scaling as $\min(N \times s^2p, \
\ \text{poly(r)} \times (N + 2^p))$. We use Synthetic Combinations to propose a
data-efficient experimental design. Empirically, Synthetic Combinations
outperforms competing approaches on a real-world dataset on movie
recommendations. Lastly, we extend our analysis to do causal inference where
the intervention is a permutation over $p$ items (e.g., rankings).
- Abstract(参考訳): N$不均一単位と$p$介入があるような設定を考えてみましょう。
我々の目標は、これらの$p$介入の任意の組み合わせ、すなわち$N \times 2^p$因果パラメータについて、単位固有の潜在的な結果を学ぶことである。
介入の組み合わせを選択することは、要因設計実験、推奨エンジン、医学における組み合わせ療法、結合分析など、様々な応用において自然に発生する問題である。
様々なパラメータを推定するために$n \times 2^p$の実験を実行することはおそらく高価で、$n$と$p$が成長すると実現できない。
また、観測データにより、単位が組み合わせで見られるか否かが、その組み合わせ下での潜在的結果と相関している可能性が高い。
これらの課題に対処するために、我々は、単位にまたがる構造を課す新しい潜在因子モデル(すなわち、潜在的な結果の行列はおよそランク$r$)と介入の組み合わせ(つまり、潜在的な結果のフーリエ展開の係数はおよそ$s$ sparse)を提案する。
n 個の \times 2^p$ パラメータの識別を確立する。
本稿では,観測パターンの精密な条件下での有限サンプル一貫性と漸近正規性を確立するための推定手法,合成組合せを提案する。
この結果は、$\text{poly}(r) \times \left(n + s^2p\right)$ の観測値が与えられた場合と、従来の手法では$\min(n \times s^2p, \ \ \ \ \text{poly(r)} \times (n + 2^p))$ でサンプル複雑性のスケーリングを行う場合との一貫性を示唆する。
データ効率の良い実験設計を提案するために合成組合せを用いる。
経験的に、Synthetic Combinationは映画レコメンデーションに関する現実世界のデータセットの競合するアプローチより優れている。
最後に、我々は分析を拡張し、介入が$p$アイテム(例えばランキング)の置換である因果推論を行う。
関連論文リスト
- Robustly estimating heterogeneity in factorial data using Rashomon Partitions [4.76518127830168]
我々は、羅生門分割集合(RPS)と呼ばれる別の視点を開発する。
RPSは、たとえ実質的に異なる説明を提供するとしても、最大アフターディパーティションの近くに後続値を持つすべてのパーティションを組み込む。
提案手法を,チャリタブルギフトの価格効果,染色体構造(テロメア長),マイクロファイナンス導入の3つの経験的設定に適用した。
論文 参考訳(メタデータ) (2024-04-02T17:53:28Z) - EM for Mixture of Linear Regression with Clustered Data [6.948976192408852]
分散データにおけるクラスタ構造をどのように活用して学習手法を改善するかについて議論する。
我々は、既知の期待値最大化(EM)法を用いて、依存サンプルの$m$バッチから最大値パラメータを推定する。
構造化データ上のEMが適切であれば、$m$が$eo(n)$になる限り、同じ統計的精度に達するのに$O(1)$しか必要としないことを示す。
論文 参考訳(メタデータ) (2023-08-22T15:47:58Z) - A Scale-Invariant Sorting Criterion to Find a Causal Order in Additive
Noise Models [49.038420266408586]
分散の増加による変数のソートは、しばしば因果順序に近い順序になることを示す。
本稿ではR2$-SortnRegressと呼ばれる,高いR2$-sortabilityを利用する効率的なベースラインアルゴリズムを提案する。
その結果,因果発見に関連するデータ生成プロセスの仮定として,R2$-sortabilityが高額であることが判明した。
論文 参考訳(メタデータ) (2023-03-31T17:05:46Z) - Replicable Clustering [57.19013971737493]
我々は,統計学的な$k$-medians,統計学的な$k$-means,統計学的な$k$-centers問題のアルゴリズムをブラックボックス方式で近似ルーチンを用いて提案する。
理論的結果を検証するブラックボックスとしてsklearnの$k$-means++実装を用いた2次元合成分布の実験も行っている。
論文 参考訳(メタデータ) (2023-02-20T23:29:43Z) - On counterfactual inference with unobserved confounding [36.18241676876348]
独立だが不均一な単位を持つ観測的研究を前提として、各単位の反実分布を学習することが目的である。
我々は、すべての$n$サンプルをプールして、すべての$n$パラメータベクトルを共同で学習する凸目的を導入する。
対数的ソボレフ不等式を満たすためにコンパクトに支持された分布に対して十分な条件を導出する。
論文 参考訳(メタデータ) (2022-11-14T04:14:37Z) - Metric Entropy Duality and the Sample Complexity of Outcome
Indistinguishability [7.727052811126007]
結果の不一致性において、目標は、ターゲット予測子と区別できない予測子を出力することである。
結果の不一致性のサンプル複雑性は、$P$ w.r.tの計量エントロピーによって特徴づけられる。
この同値性は凸幾何学における長年の計量エントロピー双対性予想と興味深い関係を持つ。
論文 参考訳(メタデータ) (2022-03-09T06:02:31Z) - Permutation Compressors for Provably Faster Distributed Nonconvex
Optimization [68.8204255655161]
本稿では,Gorbunov et al (2021) の MARINA 法が,理論的な通信複雑性の観点から最先端の手法とみなすことができることを示す。
MARINAの理論は、古典的な独立圧縮機設定を超えて、潜在的にエミュレートされた圧縮機の理論を支持するものである。
論文 参考訳(メタデータ) (2021-10-07T09:38:15Z) - Under-bagging Nearest Neighbors for Imbalanced Classification [63.026765294759876]
我々は,不均衡な分類問題に対して,textitunder-bagging $k$-NN (textitunder-bagging $k$-NN) というアンサンブル学習アルゴリズムを提案する。
論文 参考訳(メタデータ) (2021-09-01T14:10:38Z) - An Online Riemannian PCA for Stochastic Canonical Correlation Analysis [37.8212762083567]
投影行列の再パラメータ化を用いた正準相関解析(CCA)のための効率的なアルゴリズム(RSG+)を提案する。
本論文は,その特性の定式化と技術的解析に主眼を置いているが,本実験により,一般的なデータセットに対する経験的挙動が極めて有望であることが確認された。
論文 参考訳(メタデータ) (2021-06-08T23:38:29Z) - Fuzzy Clustering with Similarity Queries [56.96625809888241]
ファジィ(fuzzy, soft objective)は、よく知られた$k$-means問題の一般化である。
クエリを少なくすることで、問題の解決が容易になる。
論文 参考訳(メタデータ) (2021-06-04T02:32:26Z) - Robustly Learning any Clusterable Mixture of Gaussians [55.41573600814391]
本研究では,高次元ガウス混合系の対向ロバスト条件下での効率的な学習性について検討する。
理論的に最適に近い誤り証明である$tildeO(epsilon)$の情報を、$epsilon$-corrupted $k$-mixtureで学習するアルゴリズムを提供する。
我々の主な技術的貢献は、ガウス混合系からの新しい頑健な識別可能性証明クラスターであり、これは正方形の定度証明システムによって捉えることができる。
論文 参考訳(メタデータ) (2020-05-13T16:44:12Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。