論文の概要: Using representation balancing to learn conditional-average dose responses from clustered data
- arxiv url: http://arxiv.org/abs/2309.03731v2
- Date: Fri, 26 Jul 2024 13:33:14 GMT
- ステータス: 処理完了
- システム内更新日: 2024-07-29 18:41:36.619431
- Title: Using representation balancing to learn conditional-average dose responses from clustered data
- Title(参考訳): 表現バランスを用いたクラスタデータからの条件平均線量応答の学習
- Authors: Christopher Bockel-Rickermann, Toon Vanderschueren, Jeroen Berrevoets, Tim Verdonck, Wouter Verbeke,
- Abstract要約: 関連する用量による介入に対する単位の反応を推定することは、様々な領域において関係している。
本稿では,クラスタ化データによるモデル性能への影響を示すとともに,推定器であるCBRNetを提案する。
- 参考スコア(独自算出の注目度): 5.633848204699653
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Estimating a unit's responses to interventions with an associated dose, the "conditional average dose response" (CADR), is relevant in a variety of domains, from healthcare to business, economics, and beyond. Such a response typically needs to be estimated from observational data, which introduces several challenges. That is why the machine learning (ML) community has proposed several tailored CADR estimators. Yet, the proposal of most of these methods requires strong assumptions on the distribution of data and the assignment of interventions, which go beyond the standard assumptions in causal inference. Whereas previous works have so far focused on smooth shifts in covariate distributions across doses, in this work, we will study estimating CADR from clustered data and where different doses are assigned to different segments of a population. On a novel benchmarking dataset, we show the impacts of clustered data on model performance and propose an estimator, CBRNet, that learns cluster-agnostic and hence dose-agnostic covariate representations through representation balancing for unbiased CADR inference. We run extensive experiments to illustrate the workings of our method and compare it with the state of the art in ML for CADR estimation.
- Abstract(参考訳): 関連する用量による介入に対するユニットの反応を推定する「条件平均用量反応」(CADR)は、医療からビジネス、経済学など、様々な領域で関係がある。
このような応答は通常、いくつかの課題をもたらす観測データから推定する必要がある。
そのため、機械学習(ML)コミュニティは、いくつかのカスタマイズされたCADR推定器を提案している。
しかし、これらの手法のほとんどの提案は、因果推論における標準的な仮定を超えて、データの分布と介入の割り当てについて強い仮定を必要とする。
これまでの研究は、線量間の共変量分布のスムーズな変化に重点を置いてきたが、本研究では、クラスタ化されたデータからCADRを推定し、異なる線量が集団の異なるセグメントに割り当てられる場所について検討する。
新たなベンチマークデータセットでは,クラスタ化データのモデル性能への影響を示すとともに,非バイアスCADR推論の表現バランスによるクラスタ非依存的,従って線量非依存な共変量表現を学習する推定器CBRNetを提案する。
提案手法の動作を説明するために広範囲な実験を行い,CADR推定のためのMLの最先端技術と比較した。
関連論文リスト
- Federated Causal Inference: Multi-Centric ATE Estimation beyond Meta-Analysis [12.896319628045967]
我々は、中央に分散したデータから治療効果を推定するフェデレート因果推論(Federated Causal Inference)について検討する。
プラグインG-Formulaから得られた平均治療効果(ATE)推定器の3つのクラスを比較した。
論文 参考訳(メタデータ) (2024-10-22T10:19:17Z) - Precise Model Benchmarking with Only a Few Observations [6.092112060364272]
本稿では,各サブグループの直接推定と回帰推定を個別にバランスする経験的ベイズ推定器を提案する。
EBは、直接的および回帰的アプローチと比較して、LCM性能のより正確な推定を一貫して提供する。
論文 参考訳(メタデータ) (2024-10-07T17:26:31Z) - The Mismeasure of Man and Models: Evaluating Allocational Harms in Large Language Models [22.75594773147521]
大規模言語モデル(LLM)におけるバイアスから生じる潜在的アロケーション障害を評価するモデル非依存バイアス指標であるランクアロケーションベースバイアス指標(RABBI)を導入する。
その結果, 平均性能差と分布距離に基づく偏差測定では, 割り当て結果の集団差を確実に把握できないことがわかった。
私たちの研究は、限られたリソース制約のあるコンテキストでモデルがどのように使用されるかを説明する必要性を強調しています。
論文 参考訳(メタデータ) (2024-08-02T14:13:06Z) - Sources of Gain: Decomposing Performance in Conditional Average Dose Response Estimation [0.9332308328407303]
条件付き平均線量応答(CADR)の推定は重要であるが難しい問題である。
本稿では,この手法を解析し,さらなる分析を行わない一般的なベンチマークデータセットを用いることで,モデル性能を判断するには不十分であることを示す。
本稿では,CADR推定器の性能に寄与する5つの異なる成分の影響を評価できる新しい分解手法を提案する。
論文 参考訳(メタデータ) (2024-06-12T13:39:32Z) - Geometry-Aware Instrumental Variable Regression [56.16884466478886]
本稿では,データ導出情報によるデータ多様体の幾何を考慮した移動型IV推定器を提案する。
本手法のプラグイン・アンド・プレイ実装は,標準設定で関連する推定器と同等に動作する。
論文 参考訳(メタデータ) (2024-05-19T17:49:33Z) - Accuracy on the Line: On the Strong Correlation Between
Out-of-Distribution and In-Distribution Generalization [89.73665256847858]
分布外性能は,広範囲なモデルと分布シフトに対する分布内性能と強く相関していることを示す。
具体的には,CIFAR-10 と ImageNet の変種に対する分布内分布と分布外分布性能の強い相関関係を示す。
また,CIFAR-10-Cと組織分類データセットCamelyon17-WILDSの合成分布の変化など,相関が弱いケースについても検討した。
論文 参考訳(メタデータ) (2021-07-09T19:48:23Z) - Counterfactual Maximum Likelihood Estimation for Training Deep Networks [83.44219640437657]
深層学習モデルは、予測的手がかりとして学習すべきでない急激な相関を学習する傾向がある。
本研究では,観測可能な共同設立者による相関関係の緩和を目的とした因果関係に基づくトレーニングフレームワークを提案する。
自然言語推論(NLI)と画像キャプションという2つの実世界の課題について実験を行った。
論文 参考訳(メタデータ) (2021-06-07T17:47:16Z) - Performance metrics for intervention-triggering prediction models do not
reflect an expected reduction in outcomes from using the model [71.9860741092209]
臨床研究者はしばしばリスク予測モデルの中から選択し評価する。
振り返りデータから算出される標準メトリクスは、特定の仮定の下でのみモデルユーティリティに関係します。
予測が時間を通して繰り返し配信される場合、標準メトリクスとユーティリティの関係はさらに複雑になる。
論文 参考訳(メタデータ) (2020-06-02T16:26:49Z) - C-MI-GAN : Estimation of Conditional Mutual Information using MinMax
formulation [20.57104064155529]
我々は,条件付き相互情報(CMI)推定を,その定式化をミニマックス最適化問題として利用して検討する。
提案した推定器は,様々なシミュレーションデータセットに対する既存手法よりも優れた推定値を提供する。
CMI推定の応用として、実データ上での条件付き独立テスト(CI)のための推定器をデプロイし、最先端のCIテスタよりも優れた結果を得る。
論文 参考訳(メタデータ) (2020-05-17T11:22:12Z) - Generalization Bounds and Representation Learning for Estimation of
Potential Outcomes and Causal Effects [61.03579766573421]
代替薬に対する患者一人の反応など,個人レベルの因果効果の推定について検討した。
我々は,表現の誘導的処理群距離を正規化することにより,境界を最小化する表現学習アルゴリズムを考案した。
これらのアルゴリズムを拡張して、重み付き表現を同時に学習し、治療群距離をさらに削減する。
論文 参考訳(メタデータ) (2020-01-21T10:16:33Z) - Learning Overlapping Representations for the Estimation of
Individualized Treatment Effects [97.42686600929211]
観測データから代替案の可能性を推定することは難しい問題である。
入力のドメイン不変表現を学習するアルゴリズムは、しばしば不適切であることを示す。
我々は,様々なベンチマークデータセットの最先端性を大幅に向上させる,ディープカーネル回帰アルゴリズムと後続正規化フレームワークを開発した。
論文 参考訳(メタデータ) (2020-01-14T12:56:29Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。