論文の概要: Positive-Unlabeled Learning for Control Group Construction in Observational Causal Inference
- arxiv url: http://arxiv.org/abs/2507.14528v1
- Date: Sat, 19 Jul 2025 08:06:08 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-07-22 20:51:31.927672
- Title: Positive-Unlabeled Learning for Control Group Construction in Observational Causal Inference
- Title(参考訳): 観測因果推論における制御群構築のための正非ラベル学習
- Authors: Ilias Tsoumas, Dimitrios Bormpoudakis, Vasileios Sitokonstantinou, Athanasios Askitopoulos, Andreas Kalogeras, Charalampos Kontoes, Ioannis Athanasiadis,
- Abstract要約: 治療単位と管理単位の両方へのアクセスは、治療が興味ある結果に与える影響を推定するために不可欠である。
一般的な課題は、コントロールとして明確にラベル付けされたユニットの欠如である。
我々は,信頼度が高く,未ラベルのプールから制御ユニットを識別するためのフレームワークとして,肯定的未ラベル学習(PU)を提案する。
- 参考スコア(独自算出の注目度): 3.8266403895736776
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: In causal inference, whether through randomized controlled trials or observational studies, access to both treated and control units is essential for estimating the effect of a treatment on an outcome of interest. When treatment assignment is random, the average treatment effect (ATE) can be estimated directly by comparing outcomes between groups. In non-randomized settings, various techniques are employed to adjust for confounding and approximate the counterfactual scenario to recover an unbiased ATE. A common challenge, especially in observational studies, is the absence of units clearly labeled as controls-that is, units known not to have received the treatment. To address this, we propose positive-unlabeled (PU) learning as a framework for identifying, with high confidence, control units from a pool of unlabeled ones, using only the available treated (positive) units. We evaluate this approach using both simulated and real-world data. We construct a causal graph with diverse relationships and use it to generate synthetic data under various scenarios, assessing how reliably the method recovers control groups that allow estimates of true ATE. We also apply our approach to real-world data on optimal sowing and fertilizer treatments in sustainable agriculture. Our findings show that PU learning can successfully identify control (negative) units from unlabeled data based only on treated units and, through the resulting control group, estimate an ATE that closely approximates the true value. This work has important implications for observational causal inference, especially in fields where randomized experiments are difficult or costly. In domains such as earth, environmental, and agricultural sciences, it enables a plethora of quasi-experiments by leveraging available earth observation and climate data, particularly when treated units are available but control units are lacking.
- Abstract(参考訳): 因果推論では、ランダム化比較試験や観察研究を通じても、治療結果に対する治療の効果を推定するためには、治療単位と管理単位の両方へのアクセスが不可欠である。
治療代入がランダムである場合には、グループ間の結果を比較することにより、平均治療効果(ATE)を直接推定することができる。
非ランダム化環境では,非バイアスのATEを回復するために,相反するシナリオを調整し,近似するために様々な手法が用いられる。
一般的な課題は、特に観察研究において、治療を受けていないことが知られているコントロールとして明確にラベル付けされたユニットが存在しないことである。
そこで本稿では, 信頼度が高く, 使用可能な(ポジティブな)単位のみを用いて, ラベルなし単位のプールから制御ユニットを識別するフレームワークとして, 肯定的非ラベル付き学習を提案する。
我々は、シミュレーションデータと実世界のデータの両方を用いて、このアプローチを評価する。
本研究では,多種多様な関係を持つ因果グラフを構築し,様々なシナリオ下で合成データを生成する。
また,持続可能な農業における最適播種・肥料処理に関する実世界のデータにもアプローチを適用した。
その結果,PU学習は処理単位のみに基づいてラベル付きデータから制御単位(負)を同定し,結果の制御群を通じて真値に近似したATEを推定できることがわかった。
この研究は、特にランダム化実験が困難または費用がかかる分野において、観察因果推論に重要な意味を持つ。
地球、環境、農業科学などの分野では、利用可能な地球観測データや気候データを活用することで、準実験の多元化を可能にしている。
関連論文リスト
- Conditional Average Treatment Effect Estimation Under Hidden Confounders [25.62280114114055]
擬似共同生成器とCATEモデルに基づくCATE推定手法を提案する。
我々の方法は、特にプライバシーが懸念される多くの実践的なシナリオに当てはまる。
論文 参考訳(メタデータ) (2025-06-14T01:43:07Z) - PUATE: Efficient Average Treatment Effect Estimation from Treated (Positive) and Unlabeled Units [7.8856737627153874]
我々は、治療群とラベルなし群のみを観察する環境で、ATEのための半パラメトリック効率的な推定器を開発した。
本研究は,データ不足と弱教師付き学習による因果推論の文献化に寄与する。
論文 参考訳(メタデータ) (2025-01-31T17:47:32Z) - Post Launch Evaluation of Policies in a High-Dimensional Setting [4.710921988115686]
A/Bテスト(A/B test)またはランダム化制御実験(RCTs)は、新しいポリシー、製品、決定の影響を評価するための金の標準である。
本稿では「合成制御」にインスパイアされた方法論の適用に関する実践的考察を考察する。
合成制御法は、影響を受けていない単位からのデータを利用して、処理された単位に対する対実的な結果を推定する。
論文 参考訳(メタデータ) (2024-12-30T19:35:29Z) - B-Learner: Quasi-Oracle Bounds on Heterogeneous Causal Effects Under
Hidden Confounding [51.74479522965712]
本稿では,B-Learnerと呼ばれるメタラーナーを提案する。
我々は、その推定が有効で、鋭く、効率的であることを証明し、既存の方法よりも一般的な条件下で構成推定器に対して準オーラル特性を持つことを示した。
論文 参考訳(メタデータ) (2023-04-20T18:07:19Z) - Falsification before Extrapolation in Causal Effect Estimation [6.715453431174765]
個体群における因果関係は、しばしば観測データを用いて推定される。
本稿では,偏りのある観測推定を拒否するメタアルゴリズムを提案する。
論文 参考訳(メタデータ) (2022-09-27T21:47:23Z) - The interventional Bayesian Gaussian equivalent score for Bayesian
causal inference with unknown soft interventions [0.0]
ゲノミクスのような特定の環境では、不均一な研究条件からのデータがあり、研究変数のサブセットのみに関連するソフトな(部分的な)介入がある。
観察データと介入データとの混合に対する介入BGeスコアを定義し,介入の目的と効果が不明である可能性がある。
論文 参考訳(メタデータ) (2022-05-05T12:32:08Z) - Combining Observational and Randomized Data for Estimating Heterogeneous
Treatment Effects [82.20189909620899]
不均一な治療効果を推定することは、多くの領域において重要な問題である。
現在、現存するほとんどの作品は観測データにのみ依存している。
本稿では、大量の観測データと少量のランダム化データを組み合わせることで、不均一な処理効果を推定する。
論文 参考訳(メタデータ) (2022-02-25T18:59:54Z) - Treatment Effect Risk: Bounds and Inference [58.442274475425144]
平均的な治療効果は社会福祉の変化を測定するため、たとえ肯定的であっても、人口の約10%に悪影響を及ぼすリスクがある。
本稿では,ICT分布のリスク条件値(CVaR)として定式化されたこの重要なリスク尺度をどう評価するかを検討する。
いくつかの境界は、複素CATE関数を単一の計量に要約したものと解釈することもでき、有界であることとは無関係に興味を持つ。
論文 参考訳(メタデータ) (2022-01-15T17:21:26Z) - Multi-Source Causal Inference Using Control Variates [81.57072928775509]
本稿では,複数のデータソースから因果効果を推定するアルゴリズムを提案する。
理論的には、これはATE推定値の分散を減少させる。
このフレームワークを結果選択バイアスの下で観測データからの推論に適用する。
論文 参考訳(メタデータ) (2021-03-30T21:20:51Z) - Enabling Counterfactual Survival Analysis with Balanced Representations [64.17342727357618]
生存データは様々な医学的応用、すなわち薬物開発、リスクプロファイリング、臨床試験で頻繁に見られる。
本稿では,生存結果に適用可能な対実的推論のための理論的基盤を持つ統一的枠組みを提案する。
論文 参考訳(メタデータ) (2020-06-14T01:15:00Z) - Generalization Bounds and Representation Learning for Estimation of
Potential Outcomes and Causal Effects [61.03579766573421]
代替薬に対する患者一人の反応など,個人レベルの因果効果の推定について検討した。
我々は,表現の誘導的処理群距離を正規化することにより,境界を最小化する表現学習アルゴリズムを考案した。
これらのアルゴリズムを拡張して、重み付き表現を同時に学習し、治療群距離をさらに削減する。
論文 参考訳(メタデータ) (2020-01-21T10:16:33Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。