論文の概要: Optimal Experiments for Partial Causal Effect Identification
- arxiv url: http://arxiv.org/abs/2605.06993v1
- Date: Thu, 07 May 2026 22:16:58 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-05-11 19:43:38.651651
- Title: Optimal Experiments for Partial Causal Effect Identification
- Title(参考訳): 部分因果効果同定のための最適実験
- Authors: Tobias Maringgele, Jalal Etesami,
- Abstract要約: 本研究では,実験結果の観察に先立って,対象クエリのバウンダリを厳格化するコスト制約のある実験のサブセットを選択することの問題点について検討する。
我々はこれを最大効用問題として定式化し、最大効用度は実験によって保証される境界幅の最悪の低減を測る。
我々はID処理実験が慣性的に不活性であることを示し、評価されたサブセットの数を超指数的に削減することを示した。
- 参考スコア(独自算出の注目度): 5.4873584968147275
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Causal queries are often only partially identifiable from observational data, and experiments that could tighten the resulting bounds are typically costly. We study the problem of selecting, prior to observing experimental outcomes, a cost-constrained subset of experiments that maximally tightens bounds on a target query. We formalize this as the max-potency problem, where epistemic potency measures the worst-case reduction in bound width guaranteed by an experiment, and show that this problem is NP-hard via a reduction from 0-1 knapsack. Building on the polynomial-programming framework of Duarte et al. (2023), we give a general procedure for evaluating epistemic potency in discrete settings. To control the super-exponential search space, we introduce two graphical pruning criteria that depend only on the causal graph and the query: a novel path-interception rule that exploits district structure to certify zero potency in linear time, and an identifiability check based on the ID algorithm. On Erdos-Renyi random graphs and 11 bnlearn benchmark networks, the two criteria together prune 50-88% of candidate experiments on average without solving a single polynomial program. For the general subset search, we show that ID-pruned experiments are combinatorially inert, yielding a super-exponential reduction in the number of subsets evaluated. We close with an end-to-end demonstration on observational NHANES data, selecting optimal experiments for estimating the effect of physical activity on diabetes.
- Abstract(参考訳): 因果クエリは観測データから部分的にしか特定できないことが多く、結果として得られる境界を締め付ける実験は通常コストがかかる。
本研究では,実験結果の観察に先立って,対象クエリのバウンダリを最大に締め付けるような,コスト制約のある実験のサブセットを選択する問題について検討する。
我々はこれを,実験によって保証される境界幅の最悪のケース削減を測定する,最大有効性問題として定式化し,この問題を0-1knapsackの削減によるNPハードであることを示す。
Duarte et al (2023) の多項式プログラミングフレームワークを基盤として, 個別設定におけるてんかん性評価の一般的な手順を提案する。
超指数探索空間を制御するために,因果グラフとクエリにのみ依存する2つのグラフィカルプルーニング基準を導入する。
Erdos-Renyiランダムグラフと11bnlearnベンチマークネットワークでは、この2つの基準は1つの多項式プログラムを解くことなく平均で50~88%の候補実験を行う。
一般部分集合探索では,IDを抽出した実験は組合せ的に不活性であり,評価された部分集合数の超指数的に減少することを示す。
我々は、NHANESの観測データに関するエンドツーエンドの実証を行い、糖尿病に対する身体活動の影響を推定するための最適な実験を選択した。
関連論文リスト
- Decomposing Epistemic Uncertainty for Causal Decision Making [24.553201861455477]
観測データからの因果推論は、高価なランダム化試行を行うことなく、意思決定において最良の行動を示す強力な証拠となる。
近年の研究では、ニューラルネットワークを用いて、そのような因果効果の実践的な境界を求めており、しばしば難解な問題である。
本稿では,経験的観測分布に関する信頼度を考慮し,この問題に対処する新しい枠組みを提案する。
論文 参考訳(メタデータ) (2026-01-30T09:18:11Z) - Discovering Causal Relationships using Proxy Variables under Unmeasured Confounding [42.70985072862832]
観測研究における変数ペア間の因果関係の推測は極めて重要であるが,困難である。
我々は,不測の共同設立者の下で因果仮説をテストするために,離散的かつ連続的な設定を両立する一般的な非パラメトリックアプローチを開発する。
Intensive Care Data and World Values Surveyの広範囲なシミュレーションと実世界データによるアプローチの有効性を実証する。
論文 参考訳(メタデータ) (2025-10-20T05:13:12Z) - Design of Experiment for Discovering Directed Mixed Graph [6.3850400710838615]
簡単な構造因果モデル(SCM)の因果グラフ構造を正確に同定するための実験設計の問題について検討する。
周期の存在は、観測データだけでグラフスケルトンを復元することは不可能である。
我々は2種類のアルゴリズム、すなわち有界と無有界のアルゴリズムを開発し、隣り合う2方向のエッジを除いてすべての因果エッジを復元できる。
論文 参考訳(メタデータ) (2025-09-02T02:24:55Z) - Optimal Decision Tree and Adaptive Submodular Ranking with Noisy Outcomes [9.321976218862542]
プールベースのアクティブラーニングでは、学習者にラベルのないデータセットが与えられ、データポイントのラベルをクエリすることで未知の仮説を効率的に学習することを目的としている。
これは古典的最適決定木(ODT)問題として定式化できる: テストのセット、仮説のセット、各テストと仮説に対する結果が与えられた場合、我々の目標は、真の仮説を識別する低コストなテスト手順(すなわち決定木)を見つけることである。
本研究では,ODT問題の基本的変種について検討し,実験結果がうるさい場合,さらに一般的な場合であっても検討する。
論文 参考訳(メタデータ) (2023-12-23T21:47:50Z) - Optimal Multi-Distribution Learning [88.3008613028333]
マルチディストリビューション学習は、$k$の異なるデータ分散における最悪のリスクを最小限に抑える共有モデルを学ぶことを目指している。
本稿では, (d+k)/varepsilon2の順に, サンプルの複雑さを伴って, ヴァレプシロン最適ランダム化仮説を導出するアルゴリズムを提案する。
論文 参考訳(メタデータ) (2023-12-08T16:06:29Z) - Precise Error Rates for Computationally Efficient Testing [67.30044609837749]
本稿では,計算複雑性に着目した単純な対数-単純仮説テストの問題を再考する。
線形スペクトル統計に基づく既存の試験は、I型とII型の誤差率の間の最良のトレードオフ曲線を達成する。
論文 参考訳(メタデータ) (2023-11-01T04:41:16Z) - Statistical and Computational Phase Transitions in Group Testing [73.55361918807883]
本研究の目的は、希少な疾患を患っているk人の集団を同定することである。
個々人のテストを割り当てるための2つの異なる単純なランダムな手順を考える。
論文 参考訳(メタデータ) (2022-06-15T16:38:50Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。