論文の概要: Learning Probabilities of Causation from Finite Population Data
- arxiv url: http://arxiv.org/abs/2210.08453v1
- Date: Sun, 16 Oct 2022 05:46:25 GMT
- ステータス: 処理完了
- システム内更新日: 2022-10-18 17:40:26.747661
- Title: Learning Probabilities of Causation from Finite Population Data
- Title(参考訳): 有限人口データによる因果関係の学習確率
- Authors: Ang Li, Song Jiang, Yizhou Sun, Judea Pearl
- Abstract要約: 本研究では,有限個体群データに基づくサブ集団に対する因果関係の確率境界の学習を支援する機械学習モデルを提案する。
本研究では, 機械学習モデルを用いて, 人口32768人を対象に, 有限個体群データから約500人分のPSNを学習できることを示す。
- 参考スコア(独自算出の注目度): 40.99426447422972
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: This paper deals with the problem of learning the probabilities of causation
of subpopulations given finite population data. The tight bounds of three basic
probabilities of causation, the probability of necessity and sufficiency (PNS),
the probability of sufficiency (PS), and the probability of necessity (PN),
were derived by Tian and Pearl. However, obtaining the bounds for each
subpopulation requires experimental and observational distributions of each
subpopulation, which is usually impractical to estimate given finite population
data. We propose a machine learning model that helps to learn the bounds of the
probabilities of causation for subpopulations given finite population data. We
further show by a simulated study that the machine learning model is able to
learn the bounds of PNS for 32768 subpopulations with only knowing roughly 500
of them from the finite population data.
- Abstract(参考訳): 本稿では,有限人口データに基づく集団の因果関係の確率を学習する問題を扱う。
因果関係の3つの基本的な確率、必然性と充足の確率(pns)、充足の確率(ps)、必然性の確率(pn)のタイトな境界は、天と真珠によって導かれた。
しかしながら、各サブポピュレーションのバウンダリを得るには、実験的および観察的な各サブポピュレーションの分布が必要である。
本研究では,有限個体群データに対する因果関係の確率の限界を学習するための機械学習モデルを提案する。
さらに, 機械学習モデルにより, 人口32768人を対象に, 有限個体群データから約500人程度しか知ることなく, PNSの境界を学習できることを示す。
関連論文リスト
- Optimal Multi-Distribution Learning [88.3008613028333]
マルチディストリビューション学習は、$k$の異なるデータ分散における最悪のリスクを最小限に抑える共有モデルを学ぶことを目指している。
本稿では, (d+k)/varepsilon2の順に, サンプルの複雑さを伴って, ヴァレプシロン最適ランダム化仮説を導出するアルゴリズムを提案する。
論文 参考訳(メタデータ) (2023-12-08T16:06:29Z) - s-ID: Causal Effect Identification in a Sub-Population [23.221279036710012]
サブポピュレーション(s-ID)における因果推論問題の導入と提唱
サブ人口における既存の推論問題は、与えられたデータが全人口に由来するという前提で機能する。
我々は,そのサブポピュレーションの観察分布から同定可能なサブポピュレーションにおける因果効果を因果グラフに保持しなければならない必要十分条件を提供する。
論文 参考訳(メタデータ) (2023-09-05T14:43:10Z) - Probabilities of Causation: Role of Observational Data [20.750773939911685]
本稿では,境界値の品質向上を図る上で,観測データに価値がある条件について論じる。
また、Li と Pearl によって定義される単位選択問題に対して提案された定理を適用する。
論文 参考訳(メタデータ) (2022-10-17T09:10:11Z) - Probabilities of Causation: Adequate Size of Experimental and
Observational Samples [17.565045120151865]
テアンとパールは, 必要十分性(PNS), 十分性(PS), 必要性(PN)について, 実験的および観察的データを用いて, 鋭い境界を導出した。
この仮定は、実験的な分布と観測的な分布を正確に推定するために十分な量のサンプルを保有しているというものである。
本稿では、所定の信頼区間(CI)が特定された場合に、そのような推定に必要なサンプルサイズを決定する方法を提案する。
論文 参考訳(メタデータ) (2022-10-10T21:59:49Z) - Reconciling Individual Probability Forecasts [78.0074061846588]
データに同意する2つの当事者は、個々の確率をモデル化する方法に異を唱えることができない。
個々の確率は不可知であるが、計算的かつデータ効率のよいプロセスで競合できると結論付ける。
論文 参考訳(メタデータ) (2022-09-04T20:20:35Z) - Evaluating Distributional Distortion in Neural Language Modeling [81.83408583979745]
稀な事象の重みは、言語における分布の総確率質量のかなりの量を占める。
パープレキシティなどの標準言語モデリングメトリクスは、集約された言語モデル(LM)のパフォーマンスを定量化する。
自然言語を人工言語として訓練した生成モデルを用いた制御評価手法を開発した。
論文 参考訳(メタデータ) (2022-03-24T01:09:46Z) - Causes of Effects: Learning individual responses from population data [23.593582720307207]
個別化の問題とその医学への応用について研究する。
例えば、治療の恩恵を受ける確率は、治療された場合の好ましくない結果と、治療されていない場合の好ましくない結果である。
必要十分度(PNS)の確率に限界を当て、グラフィカルな基準や実用的応用とともに既存の研究を分析・拡大します。
論文 参考訳(メタデータ) (2021-04-28T12:38:11Z) - General stochastic separation theorems with optimal bounds [68.8204255655161]
分離性の現象が明らかになり、機械学習で人工知能(AI)システムのエラーを修正し、AI不安定性を分析するために使用された。
エラーやエラーのクラスタは、残りのデータから分離することができる。
AIシステムを修正する能力は、それに対する攻撃の可能性も開き、高次元性は、同じ分離性によって引き起こされる脆弱性を誘発する。
論文 参考訳(メタデータ) (2020-10-11T13:12:41Z) - Cumulative deviation of a subpopulation from the full population [0.0]
サブ人口の扱いにおける株式の評価には、全人口のすべての個人に数値的な「スコア」を割り当てることがしばしば必要である。
このようなスコアが与えられた場合、同様のスコアを持つ個人は、サブポピュレーションにおける個人のメンバーシップとは独立して、同様の結果が得られるかもしれないし、得られないかもしれない。
累積プロットは、グラフのセカント線の傾斜線として、サブポピュレーション偏差を直接エンコードする。
論文 参考訳(メタデータ) (2020-08-04T19:30:02Z) - Survival Cluster Analysis [93.50540270973927]
異なるリスクプロファイルを持つサブポピュレーションを特定するために、生存分析には未解決の必要性がある。
このニーズに対処するアプローチは、個々の成果のキャラクタリゼーションを改善する可能性が高い。
論文 参考訳(メタデータ) (2020-02-29T22:41:21Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。