論文の概要: Positivity Validation Detection and Explainability via Zero Fraction
Multi-Hypothesis Testing and Asymmetrically Pruned Decision Trees
- arxiv url: http://arxiv.org/abs/2111.04033v1
- Date: Sun, 7 Nov 2021 08:32:58 GMT
- ステータス: 処理完了
- システム内更新日: 2021-11-09 17:29:32.485723
- Title: Positivity Validation Detection and Explainability via Zero Fraction
Multi-Hypothesis Testing and Asymmetrically Pruned Decision Trees
- Title(参考訳): ゼロフラクション多相試験と非対称切断決定木による正の検証と説明可能性
- Authors: Guy Wolf, Gil Shabat, Hanan Shteingart
- Abstract要約: 陽性は、観測データから因果推論を行う3つの条件の1つである。
非専門家による因果推論の能力を民主化するためには、肯定性をテストするアルゴリズムを設計する必要がある。
- 参考スコア(独自算出の注目度): 7.688686113950607
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Positivity is one of the three conditions for causal inference from
observational data. The standard way to validate positivity is to analyze the
distribution of propensity. However, to democratize the ability to do causal
inference by non-experts, it is required to design an algorithm to (i) test
positivity and (ii) explain where in the covariate space positivity is lacking.
The latter could be used to either suggest the limitation of further causal
analysis and/or encourage experimentation where positivity is violated. The
contribution of this paper is first present the problem of automatic positivity
analysis and secondly to propose an algorithm based on a two steps process. The
first step, models the propensity condition on the covariates and then analyze
the latter distribution using multiple hypothesis testing to create positivity
violation labels. The second step uses asymmetrically pruned decision trees for
explainability. The latter is further converted into readable text a non-expert
can understand. We demonstrate our method on a proprietary data-set of a large
software enterprise.
- Abstract(参考訳): 陽性は、観測データから因果推論を行う3つの条件の1つである。
正当性を検証する標準的な方法は、正当性の分布を分析することである。
しかし、非専門家による因果推論の能力を民主化するためには、アルゴリズムを設計する必要がある。
(i)肯定性を検査し、
(ii)共変量空間の正の欠如について説明する。
後者は、さらなる因果解析の限界を示唆したり、肯定性に反する実験を奨励するために用いられる。
本論文の貢献は, 第一に, 自動ポジティビティ解析の問題を提示し, 第二に, 2ステッププロセスに基づくアルゴリズムを提案することである。
最初のステップは、共変量に対する確率条件をモデル化し、次に複数の仮説テストを用いて後者の分布を分析して、肯定的違反ラベルを生成する。
第2のステップは、説明可能性のために非対称に刈り取られた決定木を使用する。
後者は、非専門家が理解できる読みやすいテキストに変換される。
我々は,大規模ソフトウェア企業のプロプライエタリなデータセット上で本手法を実証する。
関連論文リスト
- Measuring the Reliability of Causal Probing Methods: Tradeoffs, Limitations, and the Plight of Nullifying Interventions [3.173096780177902]
因果探索は、大きな言語モデルのような基礎モデルを理解するためのアプローチである。
本稿では、因果探索介入の信頼性を評価するための一般的な実証分析フレームワークを提案する。
論文 参考訳(メタデータ) (2024-08-28T03:45:49Z) - Fuzzy Fault Trees Formalized [1.640922391885265]
ファジィ論理は曖昧な値を扱うための一般的なフレームワークである。
本稿では,ファジィ不確実性値に対する厳密な枠組みを定義する。
また,システムのファジィ信頼性を効率的に計算するボトムアップアルゴリズムを提案する。
論文 参考訳(メタデータ) (2024-03-13T14:45:54Z) - Joint empirical risk minimization for instance-dependent
positive-unlabeled data [4.112909937203119]
正とラベルなしのデータ(PU学習)からの学習は、機械学習のタスクとして積極的に研究されている。
目標は、ラベル付きインスタンスとラベルなしインスタンスの一部を含むデータセットに基づいて、バイナリ分類モデルをトレーニングすることだ。
ラベルなし集合は、残りの部分の正と全ての負の観察を含む。
論文 参考訳(メタデータ) (2023-12-27T12:45:12Z) - Shortcomings of Top-Down Randomization-Based Sanity Checks for
Evaluations of Deep Neural Network Explanations [67.40641255908443]
モデルランダム化に基づく正当性チェックの限界を,説明書の評価のために同定する。
トップダウンモデルランダム化は、フォワードパスアクティベーションのスケールを高い確率で保存する。
論文 参考訳(メタデータ) (2022-11-22T18:52:38Z) - Bounding Counterfactuals under Selection Bias [60.55840896782637]
本稿では,識別不能なクエリと識別不能なクエリの両方に対処するアルゴリズムを提案する。
選択バイアスによって引き起こされる欠如にもかかわらず、利用可能なデータの可能性は無限であることを示す。
論文 参考訳(メタデータ) (2022-07-26T10:33:10Z) - Logical Satisfiability of Counterfactuals for Faithful Explanations in
NLI [60.142926537264714]
本稿では, 忠実度スルー・カウンタファクトの方法論について紹介する。
これは、説明に表される論理述語に基づいて、反実仮説を生成する。
そして、そのモデルが表現された論理と反ファクトの予測が一致しているかどうかを評価する。
論文 参考訳(メタデータ) (2022-05-25T03:40:59Z) - Kernel Robust Hypothesis Testing [20.78285964841612]
本稿では,カーネル方式を用いて不確実性集合をデータ駆動方式で構築する。
目標は、不確実性集合上の最悪のケース分布の下でうまく機能するテストを設計することである。
Neyman-Pearsonの設定では、誤検知の最悪のケース確率を最小限に抑え、誤警報の最悪のケース確率を制約する。
論文 参考訳(メタデータ) (2022-03-23T23:59:03Z) - Nested Counterfactual Identification from Arbitrary Surrogate
Experiments [95.48089725859298]
観測と実験の任意の組み合わせからネスト反事実の同定について検討した。
具体的には、任意のネストされた反事実を非ネストされたものへ写像できる反ファクト的非ネスト定理(英語版)(CUT)を証明する。
論文 参考訳(メタデータ) (2021-07-07T12:51:04Z) - Provable Guarantees for Self-Supervised Deep Learning with Spectral
Contrastive Loss [72.62029620566925]
自己教師型学習の最近の研究は、対照的な学習パラダイムを頼りに、最先端の技術の進歩を遂げている。
我々の研究は、正の対の条件的独立性を仮定することなく、対照的な学習を分析する。
本稿では,人口増分グラフ上でスペクトル分解を行う損失を提案し,コントラスト学習目的として簡潔に記述することができる。
論文 参考訳(メタデータ) (2021-06-08T07:41:02Z) - The Curse of Performance Instability in Analysis Datasets: Consequences,
Source, and Suggestions [93.62888099134028]
自然言語推論(NLI)および読み込み(RC)解析/ストレスセットにおける最先端モデルの性能は極めて不安定であることがわかった。
このことは、(1)不安定さがこれらの分析セットに基づいて引き出された結論の信頼性にどのように影響するかという3つの疑問を提起する。
不安定の原因に関する理論的説明と実証的証拠の両方を提示する。
論文 参考訳(メタデータ) (2020-04-28T15:41:12Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。