Fugu-MT 論文翻訳(概要): Robustly estimating heterogeneity in factorial data using Rashomon Partitions

論文の概要: Robustly estimating heterogeneity in factorial data using Rashomon Partitions

arxiv url: http://arxiv.org/abs/2404.02141v2
Date: Tue, 25 Jun 2024 18:17:43 GMT
ステータス: 翻訳完了
システム内更新日: 2024-06-27 18:45:18.409790
Title: Robustly estimating heterogeneity in factorial data using Rashomon Partitions
Title（参考訳）: 羅生門分割を用いた因子データのロバストな不均一性推定
Authors: Aparajithan Venkateswaran, Anirudh Sankar, Arun G. Chandrasekhar, Tyler H. McCormick,
Abstract要約: 我々は、羅生門分割集合(RPS)と呼ばれる別の視点を開発する。 RPSは、たとえ実質的に異なる説明を提供するとしても、最大アフターディパーティションの近くに後続値を持つすべてのパーティションを組み込む。提案手法を,チャリタブルギフトの価格効果,染色体構造(テロメア長),マイクロファイナンス導入の3つの経験的設定に適用した。
参考スコア（独自算出の注目度）: 4.76518127830168
License: http://creativecommons.org/licenses/by-nc-nd/4.0/
Abstract: Many statistical analyses, in both observational data and randomized control trials, ask: how does the outcome of interest vary with combinations of observable covariates? How do various drug combinations affect health outcomes, or how does technology adoption depend on incentives and demographics? Our goal is to partition this factorial space into "pools" of covariate combinations where the outcome differs across the pools (but not within a pool). Existing approaches (i) search for a single "optimal" partition under assumptions about the association between covariates or (ii) sample from the entire set of possible partitions. Both these approaches ignore the reality that, especially with correlation structure in covariates, many ways to partition the covariate space may be statistically indistinguishable, despite very different implications for policy or science. We develop an alternative perspective, called Rashomon Partition Sets (RPSs). Each item in the RPS partitions the space of covariates using a tree-like geometry. RPSs incorporate all partitions that have posterior values near the maximum a posteriori partition, even if they offer substantively different explanations, and do so using a prior that makes no assumptions about associations between covariates. This prior is the $\ell_0$ prior, which we show is minimax optimal. Given the RPS we calculate the posterior of any measurable function of the feature effects vector on outcomes, conditional on being in the RPS. We also characterize approximation error relative to the entire posterior and provide bounds on the size of the RPS. Simulations demonstrate this framework allows for robust conclusions relative to conventional regularization techniques. We apply our method to three empirical settings: price effects on charitable giving, chromosomal structure (telomere length), and the introduction of microfinance.
Abstract（参考訳）: 多くの統計分析では、観測データとランダム化制御試験の両方において、関心の結果は観測可能な共変量の組み合わせとどのように異なるのか? 様々な薬物の組み合わせが健康にどのような影響を及ぼすのか、テクノロジーの採用はインセンティブや人口統計にどのように依存するのか? 私たちのゴールは、この因子空間を、(プール内ではなく)プール間で結果が異なる共変量の組み合わせの「プール」に分割することです。既存のアプローチ一共変量体又は共変量体間の関連を前提とした一の「最適」分割の探索 (ii) 可能なパーティションの集合全体のサンプル。これらのアプローチは、特に共変量空間の相関構造において、多くの方法で共変量空間を分割することは、政策や科学に全く異なる意味を持つにもかかわらず統計的に区別できないという現実を無視している。我々は、羅生門分割セット(RPS)と呼ばれる別の視点を開発する。 RPSの各項目は木のような幾何学を用いて共変量の空間を分割する。 RPSは、たとえ実質的に異なる説明を提供するとしても、最大 A 後方分割の近傍で後続値を持つすべての分割を包含し、前者は共変量間の関係について仮定しない。これは$\ell_0$ pre で、minimax が最適であることを示す。 RPS が与えられたとき、特徴効果ベクトルの任意の測定可能な関数の後部、つまり RPS に含まれる条件を計算します。また, 後方に対する近似誤差を特徴付けるとともに, RPSの大きさに限界を与える。シミュレーションは、このフレームワークが従来の正規化手法と比較して堅牢な結論を導くことを実証している。提案手法は,チャリタブルギフトの価格効果,染色体構造(テロメア長),マイクロファイナンスの導入の3つの経験的設定に適用した。

関連論文リスト

Covariate-assisted Grade of Membership Models via Shared Latent Geometry [0.7939348535496568]
メンバーシップモデルのグレードは、個人レベルの混合メンバーシップスコアを通して多変量カテゴリデータを解析するための柔軟な潜在変数モデルである。補助共変量体を組み込む従来のアプローチは、一般に完全に指定された関節の確率に依存しており、計算的に集中しており、誤特定に敏感である。我々は,共変量支援型メンバシップモデルを導入し,共変量情報を統合する。
論文参考訳（メタデータ） (2026-01-24T02:30:36Z)
Model Correlation Detection via Random Selection Probing [62.093777777813756]
既存の類似性に基づく手法では、モデルパラメータにアクセスしたり、しきい値なしでスコアを生成する必要がある。本稿では,モデル相関検出を統計的テストとして定式化する仮説テストフレームワークであるランダム選択探索(RSP)を紹介する。 RSPは相関の証拠を定量化する厳密なp-値を生成する。
論文参考訳（メタデータ） (2025-09-29T01:40:26Z)
Going from a Representative Agent to Counterfactuals in Combinatorial Choice [1.7074019866492325]
本稿では,二元多面体の集合からデータを抽出する意思決定問題について検討する。本稿では,代表エージェントモデルに基づく非パラメトリックな非実例推論手法を提案する。
論文参考訳（メタデータ） (2025-05-29T15:24:23Z)
Representation Learning Preserving Ignorability and Covariate Matching for Treatment Effects [18.60804431844023]
観測データから治療効果を推定することは, 隠れたコンバウンディングにより困難である。隠れた欠点と選択バイアスの両方に対処する共通のフレームワークが欠落している。
論文参考訳（メタデータ） (2025-04-29T09:33:56Z)
Towards Self-Supervised Covariance Estimation in Deep Heteroscedastic Regression [102.24287051757469]
深部異方性回帰における自己教師付き共分散推定について検討する。正規分布の間の2-ワッサーシュタイン距離の上界を導出する。幅広い合成データセットと実データセットに対する実験により、提案された2-ワッサーシュタインと擬似ラベルアノテーションが結合した結果、計算的に安価で正確な深部ヘテロ代用回帰が導かれることが示された。
論文参考訳（メタデータ） (2025-02-14T22:37:11Z)
Semiparametric conformal prediction [79.6147286161434]
リスクに敏感なアプリケーションは、複数の、潜在的に相関したターゲット変数に対して、よく校正された予測セットを必要とする。スコアをランダムなベクトルとして扱い、それらの連接関係構造を考慮した予測セットを構築することを目的とする。実世界のレグレッション問題に対して,所望のカバレッジと競争効率について報告する。
論文参考訳（メタデータ） (2024-11-04T14:29:02Z)
Diffusion posterior sampling for simulation-based inference in tall data settings [53.17563688225137]
シミュレーションベース推論(SBI)は、入力パラメータを所定の観測に関連付ける後部分布を近似することができる。本研究では、モデルのパラメータをより正確に推測するために、複数の観測値が利用できる、背の高いデータ拡張について考察する。提案手法を,最近提案した各種数値実験の競合手法と比較し,数値安定性と計算コストの観点から,その優位性を実証した。
論文参考訳（メタデータ） (2024-04-11T09:23:36Z)
Conditional Generative Models are Sufficient to Sample from Any Causal Effect Estimand [9.460857822923842]
観測データからの因果推論は、信頼できる機械学習における多くの応用において重要な役割を果たす。任意の因果グラフを与えられた任意の介入分布からサンプリングする方法を示す。またテキストと画像変数を含むMIMIC-CXRデータセットから高次元干渉サンプルを生成する。
論文参考訳（メタデータ） (2024-02-12T05:48:31Z)
Random Models for Fuzzy Clustering Similarity Measures [0.0]
Adjusted Rand Index (ARI) は、ハードクラスタリングを比較するために広く使われている手法である。本稿では,ハードクラスタリングとファジィクラスタリングの両方に対して直感的で説明可能な3つのランダムモデルを用いて,ARIを計算するための単一のフレームワークを提案する。
論文参考訳（メタデータ） (2023-12-16T00:07:04Z)
Optimal Multi-Distribution Learning [88.3008613028333]
マルチディストリビューション学習は、$k$の異なるデータ分散における最悪のリスクを最小限に抑える共有モデルを学ぶことを目指している。本稿では, (d+k)/varepsilon2の順に, サンプルの複雑さを伴って, ヴァレプシロン最適ランダム化仮説を導出するアルゴリズムを提案する。
論文参考訳（メタデータ） (2023-12-08T16:06:29Z)
TIC-TAC: A Framework for Improved Covariance Estimation in Deep Heteroscedastic Regression [109.69084997173196]
奥行き回帰は、予測分布の平均と共分散を負の対数類似度を用いて共同最適化する。近年の研究では, 共分散推定に伴う課題により, 準最適収束が生じる可能性が示唆されている。 1)予測共分散は予測平均のランダム性を真に捉えているか? その結果, TICは共分散を正確に学習するだけでなく, 負の対数類似性の収束性の向上も促進することがわかった。
論文参考訳（メタデータ） (2023-10-29T09:54:03Z)
Synthetic Combinations: A Causal Inference Framework for Combinatorial Interventions [8.491098180590447]
介入の任意の組み合わせ、すなわち$N×2p$因果パラメータについて、単位特異的な潜在的な結果を学ぶ。様々なパラメーターを推定するために$N×2p$の実験を実行すると、$N$と$p$が成長するほど高価で/または実現不可能である。
論文参考訳（メタデータ） (2023-03-24T18:45:44Z)
Dual-sPLS: a family of Dual Sparse Partial Least Squares regressions for feature selection and prediction with tunable sparsity; evaluation on simulated and near-infrared (NIR) data [1.6099403809839032]
この論文で示された変種であるDual-sPLSは、古典的なPLS1アルゴリズムを一般化する。正確な予測と効率的な解釈のバランスを提供する。コードはRでオープンソースパッケージとして提供される。
論文参考訳（メタデータ） (2023-01-17T21:50:35Z)
Learning from aggregated data with a maximum entropy model [73.63512438583375]
我々は,観測されていない特徴分布を最大エントロピー仮説で近似することにより,ロジスティック回帰と類似した新しいモデルが,集約データからのみ学習されることを示す。我々は、この方法で学習したモデルが、完全な非凝集データでトレーニングされたロジスティックモデルに匹敵するパフォーマンスを達成することができるという、いくつかの公開データセットに関する実証的な証拠を提示する。
論文参考訳（メタデータ） (2022-10-05T09:17:27Z)
Robust and Agnostic Learning of Conditional Distributional Treatment Effects [62.44901952244514]
条件平均治療効果(CATE)は、個々の因果効果の最適点予測である。集約分析では、通常は分布処理効果(DTE)の測定によって対処される。我々は,多種多様な問題に対して条件付きDTE(CDTE)を学習するための,新しい堅牢でモデルに依存しない手法を提供する。
論文参考訳（メタデータ） (2022-05-23T17:40:31Z)
Optimal Clustering with Bandit Feedback [57.672609011609886]
本稿では,バンディットフィードバックを用いたオンラインクラスタリングの問題点について考察する。これは、NPハード重み付きクラスタリング問題をサブルーチンとして解決する必要性を回避するための、シーケンシャルなテストのための新しい停止規則を含む。合成および実世界のデータセットの広範なシミュレーションを通して、BOCの性能は下界と一致し、非適応的ベースラインアルゴリズムよりも大幅に優れることを示す。
論文参考訳（メタデータ） (2022-02-09T06:05:05Z)
Treatment Effect Risk: Bounds and Inference [58.442274475425144]
平均的な治療効果は社会福祉の変化を測定するため、たとえ肯定的であっても、人口の約10%に悪影響を及ぼすリスクがある。本稿では,ICT分布のリスク条件値(CVaR)として定式化されたこの重要なリスク尺度をどう評価するかを検討する。いくつかの境界は、複素CATE関数を単一の計量に要約したものと解釈することもでき、有界であることとは無関係に興味を持つ。
論文参考訳（メタデータ） (2022-01-15T17:21:26Z)
Inverting brain grey matter models with likelihood-free inference: a tool for trustable cytoarchitecture measurements [62.997667081978825]
脳の灰白質細胞構造の特徴は、体密度と体積に定量的に敏感であり、dMRIでは未解決の課題である。我々は新しいフォワードモデル、特に新しい方程式系を提案し、比較的スパースなb殻を必要とする。次に,提案手法を逆転させるため,確率自由推論 (LFI) として知られるベイズ解析から最新のツールを適用した。
論文参考訳（メタデータ） (2021-11-15T09:08:27Z)
Optimization-based Causal Estimation from Heterogenous Environments [35.74340459207312]
CoCoは、純粋な予測と因果推論のギャップを埋める最適化アルゴリズムである。本稿では,本手法の理論的基礎を説明し,シミュレーションおよび実データに対する有効性を示す。
論文参考訳（メタデータ） (2021-09-24T14:21:58Z)
The SKIM-FA Kernel: High-Dimensional Variable Selection and Nonlinear Interaction Discovery in Linear Time [26.11563787525079]
変数選択と推定の両方において、カーネルのトリックが適切なベイズモデルによる計算をO(#共変量)時間に還元する方法を示す。提案手法は,大規模で高次元なデータセットの既存の手法よりも優れている。
論文参考訳（メタデータ） (2021-06-23T13:53:36Z)
Examining and Combating Spurious Features under Distribution Shift [94.31956965507085]
我々は、最小限の統計量という情報理論の概念を用いて、ロバストで刺激的な表現を定義し、分析する。入力分布のバイアスしか持たない場合でも、モデルはトレーニングデータから急激な特徴を拾い上げることができることを証明しています。分析から着想を得た結果,グループDROは,グループ同士の相関関係を直接考慮しない場合に失敗する可能性が示唆された。
論文参考訳（メタデータ） (2021-06-14T05:39:09Z)
Robust Finite Mixture Regression for Heterogeneous Targets [70.19798470463378]
本稿では,サンプルクラスタの探索と,複数の不完全な混合型ターゲットを同時にモデル化するFMRモデルを提案する。我々は、高次元の学習フレームワークの下で、無症状のオラクルのパフォーマンス境界をモデルに提供します。その結果,我々のモデルは最先端の性能を達成できることがわかった。
論文参考訳（メタデータ） (2020-10-12T03:27:07Z)
Optimal Posteriors for Chi-squared Divergence based PAC-Bayesian Bounds and Comparison with KL-divergence based Optimal Posteriors and Cross-Validation Procedure [0.0]
カイ二乗発散に基づくPACBayesian境界の最適後部について,その分布,計算のスケーラビリティ,テストセットの性能について検討した。チ二乗発散に基づく後肢は境界が弱く、試験誤差が悪くなるため、KL発散に基づく後肢による基礎的な正規化が示唆される。
論文参考訳（メタデータ） (2020-08-14T03:15:23Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。