論文の概要: Instrumental Variable Estimation for Compositional Treatments
- arxiv url: http://arxiv.org/abs/2106.11234v3
- Date: Tue, 28 May 2024 13:25:04 GMT
- ステータス: 処理完了
- システム内更新日: 2024-05-30 05:05:50.216958
- Title: Instrumental Variable Estimation for Compositional Treatments
- Title(参考訳): 構成的処理のための機器変数推定
- Authors: Elisabeth Ailer, Christian L. Müller, Niki Kilbertus,
- Abstract要約: 構成データは、生態学における種数、単細胞シークエンシングデータ由来の細胞型組成物、および微生物研究におけるアンプリコン量データを含む。
ここでは、構成が原因となる機器変数設定において、構成データに対する因果的視点を提供する。
- 参考スコア(独自算出の注目度): 4.656302602746229
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Many scientific datasets are compositional in nature. Important biological examples include species abundances in ecology, cell-type compositions derived from single-cell sequencing data, and amplicon abundance data in microbiome research. Here, we provide a causal view on compositional data in an instrumental variable setting where the composition acts as the cause. First, we crisply articulate potential pitfalls for practitioners regarding the interpretation of compositional causes from the viewpoint of interventions and warn against attributing causal meaning to common summary statistics such as diversity indices in microbiome data analysis. We then advocate for and develop multivariate methods using statistical data transformations and regression techniques that take the special structure of the compositional sample space into account while still yielding scientifically interpretable results. In a comparative analysis on synthetic and real microbiome data we show the advantages and limitations of our proposal. We posit that our analysis provides a useful framework and guidance for valid and informative cause-effect estimation in the context of compositional data.
- Abstract(参考訳): 多くの科学的データセットは自然界において構成的である。
重要な生物学的例としては、生態学における種数、単細胞シークエンシングデータ由来の細胞型組成物、およびマイクロバイオーム研究におけるアンプリコン量データがある。
ここでは、構成が原因となる機器変数設定において、構成データに対する因果的視点を提供する。
まず,微生物データ分析における多様性指標などの共通要約統計に因果的意味を寄与しないことを警告し,介入の観点から構成原因の解釈について,実践者の潜在的な落とし穴を明確に述べる。
次に, 構成標本空間の特殊構造を考慮した統計的データ変換と回帰手法を用いた多変量解析手法を提唱, 開発し, 科学的に解釈可能な結果を得た。
合成バイオームデータと実バイオームデータの比較分析では,提案手法の利点と限界が示された。
本分析は, コンポジションデータの文脈において, 有効かつ有意義な原因効果推定のための有用なフレームワークとガイダンスを提供するものであると仮定する。
関連論文リスト
- Meta-Learners for Partially-Identified Treatment Effects Across Multiple Environments [67.80453452949303]
観察データから条件平均治療効果(CATE)を推定することは、パーソナライズされた医療など多くの応用に関係している。
ここでは、観測データが複数の環境からやってくる広範囲な環境に焦点を当てる。
任意の機械学習モデルと組み合わせて使用可能な境界を推定するために、異なるモデルに依存しない学習者(いわゆるメタ学習者)を提案する。
論文 参考訳(メタデータ) (2024-06-04T16:31:43Z) - Domain adaptation in small-scale and heterogeneous biological datasets [0.0]
生物研究におけるドメイン適応のメリットと課題について論じる。
計算生物学者のツールキットにドメイン適応技術を導入することについて論じる。
論文 参考訳(メタデータ) (2024-05-29T16:01:15Z) - Seeing Unseen: Discover Novel Biomedical Concepts via
Geometry-Constrained Probabilistic Modeling [53.7117640028211]
同定された問題を解決するために,幾何制約付き確率的モデリング処理を提案する。
構成された埋め込み空間のレイアウトに適切な制約を課すために、重要な幾何学的性質のスイートを組み込む。
スペクトルグラフ理論法は、潜在的な新規クラスの数を推定するために考案された。
論文 参考訳(メタデータ) (2024-03-02T00:56:05Z) - Perturbation-based Effect Measures for Compositional Data [3.9543275888781224]
構成的特徴に対する既存の効果測定は、現代の多くの応用には不十分である。
両問題に対処する仮説データ摂動に基づくフレームワークを提案する。
摂動依存再パラメータ化を導出することにより, 摂動効果の平均を効率的に推定できることを示す。
論文 参考訳(メタデータ) (2023-11-30T12:27:15Z) - A Causal Framework for Decomposing Spurious Variations [68.12191782657437]
我々はマルコフモデルとセミマルコフモデルの急激な変分を分解するツールを開発する。
突発効果の非パラメトリック分解を可能にする最初の結果を証明する。
説明可能なAIや公平なAIから、疫学や医学における疑問まで、いくつかの応用がある。
論文 参考訳(メタデータ) (2023-06-08T09:40:28Z) - Supervised Learning and Model Analysis with Compositional Data [4.082799056366927]
KernelBiomeはカーネルベースの非パラメトリック回帰分類フレームワークである。
我々は、最先端の機械学習手法と比較して、同等または改善された性能を示す。
論文 参考訳(メタデータ) (2022-05-15T12:33:43Z) - Equivariance Allows Handling Multiple Nuisance Variables When Analyzing
Pooled Neuroimaging Datasets [53.34152466646884]
本稿では,構造空間上でインスタンス化された同変表現学習における最近の結果と,因果推論における古典的結果の簡易な利用が,いかに効果的に実現されたかを示す。
いくつかの仮定の下で、我々のモデルが複数のニュアンス変数を扱えることを実証し、そうでなければサンプルの大部分を取り除く必要のあるシナリオにおいて、プールされた科学データセットの分析を可能にする。
論文 参考訳(メタデータ) (2022-03-29T04:54:06Z) - Combining Observational and Randomized Data for Estimating Heterogeneous
Treatment Effects [82.20189909620899]
不均一な治療効果を推定することは、多くの領域において重要な問題である。
現在、現存するほとんどの作品は観測データにのみ依存している。
本稿では、大量の観測データと少量のランダム化データを組み合わせることで、不均一な処理効果を推定する。
論文 参考訳(メタデータ) (2022-02-25T18:59:54Z) - Statistical Analytics and Regional Representation Learning for COVID-19
Pandemic Understanding [4.731074162093199]
新型コロナウイルスの感染拡大が世界のほぼすべての国に深刻な影響を与えている。
本稿では、統一された情報ソースを提供するために、公開データセットの広範なコレクションを統合し、処理する。
本研究では,予測イベントモデリングのために,DoubleWindowLSTM-CPと呼ばれる特定のRNNベースの推論パイプラインを提案する。
論文 参考訳(メタデータ) (2020-08-08T03:35:16Z) - Enabling Counterfactual Survival Analysis with Balanced Representations [64.17342727357618]
生存データは様々な医学的応用、すなわち薬物開発、リスクプロファイリング、臨床試験で頻繁に見られる。
本稿では,生存結果に適用可能な対実的推論のための理論的基盤を持つ統一的枠組みを提案する。
論文 参考訳(メタデータ) (2020-06-14T01:15:00Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。