論文の概要: Pursuing Sources of Heterogeneity in Modeling Clustered Population
- arxiv url: http://arxiv.org/abs/2003.04787v2
- Date: Wed, 3 Feb 2021 20:03:13 GMT
- ステータス: 処理完了
- システム内更新日: 2022-12-24 21:56:54.197667
- Title: Pursuing Sources of Heterogeneity in Modeling Clustered Population
- Title(参考訳): 群集人口のモデル化における不均質性要因の追求
- Authors: Yan Li, Chun Yu, Yize Zhao, Robert H. Aseltine, Weixin Yao, Kun Chen
- Abstract要約: 不均一な追従と特徴選択を同時に達成するために、正規化有限混合効果回帰を提案する。
これらの効果の制約付きスパース推定は、共通の効果を持つ変数と不均一な効果を持つ変数の両方を同定する。
アルツハイマー病の遺伝的要因と脳の特徴を関連付けるための画像遺伝学研究、青年期における自殺リスクと学区の特徴との関係を探る公衆衛生学研究、野球選手の給与水準がパフォーマンスと契約状態とどのように関連しているかを理解するためのスポーツ分析研究の3つの応用が提示されている。
- 参考スコア(独自算出の注目度): 16.936362485508774
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Researchers often have to deal with heterogeneous population with mixed
regression relationships, increasingly so in the era of data explosion. In such
problems, when there are many candidate predictors, it is not only of interest
to identify the predictors that are associated with the outcome, but also to
distinguish the true sources of heterogeneity, i.e., to identify the predictors
that have different effects among the clusters and thus are the true
contributors to the formation of the clusters. We clarify the concepts of the
source of heterogeneity that account for potential scale differences of the
clusters and propose a regularized finite mixture effects regression to achieve
heterogeneity pursuit and feature selection simultaneously. As the name
suggests, the problem is formulated under an effects-model parameterization, in
which the cluster labels are missing and the effect of each predictor on the
outcome is decomposed to a common effect term and a set of cluster-specific
terms. A constrained sparse estimation of these effects leads to the
identification of both the variables with common effects and those with
heterogeneous effects. We propose an efficient algorithm and show that our
approach can achieve both estimation and selection consistency. Simulation
studies further demonstrate the effectiveness of our method under various
practical scenarios. Three applications are presented, namely, an imaging
genetics study for linking genetic factors and brain neuroimaging traits in
Alzheimer's disease, a public health study for exploring the association
between suicide risk among adolescents and their school district
characteristics, and a sport analytics study for understanding how the salary
levels of baseball players are associated with their performance and
contractual status.
- Abstract(参考訳): 研究者はしばしば、データ爆発の時代に、様々な回帰関係を持つ異種集団を扱う必要がある。
このような問題において、多くの候補予測者が存在する場合、結果に関連付けられた予測者を特定することだけでなく、真の不均一性の源を識別すること、すなわち、クラスタ間で異なる効果を持つ予測者を特定し、クラスタの形成の真の寄与者となることに関心がある。
本研究では,クラスタの潜在的スケール差を考慮した不均一性源の概念を明らかにし,不均一性追従と特徴選択を同時に達成するための正則化有限混合効果回帰を提案する。
その名が示すように、問題は効果モデルパラメータ化の下で定式化され、クラスタラベルが欠落し、その結果に対する各予測器の影響は共通の効果項とクラスタ固有項の集合に分解される。
これらの効果の制約付きスパース推定は、共通の効果を持つ変数と不均一な効果を持つ変数の両方を同定する。
我々は,効率的なアルゴリズムを提案するとともに,提案手法が推定と選択の一貫性を両立できることを示す。
シミュレーション研究は, 様々なシナリオにおける本手法の有効性を更に実証する。
アルツハイマー病における遺伝的要因と脳神経画像の特徴を関連付けるための画像遺伝学研究、青年期における自殺リスクと学区特性との関係を探求する公衆衛生研究、野球選手の給与水準が成績や契約状態とどのように関連しているかを理解するためのスポーツ分析研究の3つの応用について検討した。
関連論文リスト
- Unifying Causal Representation Learning with the Invariance Principle [21.375611599649716]
因果表現学習は、高次元観測から潜伏因果変数を復元することを目的としている。
我々の主な貢献は、既存の因果表現学習アプローチの多くが、その表現を既知のデータ対称性に方法論的に整合させることである。
論文 参考訳(メタデータ) (2024-09-04T14:51:36Z) - Seeing Unseen: Discover Novel Biomedical Concepts via
Geometry-Constrained Probabilistic Modeling [53.7117640028211]
同定された問題を解決するために,幾何制約付き確率的モデリング処理を提案する。
構成された埋め込み空間のレイアウトに適切な制約を課すために、重要な幾何学的性質のスイートを組み込む。
スペクトルグラフ理論法は、潜在的な新規クラスの数を推定するために考案された。
論文 参考訳(メタデータ) (2024-03-02T00:56:05Z) - Identifiable Latent Polynomial Causal Models Through the Lens of Change [82.14087963690561]
因果表現学習は、観測された低レベルデータから潜在的な高レベル因果表現を明らかにすることを目的としている。
主な課題の1つは、識別可能性(identifiability)として知られるこれらの潜伏因果モデルを特定する信頼性の高い保証を提供することである。
論文 参考訳(メタデータ) (2023-10-24T07:46:10Z) - Causal machine learning for single-cell genomics [94.28105176231739]
単細胞ゲノミクスへの機械学習技術の応用とその課題について論じる。
まず, 単一細胞生物学における現在の因果的アプローチの基盤となるモデルについて述べる。
次に、単一セルデータへの因果的アプローチの適用におけるオープンな問題を特定する。
論文 参考訳(メタデータ) (2023-10-23T13:35:24Z) - Nonlinearity, Feedback and Uniform Consistency in Causal Structural
Learning [0.8158530638728501]
Causal Discoveryは、観測データから因果構造を学習するための自動探索手法を見つけることを目的としている。
この論文は因果発見における2つの疑問に焦点をあてる: (i) k-三角形の忠実性の代替定義を提供すること (i) (i) はガウス分布の族に適用されるとき強い忠実性よりも弱いこと (ii) 修正版の強忠実性が成り立つという仮定のもとに。
論文 参考訳(メタデータ) (2023-08-15T01:23:42Z) - Identifiability Guarantees for Causal Disentanglement from Soft
Interventions [26.435199501882806]
因果解離は因果モデルを通して相互に関係する潜伏変数を用いてデータの表現を明らかにすることを目的としている。
本稿では,各介入が潜伏変数のメカニズムを変えることにより,未ペアの観測データと介入データが利用可能となるシナリオに焦点を当てる。
因果変数が完全に観測されると、忠実性の仮定の下で因果モデルを特定するために統計的に一貫したアルゴリズムが開発された。
論文 参考訳(メタデータ) (2023-07-12T15:39:39Z) - A Causal Framework for Decomposing Spurious Variations [68.12191782657437]
我々はマルコフモデルとセミマルコフモデルの急激な変分を分解するツールを開発する。
突発効果の非パラメトリック分解を可能にする最初の結果を証明する。
説明可能なAIや公平なAIから、疫学や医学における疑問まで、いくつかの応用がある。
論文 参考訳(メタデータ) (2023-06-08T09:40:28Z) - Nonparametric Identifiability of Causal Representations from Unknown
Interventions [63.1354734978244]
本研究では, 因果表現学習, 潜伏因果変数を推定するタスク, およびそれらの変数の混合から因果関係を考察する。
我々のゴールは、根底にある真理潜入者とその因果グラフの両方を、介入データから解決不可能なあいまいさの集合まで識別することである。
論文 参考訳(メタデータ) (2023-06-01T10:51:58Z) - Bootstrapping Your Own Positive Sample: Contrastive Learning With
Electronic Health Record Data [62.29031007761901]
本稿では,新しいコントラスト型正規化臨床分類モデルを提案する。
EHRデータに特化した2つのユニークなポジティブサンプリング戦略を紹介します。
私たちのフレームワークは、現実世界のCOVID-19 EHRデータの死亡リスクを予測するために、競争の激しい実験結果をもたらします。
論文 参考訳(メタデータ) (2021-04-07T06:02:04Z) - Modelling Heterogeneity Using Bayesian Structured Sparsity [0.0]
観察間で異なる変数の効果を推定する方法は、政治科学において重要な問題です。
本稿では,複雑な現象(同様の現象を離散群に展開する観測)を回帰分析に組み込む共通の方法を提案する。
論文 参考訳(メタデータ) (2021-03-29T19:54:25Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。