論文の概要: Hybrid Feature- and Similarity-Based Models for Prediction and
Interpretation using Large-Scale Observational Data
- arxiv url: http://arxiv.org/abs/2204.06076v1
- Date: Tue, 12 Apr 2022 20:37:03 GMT
- ステータス: 処理完了
- システム内更新日: 2022-04-14 13:04:35.760641
- Title: Hybrid Feature- and Similarity-Based Models for Prediction and
Interpretation using Large-Scale Observational Data
- Title(参考訳): 大規模観測データを用いた予測・解釈のためのハイブリッド特徴量・類似度モデル
- Authors: Jacqueline K. Kueper, Jennifer Rayner, Daniel J. Lizotte
- Abstract要約: 教師付き学習のためのハイブリッド機能と類似性に基づくモデルを提案する。
提案したハイブリッドモデルは,カーネル部分の疎性誘導ペナルティを伴う凸最適化に適合する。
我々は,本モデルと,合成データを用いた特徴的および類似性に基づくアプローチとを比較し,孤独感や社会的孤立のリスクを予測するためにEHRデータを用いた。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by-nc-nd/4.0/
- Abstract: Introduction: Large-scale electronic health record(EHR) datasets often
include simple informative features like patient age and complex data like care
history that are not easily represented as individual features. Such complex
data have the potential to both improve the quality of risk assessment and to
enable a better understanding of causal factors leading to those risks. We
propose a hybrid feature- and similarity-based model for supervised learning
that combines feature and kernel learning approaches to take advantage of rich
but heterogeneous observational data sources to create interpretable models for
prediction and for investigation of causal relationships. Methods: The proposed
hybrid model is fit by convex optimization with a sparsity-inducing penalty on
the kernel portion. Feature and kernel coefficients can be fit sequentially or
simultaneously. We compared our models to solely feature- and similarity-based
approaches using synthetic data and using EHR data from a primary health care
organization to predict risk of loneliness or social isolation. We also present
a new strategy for kernel construction that is suited to high-dimensional
indicator-coded EHR data. Results: The hybrid models had comparable or better
predictive performance than the feature- and kernel-based approaches in both
the synthetic and clinical case studies. The inherent interpretability of the
hybrid model is used to explore client characteristics stratified by kernel
coefficient direction in the clinical case study; we use simple examples to
discuss opportunities and cautions of the two hybrid model forms when causal
interpretations are desired. Conclusion: Hybrid feature- and similarity-based
models provide an opportunity to capture complex, high-dimensional data within
an additive model structure that supports improved prediction and
interpretation relative to simple models and opaque complex models.
- Abstract(参考訳): 導入: 大規模電子健康記録(EHR)データセットには、患者年齢のような単純な情報的特徴や、個々の特徴として簡単に表現できないケア履歴のような複雑なデータが含まれることが多い。
このような複雑なデータは、リスクアセスメントの質を向上させると同時に、リスクにつながる因果要因をよりよく理解する可能性を持っている。
本稿では,機能とカーネル学習のアプローチを組み合わせた教師付き学習のためのハイブリッド機能と類似性に基づくモデルを提案する。
方法:提案したハイブリッドモデルは,カーネル部分の疎性誘導ペナルティを伴う凸最適化に適合する。
特徴係数とカーネル係数は順次または同時に適合することができる。
本モデルと合成データを用いた機能的・類似性に基づくアプローチと,初等医療機関のehrデータを用いて孤独や社会的孤立のリスクを予測した。
また,高次元インジケータ符号化EHRデータに適したカーネル構築のための新しい戦略を提案する。
結果: ハイブリッドモデルは, 総合および臨床ケーススタディにおいて, 特徴ベースおよびカーネルベースアプローチと同等あるいは優れた予測性能を示した。
ハイブリッドモデルの固有解釈性は, カーネル係数方向によって階層化されたクライアント特性を臨床ケーススタディで探究するために用いられ, 因果解釈が要求される場合の2つのハイブリッドモデル形態の機会と注意について, 簡単な例を用いて議論する。
結論: ハイブリッド特徴と類似性に基づくモデルは、単純なモデルや不透明な複雑なモデルに対する予測と解釈の改善をサポートする付加モデル構造内の複雑な高次元データをキャプチャする機会を提供する。
関連論文リスト
- Latent Semantic Consensus For Deterministic Geometric Model Fitting [109.44565542031384]
我々はLSC(Latent Semantic Consensus)と呼ばれる効果的な方法を提案する。
LSCは、モデルフィッティング問題をデータポイントとモデル仮説に基づく2つの潜在意味空間に定式化する。
LSCは、一般的な多構造モデルフィッティングのために、数ミリ秒以内で一貫した、信頼性の高いソリューションを提供することができる。
論文 参考訳(メタデータ) (2024-03-11T05:35:38Z) - From Identifiable Causal Representations to Controllable Counterfactual
Generation: A Survey on Causal Generative Modeling [18.318692567104378]
因果モデル(Causal model)は、分散シフトロバスト性(英語版)、公正性(英語版)、相互運用性(英語版)など、深い生成モデルに有益な性質を提供する。
フェアネス、プライバシ、アウト・オブ・ディストリビューションの一般化、精密医療における因果生成モデルの基本的な理論、定式化、欠点、データセット、メトリクス、および応用に焦点を当てる。
論文 参考訳(メタデータ) (2023-10-17T05:45:32Z) - A Federated Learning-based Industrial Health Prognostics for
Heterogeneous Edge Devices using Matched Feature Extraction [16.337207503536384]
本稿では,特徴類似性マッチングパラメータアグリゲーションアルゴリズムを用いたFL型健康予後モデルを提案する。
提案手法は, 健康状態推定と生活寿命推定において, 44.5%, 39.3%の精度向上を達成できることを示す。
論文 参考訳(メタデータ) (2023-05-13T07:20:31Z) - Less is More: Mitigate Spurious Correlations for Open-Domain Dialogue
Response Generation Models by Causal Discovery [52.95935278819512]
本研究で得られたCGDIALOGコーパスに基づくオープンドメイン応答生成モデルのスプリアス相関に関する最初の研究を行った。
因果探索アルゴリズムに着想を得て,反応生成モデルの学習と推論のための新しいモデル非依存手法を提案する。
論文 参考訳(メタデータ) (2023-03-02T06:33:48Z) - Factor-Augmented Regularized Model for Hazard Regression [1.8021287677546953]
本研究では,ハザード回帰のための因子拡張正規化モデル(FarmHazard)を提案する。
モデル選択の整合性と推定の整合性を軽度条件下で証明する。
また,超高次元問題における強い相関に対処する因子拡張可変スクリーニング手法を開発した。
論文 参考訳(メタデータ) (2022-10-03T16:35:33Z) - De-Biasing Generative Models using Counterfactual Methods [0.0]
我々はCausal Counterfactual Generative Model (CCGM) と呼ばれる新しいデコーダベースのフレームワークを提案する。
提案手法は,因果関係の忠実さを強調するために,因果関係の潜在空間VAEモデルと特定の修正を加えたものである。
因果的学習と符号化/復号化が因果的介入の質をいかに高めるかを検討する。
論文 参考訳(メタデータ) (2022-07-04T16:53:20Z) - HyperImpute: Generalized Iterative Imputation with Automatic Model
Selection [77.86861638371926]
カラムワイズモデルを適応的かつ自動的に構成するための一般化反復計算フレームワークを提案する。
既製の学習者,シミュレータ,インターフェースを備えた具体的な実装を提供する。
論文 参考訳(メタデータ) (2022-06-15T19:10:35Z) - On the Generalization and Adaption Performance of Causal Models [99.64022680811281]
異なる因果発見は、データ生成プロセスを一連のモジュールに分解するために提案されている。
このようなモジュラニューラル因果モデルの一般化と適応性能について検討する。
我々の分析では、モジュラーニューラル因果モデルが、低データレギュレーションにおけるゼロおよび少数ショットの適応において、他のモデルよりも優れていることを示している。
論文 参考訳(メタデータ) (2022-06-09T17:12:32Z) - Supervised Learning and Model Analysis with Compositional Data [4.082799056366927]
KernelBiomeはカーネルベースの非パラメトリック回帰分類フレームワークである。
我々は、最先端の機械学習手法と比較して、同等または改善された性能を示す。
論文 参考訳(メタデータ) (2022-05-15T12:33:43Z) - Bootstrapping Your Own Positive Sample: Contrastive Learning With
Electronic Health Record Data [62.29031007761901]
本稿では,新しいコントラスト型正規化臨床分類モデルを提案する。
EHRデータに特化した2つのユニークなポジティブサンプリング戦略を紹介します。
私たちのフレームワークは、現実世界のCOVID-19 EHRデータの死亡リスクを予測するために、競争の激しい実験結果をもたらします。
論文 参考訳(メタデータ) (2021-04-07T06:02:04Z) - Bayesian Sparse Factor Analysis with Kernelized Observations [67.60224656603823]
多視点問題は潜在変数モデルに直面することができる。
高次元問題と非線形問題は伝統的にカーネルメソッドによって扱われる。
両アプローチを単一モデルにマージすることを提案する。
論文 参考訳(メタデータ) (2020-06-01T14:25:38Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。