論文の概要: Hybrid Feature- and Similarity-Based Models for Prediction and
Interpretation using Large-Scale Observational Data
- arxiv url: http://arxiv.org/abs/2204.06076v1
- Date: Tue, 12 Apr 2022 20:37:03 GMT
- ステータス: 処理完了
- システム内更新日: 2022-04-14 13:04:35.760641
- Title: Hybrid Feature- and Similarity-Based Models for Prediction and
Interpretation using Large-Scale Observational Data
- Title(参考訳): 大規模観測データを用いた予測・解釈のためのハイブリッド特徴量・類似度モデル
- Authors: Jacqueline K. Kueper, Jennifer Rayner, Daniel J. Lizotte
- Abstract要約: 教師付き学習のためのハイブリッド機能と類似性に基づくモデルを提案する。
提案したハイブリッドモデルは,カーネル部分の疎性誘導ペナルティを伴う凸最適化に適合する。
我々は,本モデルと,合成データを用いた特徴的および類似性に基づくアプローチとを比較し,孤独感や社会的孤立のリスクを予測するためにEHRデータを用いた。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by-nc-nd/4.0/
- Abstract: Introduction: Large-scale electronic health record(EHR) datasets often
include simple informative features like patient age and complex data like care
history that are not easily represented as individual features. Such complex
data have the potential to both improve the quality of risk assessment and to
enable a better understanding of causal factors leading to those risks. We
propose a hybrid feature- and similarity-based model for supervised learning
that combines feature and kernel learning approaches to take advantage of rich
but heterogeneous observational data sources to create interpretable models for
prediction and for investigation of causal relationships. Methods: The proposed
hybrid model is fit by convex optimization with a sparsity-inducing penalty on
the kernel portion. Feature and kernel coefficients can be fit sequentially or
simultaneously. We compared our models to solely feature- and similarity-based
approaches using synthetic data and using EHR data from a primary health care
organization to predict risk of loneliness or social isolation. We also present
a new strategy for kernel construction that is suited to high-dimensional
indicator-coded EHR data. Results: The hybrid models had comparable or better
predictive performance than the feature- and kernel-based approaches in both
the synthetic and clinical case studies. The inherent interpretability of the
hybrid model is used to explore client characteristics stratified by kernel
coefficient direction in the clinical case study; we use simple examples to
discuss opportunities and cautions of the two hybrid model forms when causal
interpretations are desired. Conclusion: Hybrid feature- and similarity-based
models provide an opportunity to capture complex, high-dimensional data within
an additive model structure that supports improved prediction and
interpretation relative to simple models and opaque complex models.
- Abstract(参考訳): 導入: 大規模電子健康記録(EHR)データセットには、患者年齢のような単純な情報的特徴や、個々の特徴として簡単に表現できないケア履歴のような複雑なデータが含まれることが多い。
このような複雑なデータは、リスクアセスメントの質を向上させると同時に、リスクにつながる因果要因をよりよく理解する可能性を持っている。
本稿では,機能とカーネル学習のアプローチを組み合わせた教師付き学習のためのハイブリッド機能と類似性に基づくモデルを提案する。
方法:提案したハイブリッドモデルは,カーネル部分の疎性誘導ペナルティを伴う凸最適化に適合する。
特徴係数とカーネル係数は順次または同時に適合することができる。
本モデルと合成データを用いた機能的・類似性に基づくアプローチと,初等医療機関のehrデータを用いて孤独や社会的孤立のリスクを予測した。
また,高次元インジケータ符号化EHRデータに適したカーネル構築のための新しい戦略を提案する。
結果: ハイブリッドモデルは, 総合および臨床ケーススタディにおいて, 特徴ベースおよびカーネルベースアプローチと同等あるいは優れた予測性能を示した。
ハイブリッドモデルの固有解釈性は, カーネル係数方向によって階層化されたクライアント特性を臨床ケーススタディで探究するために用いられ, 因果解釈が要求される場合の2つのハイブリッドモデル形態の機会と注意について, 簡単な例を用いて議論する。
結論: ハイブリッド特徴と類似性に基づくモデルは、単純なモデルや不透明な複雑なモデルに対する予測と解釈の改善をサポートする付加モデル構造内の複雑な高次元データをキャプチャする機会を提供する。
関連論文リスト
- zGAN: An Outlier-focused Generative Adversarial Network For Realistic Synthetic Data Generation [0.0]
ブラックスワン」は古典的な機械学習モデルの性能に挑戦している。
本稿では、外部特性を持つ合成データを生成する目的で開発されたzGANモデルアーキテクチャの概要について述べる。
リアルな合成データ生成の有望な結果と、モデル性能のアップリフト能力を示す。
論文 参考訳(メタデータ) (2024-10-28T07:55:11Z) - SPIN: SE(3)-Invariant Physics Informed Network for Binding Affinity Prediction [3.406882192023597]
タンパク質-リガンド結合親和性の正確な予測は、薬物開発に不可欠である。
伝統的な手法は、しばしば複合体の空間情報を正確にモデル化するのに失敗する。
この課題に適用可能な様々な帰納バイアスを組み込んだモデルSPINを提案する。
論文 参考訳(メタデータ) (2024-07-10T08:40:07Z) - Latent Semantic Consensus For Deterministic Geometric Model Fitting [109.44565542031384]
我々はLSC(Latent Semantic Consensus)と呼ばれる効果的な方法を提案する。
LSCは、モデルフィッティング問題をデータポイントとモデル仮説に基づく2つの潜在意味空間に定式化する。
LSCは、一般的な多構造モデルフィッティングのために、数ミリ秒以内で一貫した、信頼性の高いソリューションを提供することができる。
論文 参考訳(メタデータ) (2024-03-11T05:35:38Z) - A Federated Learning-based Industrial Health Prognostics for
Heterogeneous Edge Devices using Matched Feature Extraction [16.337207503536384]
本稿では,特徴類似性マッチングパラメータアグリゲーションアルゴリズムを用いたFL型健康予後モデルを提案する。
提案手法は, 健康状態推定と生活寿命推定において, 44.5%, 39.3%の精度向上を達成できることを示す。
論文 参考訳(メタデータ) (2023-05-13T07:20:31Z) - Less is More: Mitigate Spurious Correlations for Open-Domain Dialogue
Response Generation Models by Causal Discovery [52.95935278819512]
本研究で得られたCGDIALOGコーパスに基づくオープンドメイン応答生成モデルのスプリアス相関に関する最初の研究を行った。
因果探索アルゴリズムに着想を得て,反応生成モデルの学習と推論のための新しいモデル非依存手法を提案する。
論文 参考訳(メタデータ) (2023-03-02T06:33:48Z) - Factor-Augmented Regularized Model for Hazard Regression [1.8021287677546953]
本研究では,ハザード回帰のための因子拡張正規化モデル(FarmHazard)を提案する。
モデル選択の整合性と推定の整合性を軽度条件下で証明する。
また,超高次元問題における強い相関に対処する因子拡張可変スクリーニング手法を開発した。
論文 参考訳(メタデータ) (2022-10-03T16:35:33Z) - De-Biasing Generative Models using Counterfactual Methods [0.0]
我々はCausal Counterfactual Generative Model (CCGM) と呼ばれる新しいデコーダベースのフレームワークを提案する。
提案手法は,因果関係の忠実さを強調するために,因果関係の潜在空間VAEモデルと特定の修正を加えたものである。
因果的学習と符号化/復号化が因果的介入の質をいかに高めるかを検討する。
論文 参考訳(メタデータ) (2022-07-04T16:53:20Z) - On the Generalization and Adaption Performance of Causal Models [99.64022680811281]
異なる因果発見は、データ生成プロセスを一連のモジュールに分解するために提案されている。
このようなモジュラニューラル因果モデルの一般化と適応性能について検討する。
我々の分析では、モジュラーニューラル因果モデルが、低データレギュレーションにおけるゼロおよび少数ショットの適応において、他のモデルよりも優れていることを示している。
論文 参考訳(メタデータ) (2022-06-09T17:12:32Z) - Bootstrapping Your Own Positive Sample: Contrastive Learning With
Electronic Health Record Data [62.29031007761901]
本稿では,新しいコントラスト型正規化臨床分類モデルを提案する。
EHRデータに特化した2つのユニークなポジティブサンプリング戦略を紹介します。
私たちのフレームワークは、現実世界のCOVID-19 EHRデータの死亡リスクを予測するために、競争の激しい実験結果をもたらします。
論文 参考訳(メタデータ) (2021-04-07T06:02:04Z) - Improving the Reconstruction of Disentangled Representation Learners via Multi-Stage Modeling [54.94763543386523]
現在の自己エンコーダに基づく非絡み合い表現学習法は、(集合体)後部をペナルティ化し、潜伏因子の統計的独立を促進することで、非絡み合いを実現する。
本稿では,不整合因子をペナルティに基づく不整合表現学習法を用いて学習する,新しい多段階モデリング手法を提案する。
次に、低品質な再構成を、欠落した関連潜伏変数をモデル化するために訓練された別の深層生成モデルで改善する。
論文 参考訳(メタデータ) (2020-10-25T18:51:15Z) - Bayesian Sparse Factor Analysis with Kernelized Observations [67.60224656603823]
多視点問題は潜在変数モデルに直面することができる。
高次元問題と非線形問題は伝統的にカーネルメソッドによって扱われる。
両アプローチを単一モデルにマージすることを提案する。
論文 参考訳(メタデータ) (2020-06-01T14:25:38Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。