Fugu-MT 論文翻訳(概要): Hybrid Feature- and Similarity-Based Models for Prediction and Interpretation using Large-Scale Observational Data

論文の概要: Hybrid Feature- and Similarity-Based Models for Prediction and Interpretation using Large-Scale Observational Data

arxiv url: http://arxiv.org/abs/2204.06076v1
Date: Tue, 12 Apr 2022 20:37:03 GMT
ステータス: 翻訳完了
システム内更新日: 2022-04-14 13:04:35.760641
Title: Hybrid Feature- and Similarity-Based Models for Prediction and Interpretation using Large-Scale Observational Data
Title（参考訳）: 大規模観測データを用いた予測・解釈のためのハイブリッド特徴量・類似度モデル
Authors: Jacqueline K. Kueper, Jennifer Rayner, Daniel J. Lizotte
Abstract要約: 教師付き学習のためのハイブリッド機能と類似性に基づくモデルを提案する。提案したハイブリッドモデルは,カーネル部分の疎性誘導ペナルティを伴う凸最適化に適合する。我々は,本モデルと,合成データを用いた特徴的および類似性に基づくアプローチとを比較し,孤独感や社会的孤立のリスクを予測するためにEHRデータを用いた。
参考スコア（独自算出の注目度）: 0.0
License: http://creativecommons.org/licenses/by-nc-nd/4.0/
Abstract: Introduction: Large-scale electronic health record(EHR) datasets often include simple informative features like patient age and complex data like care history that are not easily represented as individual features. Such complex data have the potential to both improve the quality of risk assessment and to enable a better understanding of causal factors leading to those risks. We propose a hybrid feature- and similarity-based model for supervised learning that combines feature and kernel learning approaches to take advantage of rich but heterogeneous observational data sources to create interpretable models for prediction and for investigation of causal relationships. Methods: The proposed hybrid model is fit by convex optimization with a sparsity-inducing penalty on the kernel portion. Feature and kernel coefficients can be fit sequentially or simultaneously. We compared our models to solely feature- and similarity-based approaches using synthetic data and using EHR data from a primary health care organization to predict risk of loneliness or social isolation. We also present a new strategy for kernel construction that is suited to high-dimensional indicator-coded EHR data. Results: The hybrid models had comparable or better predictive performance than the feature- and kernel-based approaches in both the synthetic and clinical case studies. The inherent interpretability of the hybrid model is used to explore client characteristics stratified by kernel coefficient direction in the clinical case study; we use simple examples to discuss opportunities and cautions of the two hybrid model forms when causal interpretations are desired. Conclusion: Hybrid feature- and similarity-based models provide an opportunity to capture complex, high-dimensional data within an additive model structure that supports improved prediction and interpretation relative to simple models and opaque complex models.
Abstract（参考訳）: 導入: 大規模電子健康記録(EHR)データセットには、患者年齢のような単純な情報的特徴や、個々の特徴として簡単に表現できないケア履歴のような複雑なデータが含まれることが多い。このような複雑なデータは、リスクアセスメントの質を向上させると同時に、リスクにつながる因果要因をよりよく理解する可能性を持っている。本稿では,機能とカーネル学習のアプローチを組み合わせた教師付き学習のためのハイブリッド機能と類似性に基づくモデルを提案する。方法:提案したハイブリッドモデルは,カーネル部分の疎性誘導ペナルティを伴う凸最適化に適合する。特徴係数とカーネル係数は順次または同時に適合することができる。本モデルと合成データを用いた機能的・類似性に基づくアプローチと,初等医療機関のehrデータを用いて孤独や社会的孤立のリスクを予測した。また,高次元インジケータ符号化EHRデータに適したカーネル構築のための新しい戦略を提案する。結果: ハイブリッドモデルは, 総合および臨床ケーススタディにおいて, 特徴ベースおよびカーネルベースアプローチと同等あるいは優れた予測性能を示した。ハイブリッドモデルの固有解釈性は, カーネル係数方向によって階層化されたクライアント特性を臨床ケーススタディで探究するために用いられ, 因果解釈が要求される場合の2つのハイブリッドモデル形態の機会と注意について, 簡単な例を用いて議論する。結論: ハイブリッド特徴と類似性に基づくモデルは、単純なモデルや不透明な複雑なモデルに対する予測と解釈の改善をサポートする付加モデル構造内の複雑な高次元データをキャプチャする機会を提供する。

関連論文リスト

Covariate-assisted Grade of Membership Models via Shared Latent Geometry [0.7939348535496568]
メンバーシップモデルのグレードは、個人レベルの混合メンバーシップスコアを通して多変量カテゴリデータを解析するための柔軟な潜在変数モデルである。補助共変量体を組み込む従来のアプローチは、一般に完全に指定された関節の確率に依存しており、計算的に集中しており、誤特定に敏感である。我々は,共変量支援型メンバシップモデルを導入し,共変量情報を統合する。
論文参考訳（メタデータ） (2026-01-24T02:30:36Z)
Model Correlation Detection via Random Selection Probing [62.093777777813756]
既存の類似性に基づく手法では、モデルパラメータにアクセスしたり、しきい値なしでスコアを生成する必要がある。本稿では,モデル相関検出を統計的テストとして定式化する仮説テストフレームワークであるランダム選択探索(RSP)を紹介する。 RSPは相関の証拠を定量化する厳密なp-値を生成する。
論文参考訳（メタデータ） (2025-09-29T01:40:26Z)
Information-theoretic Quantification of High-order Feature Effects in Classification Problems [0.19791587637442676]
特徴重要度(Hi-Fi)法における高次相互作用の情報理論拡張について述べる。私たちのフレームワークは、機能のコントリビューションをユニークでシナジスティックで冗長なコンポーネントに分解します。その結果,提案した推定器は理論的および予測された結果を正確に復元することがわかった。
論文参考訳（メタデータ） (2025-07-06T11:50:30Z)
High-Fidelity Scientific Simulation Surrogates via Adaptive Implicit Neural Representations [51.90920900332569]
入射神経表現(INR)は空間的に構造化されたデータをモデリングするためのコンパクトで連続的なフレームワークを提供する。近年のアプローチでは、剛性幾何学的構造に沿った付加的な特徴を導入することでこの問題に対処している。機能適応型INR(FA-INR)を提案する。
論文参考訳（メタデータ） (2025-06-07T16:45:17Z)
Optimizing Sequential Recommendation Models with Scaling Laws and Approximate Entropy [104.48511402784763]
SRモデルの性能法則は,モデルの性能とデータ品質の関係を理論的に調査し,モデル化することを目的としている。データ品質を評価するために、従来のデータ量メトリクスと比較して、より曖昧なアプローチを示すために、近似エントロピー(ApEn)を提案する。
論文参考訳（メタデータ） (2024-11-30T10:56:30Z)
zGAN: An Outlier-focused Generative Adversarial Network For Realistic Synthetic Data Generation [0.0]
ブラックスワン」は古典的な機械学習モデルの性能に挑戦している。本稿では、外部特性を持つ合成データを生成する目的で開発されたzGANモデルアーキテクチャの概要について述べる。リアルな合成データ生成の有望な結果と、モデル性能のアップリフト能力を示す。
論文参考訳（メタデータ） (2024-10-28T07:55:11Z)
SPIN: SE(3)-Invariant Physics Informed Network for Binding Affinity Prediction [3.406882192023597]
タンパク質-リガンド結合親和性の正確な予測は、薬物開発に不可欠である。伝統的な手法は、しばしば複合体の空間情報を正確にモデル化するのに失敗する。この課題に適用可能な様々な帰納バイアスを組み込んだモデルSPINを提案する。
論文参考訳（メタデータ） (2024-07-10T08:40:07Z)
Latent Semantic Consensus For Deterministic Geometric Model Fitting [109.44565542031384]
我々はLSC(Latent Semantic Consensus)と呼ばれる効果的な方法を提案する。 LSCは、モデルフィッティング問題をデータポイントとモデル仮説に基づく2つの潜在意味空間に定式化する。 LSCは、一般的な多構造モデルフィッティングのために、数ミリ秒以内で一貫した、信頼性の高いソリューションを提供することができる。
論文参考訳（メタデータ） (2024-03-11T05:35:38Z)
A Federated Learning-based Industrial Health Prognostics for Heterogeneous Edge Devices using Matched Feature Extraction [16.337207503536384]
本稿では,特徴類似性マッチングパラメータアグリゲーションアルゴリズムを用いたFL型健康予後モデルを提案する。提案手法は, 健康状態推定と生活寿命推定において, 44.5%, 39.3%の精度向上を達成できることを示す。
論文参考訳（メタデータ） (2023-05-13T07:20:31Z)
Less is More: Mitigate Spurious Correlations for Open-Domain Dialogue Response Generation Models by Causal Discovery [52.95935278819512]
本研究で得られたCGDIALOGコーパスに基づくオープンドメイン応答生成モデルのスプリアス相関に関する最初の研究を行った。因果探索アルゴリズムに着想を得て,反応生成モデルの学習と推論のための新しいモデル非依存手法を提案する。
論文参考訳（メタデータ） (2023-03-02T06:33:48Z)
Factor-Augmented Regularized Model for Hazard Regression [1.8021287677546953]
本研究では,ハザード回帰のための因子拡張正規化モデル(FarmHazard)を提案する。モデル選択の整合性と推定の整合性を軽度条件下で証明する。また,超高次元問題における強い相関に対処する因子拡張可変スクリーニング手法を開発した。
論文参考訳（メタデータ） (2022-10-03T16:35:33Z)
De-Biasing Generative Models using Counterfactual Methods [0.0]
我々はCausal Counterfactual Generative Model (CCGM) と呼ばれる新しいデコーダベースのフレームワークを提案する。提案手法は,因果関係の忠実さを強調するために,因果関係の潜在空間VAEモデルと特定の修正を加えたものである。因果的学習と符号化/復号化が因果的介入の質をいかに高めるかを検討する。
論文参考訳（メタデータ） (2022-07-04T16:53:20Z)
On the Generalization and Adaption Performance of Causal Models [99.64022680811281]
異なる因果発見は、データ生成プロセスを一連のモジュールに分解するために提案されている。このようなモジュラニューラル因果モデルの一般化と適応性能について検討する。我々の分析では、モジュラーニューラル因果モデルが、低データレギュレーションにおけるゼロおよび少数ショットの適応において、他のモデルよりも優れていることを示している。
論文参考訳（メタデータ） (2022-06-09T17:12:32Z)
Bootstrapping Your Own Positive Sample: Contrastive Learning With Electronic Health Record Data [62.29031007761901]
本稿では,新しいコントラスト型正規化臨床分類モデルを提案する。 EHRデータに特化した2つのユニークなポジティブサンプリング戦略を紹介します。私たちのフレームワークは、現実世界のCOVID-19 EHRデータの死亡リスクを予測するために、競争の激しい実験結果をもたらします。
論文参考訳（メタデータ） (2021-04-07T06:02:04Z)
Improving the Reconstruction of Disentangled Representation Learners via Multi-Stage Modeling [54.94763543386523]
現在の自己エンコーダに基づく非絡み合い表現学習法は、(集合体)後部をペナルティ化し、潜伏因子の統計的独立を促進することで、非絡み合いを実現する。本稿では,不整合因子をペナルティに基づく不整合表現学習法を用いて学習する,新しい多段階モデリング手法を提案する。次に、低品質な再構成を、欠落した関連潜伏変数をモデル化するために訓練された別の深層生成モデルで改善する。
論文参考訳（メタデータ） (2020-10-25T18:51:15Z)
Bayesian Sparse Factor Analysis with Kernelized Observations [67.60224656603823]
多視点問題は潜在変数モデルに直面することができる。高次元問題と非線形問題は伝統的にカーネルメソッドによって扱われる。両アプローチを単一モデルにマージすることを提案する。
論文参考訳（メタデータ） (2020-06-01T14:25:38Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。