論文の概要: Gaussian Latent Dirichlet Allocation for Discrete Human State Discovery
- arxiv url: http://arxiv.org/abs/2206.14233v1
- Date: Tue, 28 Jun 2022 18:33:46 GMT
- ステータス: 処理完了
- システム内更新日: 2022-07-01 08:25:48.434800
- Title: Gaussian Latent Dirichlet Allocation for Discrete Human State Discovery
- Title(参考訳): 離散状態発見のためのガウス的潜在ディリクレ割当て
- Authors: Congyu Wu, Aaron Fisher, David Schnyer
- Abstract要約: 離散状態発見問題に対する教師なし確率モデルであるGaussian Latent Dirichlet Allocation (GLDA)を提案する。
GLDAは、自然言語処理において人気のあるトピックモデルであるLatent Dirichlet Allocation (LDA)から個々の混合構造を借りている。
両データセットにおいて,GLDAを学習したクラスウェイトは,臨床評価したうつ病,不安,ストレススコアと,ベースラインのGMMよりも有意に高い相関性を示した。
- 参考スコア(独自算出の注目度): 1.057079240576682
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: In this article we propose and validate an unsupervised probabilistic model,
Gaussian Latent Dirichlet Allocation (GLDA), for the problem of discrete state
discovery from repeated, multivariate psychophysiological samples collected
from multiple, inherently distinct, individuals. Psychology and medical
research heavily involves measuring potentially related but individually
inconclusive variables from a cohort of participants to derive diagnosis,
necessitating clustering analysis. Traditional probabilistic clustering models
such as Gaussian Mixture Model (GMM) assume a global mixture of component
distributions, which may not be realistic for observations from different
patients. The GLDA model borrows the individual-specific mixture structure from
a popular topic model Latent Dirichlet Allocation (LDA) in Natural Language
Processing and merges it with the Gaussian component distributions of GMM to
suit continuous type data. We implemented GLDA using STAN (a probabilistic
modeling language) and applied it on two datasets, one containing Ecological
Momentary Assessments (EMA) and the other heart measures from electrocardiogram
and impedance cardiograph. We found that in both datasets the GLDA-learned
class weights achieved significantly higher correlations with clinically
assessed depression, anxiety, and stress scores than those produced by the
baseline GMM. Our findings demonstrate the advantage of GLDA over conventional
finite mixture models for human state discovery from repeated multivariate
data, likely due to better characterization of potential underlying
between-participant differences. Future work is required to validate the
utility of this model on a broader range of applications.
- Abstract(参考訳): 本稿では,複数の個人から収集された多変量精神生理学的標本の離散状態発見問題に対して,教師なし確率モデルであるGaussian Latent Dirichlet Allocation (GLDA)を提案し,検証する。
心理学と医学研究は、診断を導き、クラスタリング分析を必要とする参加者のコホートから潜在的に関連があるが、個別に決定的な変数を測定することを含む。
ガウス混合モデル(GMM)のような従来の確率的クラスタリングモデルは、異なる患者からの観察では現実的ではないかもしれない成分分布のグローバルな混合を前提としている。
GLDAモデルは、自然言語処理において人気のあるトピックモデルであるLatent Dirichlet Allocation (LDA)から個々の混合構造を借り、GMMのガウス成分分布とマージして連続型データに適合させる。
われわれは,STAN (probabilistic modeling language) を用いてGLDAを実装し,Ecological Momentary Assessments (EMA) と心電図およびインピーダンス心電図による心拍計を含む2つのデータセットに適用した。
両データセットにおいて,GLDAを学習したクラスウェイトは,臨床評価したうつ病,不安,ストレススコアと,ベースラインのGMMよりも有意に高い相関性を示した。
本研究は, 従来の有限混合モデルよりも, 多変量連続データによる人体状態の発見に有利であることを示すものである。
幅広いアプリケーションでこのモデルの有用性を検証するためには、今後の作業が必要である。
関連論文リスト
- Meta Flow Matching: Integrating Vector Fields on the Wasserstein Manifold [83.18058549195855]
自然科学における複数の過程は、確率密度のワッサーシュタイン多様体上のベクトル場として表さなければならない。
特に、疾患の発生とその治療反応が患者固有の細胞の微小環境に依存するパーソナライズド医療において重要である。
本稿では,これらのベクトル場をワッサーシュタイン多様体上で積分するメタフローマッチング(Meta Flow Matching, MFM)を提案する。
論文 参考訳(メタデータ) (2024-08-26T20:05:31Z) - Collaborative Heterogeneous Causal Inference Beyond Meta-analysis [68.4474531911361]
異種データを用いた因果推論のための協調的逆確率スコア推定器を提案する。
異質性の増加に伴うメタアナリシスに基づく手法に対して,本手法は有意な改善を示した。
論文 参考訳(メタデータ) (2024-04-24T09:04:36Z) - Seeing Unseen: Discover Novel Biomedical Concepts via
Geometry-Constrained Probabilistic Modeling [53.7117640028211]
同定された問題を解決するために,幾何制約付き確率的モデリング処理を提案する。
構成された埋め込み空間のレイアウトに適切な制約を課すために、重要な幾何学的性質のスイートを組み込む。
スペクトルグラフ理論法は、潜在的な新規クラスの数を推定するために考案された。
論文 参考訳(メタデータ) (2024-03-02T00:56:05Z) - Toward the Identifiability of Comparative Deep Generative Models [7.5479347719819865]
比較深部生成モデル(DGM)における識別可能性の理論を提案する。
これらのモデルは、一般的な混合関数のクラスにおいて識別性に欠けるが、混合関数が断片的アフィンであるときに驚くほど識別可能であることを示す。
また, モデルミス種別の影響についても検討し, 従来提案されていた比較DGMの正則化手法が, 潜伏変数の数が事前に分かっていない場合に, 識別可能性を高めることを実証的に示す。
論文 参考訳(メタデータ) (2024-01-29T06:10:54Z) - Probabilistic Classification by Density Estimation Using Gaussian
Mixture Model and Masked Autoregressive Flow [1.3706331473063882]
データ分布を推定する密度推定は確率論的機械学習の重要なカテゴリである。
本稿では,密度推定器を用いて分類するが,データの分布を推定するためによく用いられる。
我々は,GMMとMAFを用いて,密度推定によるデータクラスの可能性のモデル化を行う。
論文 参考訳(メタデータ) (2023-10-16T21:37:22Z) - Ambiguous Medical Image Segmentation using Diffusion Models [60.378180265885945]
我々は,グループ洞察の分布を学習することで,複数の可算出力を生成する単一拡散モデルに基づくアプローチを提案する。
提案モデルでは,拡散の固有のサンプリングプロセスを利用してセグメンテーションマスクの分布を生成する。
その結果,提案手法は既存の最先端曖昧なセグメンテーションネットワークよりも優れていることがわかった。
論文 参考訳(メタデータ) (2023-04-10T17:58:22Z) - Unsupervised Probabilistic Models for Sequential Electronic Health
Records [3.8015092217142223]
モデルは、データの基盤構造をエンコードする遅延変数の階層化セットで構成されている。
我々は,北カリフォルニアのKaiser Permanente(カイザー・パーマネンテ)統合型ヘルスケアデリバリーシステムにおいて,医療を受ける被験者のエピソードデータに基づいて,このモデルを訓練する。
トレーニングされたモデルの結果として得られる特性は、これらの複雑で多面的なデータから新しい洞察を生み出す。
論文 参考訳(メタデータ) (2022-04-15T02:11:44Z) - MoReL: Multi-omics Relational Learning [26.484803417186384]
ヘテロジニアスビューの分子間相互作用をコードする多部グラフを効率的に推定する新しいディープベイズ生成モデルを提案する。
このようなディープベイズ生成モデルにおける最適輸送正則化により、ビュー固有側情報を組み込むだけでなく、分布ベース正則化によるモデルの柔軟性も向上する。
論文 参考訳(メタデータ) (2022-03-15T02:50:07Z) - Multi-modality fusion using canonical correlation analysis methods:
Application in breast cancer survival prediction from histology and genomics [16.537929113715432]
2つのモードの融合にカノニカル相関解析(CCA)とCCAのペナル化変種を用いて検討した。
モデルパラメータが既知の場合,両モードを併用した後進平均推定器は,潜時変動予測における単一モード後進推定器の任意の線形混合よりも優れていることを示す。
論文 参考訳(メタデータ) (2021-11-27T21:18:01Z) - Continual Learning with Fully Probabilistic Models [70.3497683558609]
機械学習の完全確率的(または生成的)モデルに基づく継続的学習のアプローチを提案する。
生成器と分類器の両方に対してガウス混合モデル(GMM)インスタンスを用いた擬似リハーサル手法を提案する。
我々は,GMRが,クラス増分学習問題に対して,非常に競合的な時間とメモリの複雑さで,最先端のパフォーマンスを達成することを示す。
論文 参考訳(メタデータ) (2021-04-19T12:26:26Z) - Bootstrapping Your Own Positive Sample: Contrastive Learning With
Electronic Health Record Data [62.29031007761901]
本稿では,新しいコントラスト型正規化臨床分類モデルを提案する。
EHRデータに特化した2つのユニークなポジティブサンプリング戦略を紹介します。
私たちのフレームワークは、現実世界のCOVID-19 EHRデータの死亡リスクを予測するために、競争の激しい実験結果をもたらします。
論文 参考訳(メタデータ) (2021-04-07T06:02:04Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。