論文の概要: Semiparametric count data regression for self-reported mental health
- arxiv url: http://arxiv.org/abs/2106.09114v1
- Date: Wed, 16 Jun 2021 20:38:13 GMT
- ステータス: 処理完了
- システム内更新日: 2021-06-19 09:53:21.165057
- Title: Semiparametric count data regression for self-reported mental health
- Title(参考訳): 自己報告型メンタルヘルスのための半パラメトリックカウントデータレグレッション
- Authors: Daniel R. Kowal and Bohan Wu
- Abstract要約: データレグレッションをカウントするための半パラメトリック推定および推測フレームワークを設計する。
データ生成プロセスは、潜在ガウス回帰モデルであるSTARを同時に変換して定義される。
STARは、自己報告されたメンタルヘルスに関連する要因を研究するためにデプロイされ、既存のカウントデータ回帰モデルと比較して、適合性を大幅に向上させる。
- 参考スコア(独自算出の注目度): 0.3553493344868413
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: "For how many days during the past 30 days was your mental health not good?"
The responses to this question measure self-reported mental health and can be
linked to important covariates in the National Health and Nutrition Examination
Survey (NHANES). However, these count variables present major distributional
challenges: the data are overdispersed, zero-inflated, bounded by 30, and
heaped in five- and seven-day increments. To meet these challenges, we design a
semiparametric estimation and inference framework for count data regression.
The data-generating process is defined by simultaneously transforming and
rounding (STAR) a latent Gaussian regression model. The transformation is
estimated nonparametrically and the rounding operator ensures the correct
support for the discrete and bounded data. Maximum likelihood estimators are
computed using an EM algorithm that is compatible with any continuous data
model estimable by least squares. STAR regression includes asymptotic
hypothesis testing and confidence intervals, variable selection via information
criteria, and customized diagnostics. Simulation studies validate the utility
of this framework. STAR is deployed to study the factors associated with
self-reported mental health and demonstrates substantial improvements in
goodness-of-fit compared to existing count data regression models.
- Abstract(参考訳): 「過去30日間何日の間、あなたの精神状態は良くなかったのですか?」
この質問に対する回答は、自己申告されたメンタルヘルスを計測し、National Health and Nutrition Examination Survey (NHANES)における重要な共変量と関連付けることができる。
しかし、これらのカウント変数は大きな分散課題を示しており、データはオーバー分散され、ゼロ膨らませられ、30で束縛され、5日と7日のインクリメントでヒープされる。
これらの課題に対処するため、データ回帰をカウントするための半パラメトリック推定および推測フレームワークを設計する。
データ生成プロセスは、潜在ガウス回帰モデルであるSTARを同時に変換して定義される。
変換は非パラメトリックに推定され、ラウンド演算子は離散および有界データの正しいサポートを保証する。
最大確率推定子は、最小二乗推定可能な任意の連続データモデルと互換性のあるEMアルゴリズムを用いて計算される。
スターレグレッションには漸近仮説テストと信頼区間、情報基準による変数選択、診断のカスタマイズが含まれる。
シミュレーション研究はこの枠組みの有用性を検証する。
STARは、自己報告されたメンタルヘルスに関連する要因を研究するためにデプロイされ、既存のカウントデータ回帰モデルと比較して、適合性を大幅に向上させる。
関連論文リスト
- Interval Estimation of Coefficients in Penalized Regression Models of Insurance Data [3.5637073151604093]
ツイーディー指数分散ファミリーは、保険の損失をモデル化するために多くの人々の間で人気がある。
内在変数を記述する最も重要な特徴の信頼性(推論)を得るためには、しばしば重要である。
論文 参考訳(メタデータ) (2024-10-01T18:57:18Z) - Risk and cross validation in ridge regression with correlated samples [72.59731158970894]
我々は,データポイントが任意の相関関係を持つ場合,リッジ回帰のイン・オブ・サンプルリスクのトレーニング例を提供する。
さらに、テストポイントがトレーニングセットと非自明な相関を持ち、時系列予測で頻繁に発生するような場合まで分析を拡張します。
我々は多種多様な高次元データにまたがって理論を検証する。
論文 参考訳(メタデータ) (2024-08-08T17:27:29Z) - Bayesian Federated Inference for regression models based on non-shared multicenter data sets from heterogeneous populations [0.0]
回帰モデルでは、サンプルサイズは予測器の数に対して十分な大きさでなければならない。
異なる(医療)センターで収集された異なるデータセットからデータをポーリングすることはこの問題を軽減するが、プライバシー規制やロジスティックな問題のためにしばしば実現不可能である。
別の方法は、センター内のローカルデータを別々に分析し、統計的推測結果とベイズ連邦推論(BFI)手法を組み合わせることである。
このアプローチの目的は、組み合わせたデータに対して統計的解析を行った場合、何を発見したのかを、別々の中心における推論結果から計算することである。
論文 参考訳(メタデータ) (2024-02-05T11:10:27Z) - Selective Nonparametric Regression via Testing [54.20569354303575]
本研究では,所定の点における条件分散の値に関する仮説を検証し,留置手順を開発する。
既存の手法とは異なり、提案手法は分散自体の値だけでなく、対応する分散予測器の不確実性についても考慮することができる。
論文 参考訳(メタデータ) (2023-09-28T13:04:11Z) - Performance Evaluation of Regression Models in Predicting the Cost of
Medical Insurance [0.0]
機械学習における3つの回帰モデル、すなわち線形回帰、グラディエントブースティング、サポートベクトルマシンが使用された。
性能はRMSE(Root Mean Square)、r2(R Square)、K-Fold Cross-validation(K-Fold Cross-validation)を用いて評価される。
論文 参考訳(メタデータ) (2023-04-25T06:33:49Z) - Continuous-Time Modeling of Counterfactual Outcomes Using Neural
Controlled Differential Equations [84.42837346400151]
反現実的な結果を予測することは、パーソナライズされたヘルスケアをアンロックする可能性がある。
既存の因果推論アプローチでは、観察と治療決定の間の通常の離散時間間隔が考慮されている。
そこで本研究では,腫瘍増殖モデルに基づく制御可能なシミュレーション環境を提案する。
論文 参考訳(メタデータ) (2022-06-16T17:15:15Z) - Near-optimal inference in adaptive linear regression [60.08422051718195]
最小二乗法のような単純な方法でさえ、データが適応的に収集されるときの非正規な振る舞いを示すことができる。
我々は,これらの分布異常を少なくとも2乗推定で補正するオンラインデバイアス推定器のファミリーを提案する。
我々は,マルチアームバンディット,自己回帰時系列推定,探索による能動的学習などの応用を通して,我々の理論の有用性を実証する。
論文 参考訳(メタデータ) (2021-07-05T21:05:11Z) - Statistical Inference for High-Dimensional Linear Regression with
Blockwise Missing Data [13.48481978963297]
ブロックワイドなデータは、異なるソースまたはモダリティが相補的な情報を含むマルチソースまたはマルチモダリティデータを統合するときに発生する。
本稿では,未偏差推定方程式に基づいて回帰係数ベクトルを計算効率良く推定する手法を提案する。
アルツハイマー病神経画像イニシアチブの数値的研究と応用分析により、提案手法は既存の方法よりも教師なしのサンプルからより優れた性能と利益を得られることを示した。
論文 参考訳(メタデータ) (2021-06-07T05:12:42Z) - Flexible Model Aggregation for Quantile Regression [92.63075261170302]
量子回帰は、予測の不確実性を定量化する必要性によって動機付けられた統計学習の基本的な問題である。
条件付き量子モデルの任意の数を集約する手法について検討する。
この論文で検討するモデルはすべて、現代のディープラーニングツールキットに適合します。
論文 参考訳(メタデータ) (2021-02-26T23:21:16Z) - Increasing the efficiency of randomized trial estimates via linear
adjustment for a prognostic score [59.75318183140857]
ランダム化実験による因果効果の推定は臨床研究の中心である。
歴史的借用法のほとんどは、厳格なタイプiエラー率制御を犠牲にして分散の削減を達成する。
論文 参考訳(メタデータ) (2020-12-17T21:10:10Z) - Evaluating Model Robustness and Stability to Dataset Shift [7.369475193451259]
機械学習モデルの安定性を解析するためのフレームワークを提案する。
本手法では,アルゴリズムが性能の悪い分布を決定するために,元の評価データを用いる。
我々は,アルゴリズムの性能を"Worst-case"分布で推定する。
論文 参考訳(メタデータ) (2020-10-28T17:35:39Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。