論文の概要: Modeling High-Dimensional Data with Unknown Cut Points: A Fusion
Penalized Logistic Threshold Regression
- arxiv url: http://arxiv.org/abs/2202.08441v1
- Date: Thu, 17 Feb 2022 04:16:40 GMT
- ステータス: 処理完了
- システム内更新日: 2022-02-18 15:53:20.205102
- Title: Modeling High-Dimensional Data with Unknown Cut Points: A Fusion
Penalized Logistic Threshold Regression
- Title(参考訳): 未知の切断点を持つ高次元データのモデリング:融合ペナル化ロジスティック閾値回帰
- Authors: Yinan Lin, Wen Zhou, Zhi Geng, Gexin Xiao, and Jianxin Yin
- Abstract要約: 従来のロジスティック回帰モデルでは、リンク関数は線形で連続であると見なされることが多い。
我々は、全ての連続した特徴が順序レベルに離散化され、さらにバイナリ応答が決定されるしきい値モデルを考える。
糖尿病のような慢性疾患の早期発見と予知の問題において,ラッソモデルが好適であることが判明した。
- 参考スコア(独自算出の注目度): 2.520538806201793
- License: http://creativecommons.org/licenses/by-nc-sa/4.0/
- Abstract: In traditional logistic regression models, the link function is often assumed
to be linear and continuous in predictors. Here, we consider a threshold model
that all continuous features are discretized into ordinal levels, which further
determine the binary responses. Both the threshold points and regression
coefficients are unknown and to be estimated. For high dimensional data, we
propose a fusion penalized logistic threshold regression (FILTER) model, where
a fused lasso penalty is employed to control the total variation and shrink the
coefficients to zero as a method of variable selection. Under mild conditions
on the estimate of unknown threshold points, we establish the non-asymptotic
error bound for coefficient estimation and the model selection consistency.
With a careful characterization of the error propagation, we have also shown
that the tree-based method, such as CART, fulfill the threshold estimation
conditions. We find the FILTER model is well suited in the problem of early
detection and prediction for chronic disease like diabetes, using physical
examination data. The finite sample behavior of our proposed method are also
explored and compared with extensive Monte Carlo studies, which supports our
theoretical discoveries.
- Abstract(参考訳): 従来のロジスティック回帰モデルでは、リンク関数は線形で連続であると見なされることが多い。
ここでは,すべての連続的な特徴が順序レベルに離散化され,さらにバイナリ応答を決定するしきい値モデルを考える。
閾値点と回帰係数はともに未知であり、推定される。
高次元データに対して,可変選択法として積分ラッソペナルティを適用し,係数を0に縮小する,融合ペナルティ付きロジスティックしきい値回帰(フィルタ)モデルを提案する。
未知しきい値の推定における軽度条件下では、係数推定のための非漸近誤差とモデル選択整合性を確立する。
また, エラー伝播の注意深い評価により, CARTなどの木に基づく手法がしきい値推定条件を満たすことを示した。
このフィルタモデルは, 糖尿病などの慢性疾患の早期発見と予測に, 理学検査データを用いて好適であることがわかった。
また,提案手法の有限サンプル挙動についても検討し,理論的な発見を支援するモンテカルロ研究と比較した。
関連論文リスト
- Semi-supervised Regression Analysis with Model Misspecification and High-dimensional Data [8.619243141968886]
条件付き平均モデルにおける回帰係数を推定するための推論フレームワークを提案する。
提案手法は,正規化推定器を適応度スコア(PS)と結果回帰(OR)モデルの両方に用い,拡張逆確率重み付き(AIPW)法を開発した。
我々の理論的な知見は、広範囲なシミュレーション研究と実世界のデータ応用を通して検証される。
論文 参考訳(メタデータ) (2024-06-20T00:34:54Z) - Sample Complexity Bounds for Score-Matching: Causal Discovery and
Generative Modeling [82.36856860383291]
我々は,標準深部ReLUニューラルネットワークをトレーニングすることにより,スコア関数の正確な推定が可能であることを実証した。
スコアマッチングに基づく因果発見手法を用いて因果関係の回復の誤差率の限界を確立する。
論文 参考訳(メタデータ) (2023-10-27T13:09:56Z) - Convergence of uncertainty estimates in Ensemble and Bayesian sparse
model discovery [4.446017969073817]
ブートストラップに基づく逐次しきい値最小二乗推定器による雑音に対する精度と頑健性の観点から経験的成功を示す。
このブートストラップに基づくアンサンブル手法は,誤差率の指数収束率で,確率的に正しい可変選択を行うことができることを示す。
論文 参考訳(メタデータ) (2023-01-30T04:07:59Z) - The Implicit Delta Method [61.36121543728134]
本稿では,不確実性のトレーニング損失を無限に正規化することで機能する,暗黙のデルタ法を提案する。
有限差分により無限小変化が近似された場合でも, 正則化による評価の変化は評価推定器の分散に一定であることを示す。
論文 参考訳(メタデータ) (2022-11-11T19:34:17Z) - Adaptive LASSO estimation for functional hidden dynamic geostatistical
model [69.10717733870575]
関数型隠れ統計モデル(f-HD)のためのペナル化極大推定器(PMLE)に基づく新しいモデル選択アルゴリズムを提案する。
このアルゴリズムは反復最適化に基づいており、適応最小限の収縮・セレクタ演算子(GMSOLAS)ペナルティ関数を用いており、これは不給付のf-HD最大線量推定器によって得られる。
論文 参考訳(メタデータ) (2022-08-10T19:17:45Z) - Benign-Overfitting in Conditional Average Treatment Effect Prediction
with Linear Regression [14.493176427999028]
線形回帰モデルを用いて条件平均処理効果(CATE)の予測における良性過剰適合理論について検討した。
一方,IPW-learnerは確率スコアが分かっていればリスクをゼロに収束させるが,T-learnerはランダムな割り当て以外の一貫性を達成できないことを示す。
論文 参考訳(メタデータ) (2022-02-10T18:51:52Z) - On the Double Descent of Random Features Models Trained with SGD [78.0918823643911]
勾配降下(SGD)により最適化された高次元におけるランダム特徴(RF)回帰特性について検討する。
本研究では, RF回帰の高精度な非漸近誤差境界を, 定常および適応的なステップサイズSGD設定の下で導出する。
理論的にも経験的にも二重降下現象を観察する。
論文 参考訳(メタデータ) (2021-10-13T17:47:39Z) - Statistical Inference for High-Dimensional Linear Regression with
Blockwise Missing Data [13.48481978963297]
ブロックワイドなデータは、異なるソースまたはモダリティが相補的な情報を含むマルチソースまたはマルチモダリティデータを統合するときに発生する。
本稿では,未偏差推定方程式に基づいて回帰係数ベクトルを計算効率良く推定する手法を提案する。
アルツハイマー病神経画像イニシアチブの数値的研究と応用分析により、提案手法は既存の方法よりも教師なしのサンプルからより優れた性能と利益を得られることを示した。
論文 参考訳(メタデータ) (2021-06-07T05:12:42Z) - Calibration of prediction rules for life-time outcomes using prognostic
Cox regression survival models and multiple imputations to account for
missing predictor data with cross-validatory assessment [0.0]
検閲対象の生存モデルにおけるインプテーションと予測キャリブレーションを組み合わせた手法について述べる。
予測平均化は、ルービンの規則の直接適用とは対照的に、優れた統計的特性、特により小さい予測的変化を有するように見える。
論文 参考訳(メタデータ) (2021-05-04T20:10:12Z) - Leveraging Global Parameters for Flow-based Neural Posterior Estimation [90.21090932619695]
実験観測に基づくモデルのパラメータを推定することは、科学的方法の中心である。
特に困難な設定は、モデルが強く不確定であるとき、すなわち、パラメータの異なるセットが同一の観測をもたらすときである。
本稿では,グローバルパラメータを共有する観測の補助的セットによって伝達される付加情報を利用して,その不確定性を破る手法を提案する。
論文 参考訳(メタデータ) (2021-02-12T12:23:13Z) - Goal-directed Generation of Discrete Structures with Conditional
Generative Models [85.51463588099556]
本稿では,強化学習目標を直接最適化し,期待される報酬を最大化するための新しいアプローチを提案する。
提案手法は、ユーザ定義プロパティを持つ分子の生成と、所定の目標値を評価する短いピソン表現の同定という2つのタスクで検証する。
論文 参考訳(メタデータ) (2020-10-05T20:03:13Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。