論文の概要: Linear Models, Variable Selection, Artificial Intelligence
- arxiv url: http://arxiv.org/abs/2604.27191v1
- Date: Wed, 29 Apr 2026 20:50:19 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-05-01 16:31:53.803513
- Title: Linear Models, Variable Selection, Artificial Intelligence
- Title(参考訳): 線形モデル、可変選択、人工知能
- Authors: By Riyadh Alrawkan, Edward Boone, Ryad Ghanam, Anton Westveld,
- Abstract要約: この研究は、モデル選択に対する人工知能のアプローチを導入している。
ANNは、OLS推定に基づいて変数の重要度を決定するために訓練される。
このアプローチは、World Health Organizationのライフサプライチェーンに関するデータセットを使用して説明されている。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Variable selection in linear regression models has been a problem since hypothesis testing began. Which variables to include or exclude from a model is not an easy task. Techniques such as Forward, Back ward, Stepwise Regression sequentially add or delete variables from a model. Penalized likelihood methods such as AIC, BIC, etc. seek to choose variables that have a significant contribution to the likelihood. Penalized sum of square methods such as LASSO and Elastic Net have been used to penalize small coefficients to only allow variables with large coefficients in the model. This work introduces an Artificial Intelligence approach to model selection where an ANN is trained to determine the significance of the variables based on OLS estimates. A simulation study shows the accuracy across various sample sizes and variances. Furthermore, a simulation study is conducted to compare the performance of the approach against Forward, Backward, AIC, BIC and LASSO. The approach is illustrated using a dataset from the World Health Organization regarding Life Expectancy. A github link is provided to the pretrained ANN that can handle up to 100 predictor variables, the original WHO dataset and the subset used in this work.
- Abstract(参考訳): 線形回帰モデルにおける可変選択は、仮説テストが始まって以来問題となっている。
どの変数をモデルに含めるか、除外するかは、簡単なタスクではありません。
Forward、Back ward、Stepwise Regressionといったテクニックは、モデルから変数を逐次追加または削除する。
AIC、BICなどの罰則は、確率に重要な寄与する変数を選択しようとする。
LASSO や Elastic Net のような平方法のペナル化和は、モデルにおいて大きな係数を持つ変数のみを許容するために小さな係数をペナル化するために用いられる。
この研究は、ALS推定に基づいて変数の重要度を決定するためにANNを訓練するモデル選択に対する人工知能アプローチを導入する。
シミュレーション研究は、様々なサンプルサイズとばらつきの精度を示す。
さらに、フォワード、バックワード、AIC、BIC、LASSOに対するアプローチの性能を比較するためのシミュレーション研究を行った。
このアプローチは、World Health Organizationのライフサプライチェーンに関するデータセットを使用して説明されている。
トレーニング済みのANNにはgithubリンクが提供されており、最大100の予測変数、オリジナルのWHOデータセット、この作業で使用されるサブセットを処理できる。
関連論文リスト
- Intention-Conditioned Flow Occupancy Models [80.42634994902858]
大規模な事前学習は、今日の機械学習研究のやり方を根本的に変えた。
同じフレームワークを強化学習に適用することは、RLの中核的な課題に対処するための魅力的な方法を提供するので、魅力的です。
生成AIの最近の進歩は、高度に複雑な分布をモデリングするための新しいツールを提供している。
論文 参考訳(メタデータ) (2025-06-10T15:27:46Z) - Addressing Correlated Latent Exogenous Variables in Debiased Recommender Systems [3.082385853653964]
推薦システム(RS)は、パーソナライズされたコンテンツを提供することを目的としているが、選択バイアスによる非バイアス学習の課題に直面している。
本稿では,予測モデルを学習する確率に基づく学習アルゴリズムを提案する。
論文 参考訳(メタデータ) (2025-06-09T07:50:21Z) - Learning from aggregated data with a maximum entropy model [73.63512438583375]
我々は,観測されていない特徴分布を最大エントロピー仮説で近似することにより,ロジスティック回帰と類似した新しいモデルが,集約データからのみ学習されることを示す。
我々は、この方法で学習したモデルが、完全な非凝集データでトレーニングされたロジスティックモデルに匹敵するパフォーマンスを達成することができるという、いくつかの公開データセットに関する実証的な証拠を提示する。
論文 参考訳(メタデータ) (2022-10-05T09:17:27Z) - Equivariance Allows Handling Multiple Nuisance Variables When Analyzing
Pooled Neuroimaging Datasets [53.34152466646884]
本稿では,構造空間上でインスタンス化された同変表現学習における最近の結果と,因果推論における古典的結果の簡易な利用が,いかに効果的に実現されたかを示す。
いくつかの仮定の下で、我々のモデルが複数のニュアンス変数を扱えることを実証し、そうでなければサンプルの大部分を取り除く必要のあるシナリオにおいて、プールされた科学データセットの分析を可能にする。
論文 参考訳(メタデータ) (2022-03-29T04:54:06Z) - Bayesian Active Learning for Discrete Latent Variable Models [19.852463786440122]
アクティブラーニングは、モデルのパラメータに適合するために必要なデータ量を削減しようとする。
潜在変数モデルは神経科学、心理学、その他の様々な工学、科学分野において重要な役割を果たす。
論文 参考訳(メタデータ) (2022-02-27T19:07:12Z) - A Lagrangian Duality Approach to Active Learning [119.36233726867992]
トレーニングデータのサブセットのみをラベル付けするバッチアクティブな学習問題を考察する。
制約付き最適化を用いて学習問題を定式化し、各制約はラベル付きサンプルにモデルの性能を拘束する。
数値実験により,提案手法は最先端の能動学習法と同等かそれ以上に機能することを示した。
論文 参考訳(メタデータ) (2022-02-08T19:18:49Z) - X-model: Improving Data Efficiency in Deep Learning with A Minimax Model [78.55482897452417]
ディープラーニングにおける分類と回帰設定の両面でのデータ効率の向上を目標とする。
両世界の力を生かすために,我々は新しいX-モデルを提案する。
X-モデルは、特徴抽出器とタスク固有のヘッドの間でミニマックスゲームを行う。
論文 参考訳(メタデータ) (2021-10-09T13:56:48Z) - An interpretable prediction model for longitudinal dispersion
coefficient in natural streams based on evolutionary symbolic regression
network [30.99493442296212]
縦分散係数(LDC)の予測には様々な方法が提案されている。
本稿では,まずこれらの手法の詳細な解析を行い,その欠陥を明らかにする。
次に、進化的記号回帰ネットワーク(ESRN)と呼ばれる新しい記号回帰法を設計する。
論文 参考訳(メタデータ) (2021-06-17T07:06:05Z) - Variable selection with missing data in both covariates and outcomes:
Imputation and machine learning [1.0333430439241666]
欠落したデータ問題は、健康研究で普遍的です。
機械学習はパラメトリックな仮定を弱める。
XGBoostとBARTは、さまざまな設定で最高のパフォーマンスを発揮します。
論文 参考訳(メタデータ) (2021-04-06T20:18:29Z) - Flexible Model Aggregation for Quantile Regression [92.63075261170302]
量子回帰は、予測の不確実性を定量化する必要性によって動機付けられた統計学習の基本的な問題である。
条件付き量子モデルの任意の数を集約する手法について検討する。
この論文で検討するモデルはすべて、現代のディープラーニングツールキットに適合します。
論文 参考訳(メタデータ) (2021-02-26T23:21:16Z) - Additive interaction modelling using I-priors [0.571097144710995]
相互作用を持つモデルのパプリミティブな仕様を導入し、その利点を2つ挙げる。
スケールパラメータの数を減らし、相互作用のあるモデルの推定を容易にする。
論文 参考訳(メタデータ) (2020-07-30T22:52:22Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。