論文の概要: A Deep Learning Algorithm for High-Dimensional Exploratory Item Factor
Analysis
- arxiv url: http://arxiv.org/abs/2001.07859v4
- Date: Thu, 4 Feb 2021 17:29:22 GMT
- ステータス: 処理完了
- システム内更新日: 2023-01-07 18:13:24.894876
- Title: A Deep Learning Algorithm for High-Dimensional Exploratory Item Factor
Analysis
- Title(参考訳): 高次元探索項目因子分析のための深層学習アルゴリズム
- Authors: Christopher J. Urban and Daniel J. Bauer
- Abstract要約: 探索項目因子分析(IFA)のための深層学習に基づくVIアルゴリズムについて検討する。
提案手法は、探索型IFAのための重要重み付きオートエンコーダ(IWAE)と呼ばれる深層人工ニューラルネットワークモデルを適用する。
IWAEは標本サイズやIWサンプル数の増加に伴って,より正確な推定値が得られることを示す。
- 参考スコア(独自算出の注目度): 0.0
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Marginal maximum likelihood (MML) estimation is the preferred approach to
fitting item response theory models in psychometrics due to the MML estimator's
consistency, normality, and efficiency as the sample size tends to infinity.
However, state-of-the-art MML estimation procedures such as the
Metropolis-Hastings Robbins-Monro (MH-RM) algorithm as well as approximate MML
estimation procedures such as variational inference (VI) are computationally
time-consuming when the sample size and the number of latent factors are very
large. In this work, we investigate a deep learning-based VI algorithm for
exploratory item factor analysis (IFA) that is computationally fast even in
large data sets with many latent factors. The proposed approach applies a deep
artificial neural network model called an importance-weighted autoencoder
(IWAE) for exploratory IFA. The IWAE approximates the MML estimator using an
importance sampling technique wherein increasing the number of
importance-weighted (IW) samples drawn during fitting improves the
approximation, typically at the cost of decreased computational efficiency. We
provide a real data application that recovers results aligning with
psychological theory across random starts. Via simulation studies, we show that
the IWAE yields more accurate estimates as either the sample size or the number
of IW samples increases (although factor correlation and intercepts estimates
exhibit some bias) and obtains similar results to MH-RM in less time. Our
simulations also suggest that the proposed approach performs similarly to and
is potentially faster than constrained joint maximum likelihood estimation, a
fast procedure that is consistent when the sample size and the number of items
simultaneously tend to infinity.
- Abstract(参考訳): マージナル最大可能性(MML)推定は、標本サイズが無限に傾向するにつれて、MML推定器の整合性、正規性、効率性により、アイテム応答理論モデルを心理メトリクスに適合させるための好ましいアプローチである。
しかし,Metropolis-Hastings Robbins-Monro (MH-RM) アルゴリズムや変分推論 (VI) などの近似MML推定手順は,サンプルサイズや潜伏因子の数が非常に多い場合に計算に時間がかかる。
本研究では,潜在要因の多い大規模データセットにおいても計算速度が速い探索項目因子分析(ifa)のための深層学習に基づくviアルゴリズムについて検討する。
提案手法は、探索型IFAのための重要重み付きオートエンコーダ(IWAE)と呼ばれる深層ニューラルネットワークモデルを適用する。
岩絵はmml推定器を重要サンプリング法で近似し, 適合時の重要度重み付け(iw)試料数の増加により近似精度が向上し, 計算効率が低下するのが一般的である。
ランダムに開始する心理学的理論に沿った結果を復元する実データアプリケーションを提供する。
シミュレーション研究により、IWAEはサンプルサイズやIWサンプル数の増加によってより正確な推定値が得られる(因子相関とインターセプト推定値にはバイアスが生じる)ことを示し、より少ない時間でMH-RMと同様の結果を得る。
また, 提案手法は, サンプルサイズとアイテム数とが同時に無限大となる場合に一貫した高速な計算法である, 制約付き結合最大推定法と類似し, より高速である可能性が示唆された。
関連論文リスト
- Adaptive Sampled Softmax with Inverted Multi-Index: Methods, Theory and Applications [79.53938312089308]
MIDX-Samplerは、逆多重インデックスアプローチに基づく新しい適応型サンプリング戦略である。
本手法は, サンプリングバイアス, 勾配バイアス, 収束速度, 一般化誤差境界などの重要な問題に対処するため, 厳密な理論的解析によって裏付けられている。
論文 参考訳(メタデータ) (2025-01-15T04:09:21Z) - Parallel simulation for sampling under isoperimetry and score-based diffusion models [56.39904484784127]
データサイズが大きくなるにつれて、イテレーションコストの削減が重要な目標になります。
科学計算における初期値問題の並列シミュレーションの成功に触発されて,タスクをサンプリングするための並列Picard法を提案する。
本研究は,動力学に基づくサンプリング・拡散モデルの科学的計算におけるシミュレーション手法の潜在的利点を強調した。
論文 参考訳(メタデータ) (2024-12-10T11:50:46Z) - Querying Easily Flip-flopped Samples for Deep Active Learning [63.62397322172216]
アクティブラーニング(英: Active Learning)は、ラベルのないデータを戦略的に選択してクエリすることで、モデルの性能を向上させることを目的とした機械学習パラダイムである。
効果的な選択戦略の1つはモデルの予測の不確実性に基づくもので、サンプルがどの程度情報的であるかの尺度として解釈できる。
本稿では,予測されたラベルの不一致の最小確率として,最小不一致距離(LDM)を提案する。
論文 参考訳(メタデータ) (2024-01-18T08:12:23Z) - Sparse high-dimensional linear mixed modeling with a partitioned empirical Bayes ECM algorithm [41.25603565852633]
この研究は、高次元LMMに対する効率的かつ正確なベイズ的枠組みを示す。
このアプローチの斬新さは、パーティショニングとパラメータ拡張と、高速でスケーラブルな計算にある。
実世界の例では、小児のループスの研究データを用いて、新しいループスバイオマーカーに関連する遺伝子と臨床因子を特定し、時間とともにバイオマーカーを予測する。
論文 参考訳(メタデータ) (2023-10-18T19:34:56Z) - To Repeat or Not To Repeat: Insights from Scaling LLM under Token-Crisis [50.31589712761807]
大規模言語モデル(LLM)は、事前トレーニング中にトークンに悩まされていることで知られており、Web上の高品質なテキストデータは、LSMのスケーリング制限に近づいている。
本研究では,事前学習データの再学習の結果について検討し,モデルが過度に適合する可能性が示唆された。
第2に, マルチエポック劣化の原因となる要因について検討し, データセットのサイズ, モデルパラメータ, トレーニング目標など, 重要な要因について検討した。
論文 参考訳(メタデータ) (2023-05-22T17:02:15Z) - Development and Evaluation of Conformal Prediction Methods for QSAR [0.5161531917413706]
定量的構造活性相関モデル(QSAR)は、化合物の生物活性を予測するために一般的に用いられる手法である。
優れた予測性能を達成する機械学習(ML)アルゴリズムの多くは、予測の不確実性を推定するためのいくつかのアドオンメソッドを必要とする。
コンフォーマル予測(CP)は予測アルゴリズムに非依存であり、データ分布の弱い仮定の下で有効な予測間隔を生成できる。
論文 参考訳(メタデータ) (2023-04-03T13:41:09Z) - Optimally-Weighted Estimators of the Maximum Mean Discrepancy for
Likelihood-Free Inference [12.157511906467146]
Likelihood-free推論手法は典型的にはシミュレーションデータと実データの間の距離を利用する。
最大平均誤差 (MMD) は、一般にルート$m$で推定され、$m$はシミュレーション標本の数である。
サンプルの複雑さを大幅に改善したMDDの新しい推定器を提案する。
論文 参考訳(メタデータ) (2023-01-27T12:13:54Z) - Approximate Gibbs Sampler for Efficient Inference of Hierarchical Bayesian Models for Grouped Count Data [0.0]
本研究は、推定精度を維持しつつ、HBPRMを効率的に学習するための近似ギブスサンプリング器(AGS)を開発した。
実データと合成データを用いた数値実験により,AGSの優れた性能を示した。
論文 参考訳(メタデータ) (2022-11-28T21:00:55Z) - Counterfactual Maximum Likelihood Estimation for Training Deep Networks [83.44219640437657]
深層学習モデルは、予測的手がかりとして学習すべきでない急激な相関を学習する傾向がある。
本研究では,観測可能な共同設立者による相関関係の緩和を目的とした因果関係に基づくトレーニングフレームワークを提案する。
自然言語推論(NLI)と画像キャプションという2つの実世界の課題について実験を行った。
論文 参考訳(メタデータ) (2021-06-07T17:47:16Z) - Localized Debiased Machine Learning: Efficient Inference on Quantile
Treatment Effects and Beyond [69.83813153444115]
因果推論における(局所)量子化処理効果((L)QTE)の効率的な推定式を検討する。
Debiased Machine Learning (DML)は、高次元のニュアンスを推定するデータ分割手法である。
本稿では、この負担のかかるステップを避けるために、局所的脱バイアス機械学習(LDML)を提案する。
論文 参考訳(メタデータ) (2019-12-30T14:42:52Z) - Scalable Influence Estimation Without Sampling [9.873635079670091]
ネットワーク上の拡散過程では、初期スプレッドラーの集合に影響を受けるノードがいくつあると期待されているか?
本稿では、スケーラブルな動的メッセージパッシングアプローチに基づいて、一般的な独立モデルにおける影響関数を推定するアルゴリズムを提案する。
また、線形しきい値モデルのバージョンに対する動的メッセージパッシング方程式も提供する。
論文 参考訳(メタデータ) (2019-12-29T22:15:58Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。