論文の概要: Machine Learning-Based Estimation and Goodness-of-Fit for Large-Scale
Confirmatory Item Factor Analysis
- arxiv url: http://arxiv.org/abs/2109.09500v1
- Date: Mon, 20 Sep 2021 12:53:01 GMT
- ステータス: 処理完了
- システム内更新日: 2021-09-21 22:52:58.261004
- Title: Machine Learning-Based Estimation and Goodness-of-Fit for Large-Scale
Confirmatory Item Factor Analysis
- Title(参考訳): 大規模確認項目因子分析のための機械学習に基づく推定と適合性
- Authors: Christopher J. Urban and Daniel J. Bauer
- Abstract要約: 大規模項目因子分析(IFA)のための新しいパラメータ推定法と適合度評価法について検討する。
パラメータ推定のために、探索型IFAのためのUrban and Bauer's Deep Learning Algorithm(2021)を検証環境に拡張する。
GOF評価のための新しいシミュレーションベーステストと指標について検討する。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by-sa/4.0/
- Abstract: We investigate novel parameter estimation and goodness-of-fit (GOF)
assessment methods for large-scale confirmatory item factor analysis (IFA) with
many respondents, items, and latent factors. For parameter estimation, we
extend Urban and Bauer's (2021) deep learning algorithm for exploratory IFA to
the confirmatory setting by showing how to handle user-defined constraints on
loadings and factor correlations. For GOF assessment, we explore new
simulation-based tests and indices. In particular, we consider extensions of
the classifier two-sample test (C2ST), a method that tests whether a machine
learning classifier can distinguish between observed data and synthetic data
sampled from a fitted IFA model. The C2ST provides a flexible framework that
integrates overall model fit, piece-wise fit, and person fit. Proposed
extensions include a C2ST-based test of approximate fit in which the user
specifies what percentage of observed data can be distinguished from synthetic
data as well as a C2ST-based relative fit index that is similar in spirit to
the relative fit indices used in structural equation modeling. Via simulation
studies, we first show that the confirmatory extension of Urban and Bauer's
(2021) algorithm produces more accurate parameter estimates as the sample size
increases and obtains comparable estimates to a state-of-the-art confirmatory
IFA estimation procedure in less time. We next show that the C2ST-based test of
approximate fit controls the empirical type I error rate and detects when the
number of latent factors is misspecified. Finally, we empirically investigate
how the sampling distribution of the C2ST-based relative fit index depends on
the sample size.
- Abstract(参考訳): 大規模確認項目因子分析(IFA)のための新しいパラメータ推定法と適合度評価法について,多くの回答者,項目,潜伏因子を用いた検討を行った。
パラメータ推定のために,探索的ifaのためのurban and bauer (2021) 深層学習アルゴリズムを拡張し,負荷と因子相関に対するユーザ定義制約の扱い方を示す。
GOF評価のための新しいシミュレーションベーステストと指標について検討する。
特に、機械学習の分類器が観測データと適合するifaモデルからサンプリングされた合成データとを区別できるかどうかをテストするc2st(classifier two-sample test)の拡張を検討する。
C2STは、全体的なモデル適合、ピースワイド適合、人体適合を統合するフレキシブルなフレームワークを提供する。
提案された拡張には、ユーザが合成データと区別できる観測データの割合を特定するC2STベースの近似適合試験と、構造方程式モデリングで使用される相対適合指標と精神的に類似したC2STベースの相対適合指数が含まれる。
シミュレーション研究により,Urban and Bauer's (2021)アルゴリズムの検証拡張により,サンプルサイズが大きくなるにつれて,より正確なパラメータ推定が得られ,より少ない時間で最先端のIFA推定手法に匹敵する推定値が得られることを示した。
次に,c2stに基づく近似適合テストが経験的i型誤差率を制御し,潜在因子数の誤特定を検知することを示す。
最後に,c2st-based relative fit indexのサンプリング分布がサンプルサイズにどのように依存するかを実験的に検討した。
関連論文リスト
- Downstream-Pretext Domain Knowledge Traceback for Active Learning [138.02530777915362]
本稿では、下流知識と事前学習指導のデータ相互作用をトレースするダウンストリーム・プレテキスト・ドメイン知識トレース(DOKT)手法を提案する。
DOKTは、トレースバックの多様性指標とドメインベースの不確実性推定器から構成される。
10のデータセットで行った実験は、我々のモデルが他の最先端の手法よりも優れていることを示している。
論文 参考訳(メタデータ) (2024-07-20T01:34:13Z) - The Languini Kitchen: Enabling Language Modelling Research at Different
Scales of Compute [66.84421705029624]
本稿では,アクセル時間で測定された等価計算に基づくモデル比較を可能にする実験的プロトコルを提案する。
私たちは、既存の学術的ベンチマークを上回り、品質、多様性、文書の長さで上回る、大規模で多様で高品質な書籍データセットを前処理します。
この研究は、GPT-2アーキテクチャから派生したフィードフォワードモデルと、10倍のスループットを持つ新しいLSTMの形式でのリカレントモデルという2つのベースラインモデルも提供する。
論文 参考訳(メタデータ) (2023-09-20T10:31:17Z) - L-C2ST: Local Diagnostics for Posterior Approximations in
Simulation-Based Inference [63.22081662149488]
L-C2STは、任意の観測で後部推定器の局所的な評価を可能にする。
理論上は根拠があり容易に解釈できる。
標準的なSBIベンチマークでは、L-C2STはC2STに匹敵する結果を提供し、代替のローカルアプローチより優れている。
論文 参考訳(メタデータ) (2023-06-06T10:53:26Z) - ALMERIA: Boosting pairwise molecular contrasts with scalable methods [0.0]
ALMERIAは、一対の分子コントラストに基づく化合物の類似性と活性予測を推定するためのツールである。
大量のデータを利用するスケーラブルなソフトウェアと手法を使って実装されている。
分子活性予測の最先端性能を示す実験を行った。
論文 参考訳(メタデータ) (2023-04-28T16:27:06Z) - Revisiting the Evaluation of Image Synthesis with GANs [55.72247435112475]
本研究では, 合成性能の評価に関する実証的研究を行い, 生成モデルの代表としてGAN(Generative Adversarial Network)を用いた。
特に、表現空間におけるデータポイントの表現方法、選択したサンプルを用いた公平距離の計算方法、各集合から使用可能なインスタンス数など、さまざまな要素の詳細な分析を行う。
論文 参考訳(メタデータ) (2023-04-04T17:54:32Z) - Computational Efficient Approximations of the Concordance Probability in
a Big Data Setting [0.0]
本研究では,一致確率を高速かつ高精度に算出する2つの推定手法を提案する。
2つの実生活データセットの実験により、人工シミュレーションの結論が確認された。
論文 参考訳(メタデータ) (2021-05-21T15:09:53Z) - Two-Sample Testing on Ranked Preference Data and the Role of Modeling
Assumptions [57.77347280992548]
本稿では,ペアワイズ比較データとランキングデータのための2サンプル試験を設計する。
私たちのテストでは、基本的に分布に関する仮定は必要ありません。
実世界のペアワイズ比較データに2サンプルテストを適用することで、人によって提供される評価とランキングは、実際は異なる分散である、と結論付ける。
論文 参考訳(メタデータ) (2020-06-21T20:51:09Z) - Machine learning for causal inference: on the use of cross-fit
estimators [77.34726150561087]
より優れた統計特性を得るために、二重ローバストなクロスフィット推定器が提案されている。
平均因果効果(ACE)に対する複数の推定器の性能評価のためのシミュレーション研究を行った。
機械学習で使用する場合、二重確率のクロスフィット推定器は、バイアス、分散、信頼区間のカバレッジで他のすべての推定器よりも大幅に優れていた。
論文 参考訳(メタデータ) (2020-04-21T23:09:55Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。