論文の概要: In Silico Development of Psychometric Scales: Feasibility of Representative Population Data Simulation with LLMs
- arxiv url: http://arxiv.org/abs/2512.02910v1
- Date: Tue, 02 Dec 2025 16:26:17 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-12-03 21:04:45.964549
- Title: In Silico Development of Psychometric Scales: Feasibility of Representative Population Data Simulation with LLMs
- Title(参考訳): サイリコにおける心理測定尺度の開発 : LLMを用いた代表人口データシミュレーションの可能性
- Authors: Enrico Cipriani, Pavel Okopnyi, Danilo Menicucci, Simone Grassini,
- Abstract要約: 心理測定尺度の開発には、大きなサンプル、複数のテストフェーズ、実質的なリソースが必要である。
大規模言語モデル(LLM)の最近の進歩は、合成参加者データの生成を可能にする。
LLMシミュレーションデータセットが人間の反応の潜伏構造と測定特性を再現できるかどうかを検証した。
- 参考スコア(独自算出の注目度): 0.5833117322405447
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Developing and validating psychometric scales requires large samples, multiple testing phases, and substantial resources. Recent advances in Large Language Models (LLMs) enable the generation of synthetic participant data by prompting models to answer items while impersonating individuals of specific demographic profiles, potentially allowing in silico piloting before real data collection. Across four preregistered studies (N = circa 300 each), we tested whether LLM-simulated datasets can reproduce the latent structures and measurement properties of human responses. In Studies 1-2, we compared LLM-generated data with real datasets for two validated scales; in Studies 3-4, we created new scales using EFA on simulated data and then examined whether these structures generalized to newly collected human samples. Simulated datasets replicated the intended factor structures in three of four studies and showed consistent configural and metric invariance, with scalar invariance achieved for the two newly developed scales. However, correlation-based tests revealed substantial differences between real and synthetic datasets, and notable discrepancies appeared in score distributions and variances. Thus, while LLMs capture group-level latent structures, they do not approximate individual-level data properties. Simulated datasets also showed full internal invariance across gender. Overall, LLM-generated data appear useful for early-stage, group-level psychometric prototyping, but not as substitutes for individual-level validation. We discuss methodological limitations, risks of bias and data pollution, and ethical considerations related to in silico psychometric simulations.
- Abstract(参考訳): 心理測定尺度の開発と検証には、大規模なサンプル、複数のテストフェーズ、実質的なリソースが必要である。
近年のLarge Language Models (LLMs) の進歩により、特定の人口統計プロファイルの個人を偽装しながら、モデルにアイテムに答えるよう促すことで、合成参加者データの生成が可能となり、実際のデータ収集の前にサイリコのパイロット化が可能になった。
4つの事前登録研究 (N = circa 300) において, LLMシミュレーションデータセットが人間の反応の潜伏構造と測定特性を再現できるかどうかを検討した。
研究1-2では, LLM生成データと実データセットを2つの評価尺度で比較し, 研究3-4では, シミュレーションデータにEFAを用いた新しい尺度を作成し, これらの構造が新たに収集されたサンプルに一般化されたかどうかを検討した。
シミュレーションデータセットは、4つの研究のうち3つの因子構造を再現し、一貫した構成的および計量的不変性を示し、新たに開発された2つのスケールでスカラー不変性を達成した。
しかし, 相関分析の結果, 実際のデータセットと合成データセットの間に有意な差がみられ, スコア分布と分散に顕著な相違がみられた。
したがって、LSMはグループレベルの潜在構造をキャプチャするが、個々のレベルのデータ特性を近似しない。
シミュレーションデータセットはまた、性別間の完全な内部不変性を示した。
全体として、LSM生成データは、早期、グループレベルの心理測定プロトタイピングに有用であるが、個々のレベルの検証の代用にはならない。
本稿では,サイリコ・サイロメトリック・シミュレーションにおける方法論的限界,バイアスやデータ汚染のリスク,倫理的考察について論じる。
関連論文リスト
- How Data Mixing Shapes In-Context Learning: Asymptotic Equivalence for Transformers with MLPs [8.135786025034626]
事前訓練されたトランスフォーマーは、目覚ましいコンテキスト内学習能力を示し、新しいタスクに適応できる。
複数のデータソースから引き出された非線形タスクに対して、非線形同値ヘッドを持つ事前学習されたトランスフォーマーのICLについて検討する。
我々の研究は、トランスフォーマーにおけるICLの理論基盤を前進させ、ICLにおけるアーキテクチャとデータの普遍性に関する実用的な洞察を提供する。
論文 参考訳(メタデータ) (2025-10-29T17:51:57Z) - Valid Inference with Imperfect Synthetic Data [39.10587411316875]
モーメントの一般化法に基づく新しい推定器を提案する。
合成データのモーメント残差と実データのモーメント間の相互作用は、対象パラメータの推定を大幅に改善できることがわかった。
論文 参考訳(メタデータ) (2025-08-08T18:32:52Z) - Prismatic Synthesis: Gradient-based Data Diversification Boosts Generalization in LLM Reasoning [77.120955854093]
我々は,データ多様性が言語モデルにおける一般化の強力な予測因子であることを示す。
モデル誘起勾配のエントロピーを通して多様性を定量化する計量であるG-Vendiを導入する。
多様な合成データを生成するためのフレームワークであるPrismatic Synthesisを提案する。
論文 参考訳(メタデータ) (2025-05-26T16:05:10Z) - Human Preferences in Large Language Model Latent Space: A Technical Analysis on the Reliability of Synthetic Data in Voting Outcome Prediction [5.774786149181393]
大規模言語モデル(LLM)における人口統計特性と即時変動が潜在世論マッピングに与える影響を解析する。
LLMが生成したデータは、実世界の人間の反応で観測された分散を再現できないことがわかった。
政治分野では、ペルソナ・ツー・パーティのマッピングは限定的な分化を示しており、結果として、調査データに見られる意見の微妙な分布に欠ける合成データとなる。
論文 参考訳(メタデータ) (2025-02-22T16:25:33Z) - Generating Realistic Tabular Data with Large Language Models [49.03536886067729]
大規模言語モデル(LLM)は多様なタスクに使われてきたが、特徴と対象変数の正確な相関は捉えていない。
そこで本研究では,LLMに基づく3つの重要な改良を加えて,実データの特徴クラス相関を正しく把握する手法を提案する。
実験の結果,本手法は下流タスクにおいて,20個のデータセット上で10個のSOTAベースラインを著しく上回っていることがわかった。
論文 参考訳(メタデータ) (2024-10-29T04:14:32Z) - On the Diversity of Synthetic Data and its Impact on Training Large Language Models [34.00031258223175]
大規模言語モデル(LLM)は、多種多様な高品質な事前学習データの必要性を強調している。
合成データは、データの不足とアクセシビリティの課題に対する、実行可能なソリューションとして現れます。
本研究では, 事前学習および微調整段階における合成データ多様性の下流効果について検討した。
論文 参考訳(メタデータ) (2024-10-19T22:14:07Z) - Diffusion posterior sampling for simulation-based inference in tall data settings [53.17563688225137]
シミュレーションベース推論(SBI)は、入力パラメータを所定の観測に関連付ける後部分布を近似することができる。
本研究では、モデルのパラメータをより正確に推測するために、複数の観測値が利用できる、背の高いデータ拡張について考察する。
提案手法を,最近提案した各種数値実験の競合手法と比較し,数値安定性と計算コストの観点から,その優位性を実証した。
論文 参考訳(メタデータ) (2024-04-11T09:23:36Z) - Synthetic location trajectory generation using categorical diffusion
models [50.809683239937584]
拡散モデル(DPM)は急速に進化し、合成データのシミュレーションにおける主要な生成モデルの一つとなっている。
本稿では,個人が訪れた物理的位置を表す変数列である合成個別位置軌跡(ILT)の生成にDPMを用いることを提案する。
論文 参考訳(メタデータ) (2024-02-19T15:57:39Z) - Using Explainable Boosting Machine to Compare Idiographic and Nomothetic
Approaches for Ecological Momentary Assessment Data [2.0824228840987447]
本稿では,非線形解釈型機械学習(ML)モデルを用いた分類問題について検討する。
木々の様々なアンサンブルは、不均衡な合成データセットと実世界のデータセットを用いて線形モデルと比較される。
2つの実世界のデータセットのうちの1つで、知識蒸留法は改善されたAUCスコアを達成する。
論文 参考訳(メタデータ) (2022-04-04T17:56:37Z) - Equivariance Allows Handling Multiple Nuisance Variables When Analyzing
Pooled Neuroimaging Datasets [53.34152466646884]
本稿では,構造空間上でインスタンス化された同変表現学習における最近の結果と,因果推論における古典的結果の簡易な利用が,いかに効果的に実現されたかを示す。
いくつかの仮定の下で、我々のモデルが複数のニュアンス変数を扱えることを実証し、そうでなければサンプルの大部分を取り除く必要のあるシナリオにおいて、プールされた科学データセットの分析を可能にする。
論文 参考訳(メタデータ) (2022-03-29T04:54:06Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。