論文の概要: An unsupervised learning approach to evaluate questionnaire data -- what
one can learn from violations of measurement invariance
- arxiv url: http://arxiv.org/abs/2312.06309v1
- Date: Mon, 11 Dec 2023 11:31:41 GMT
- ステータス: 処理完了
- システム内更新日: 2023-12-12 15:54:29.488385
- Title: An unsupervised learning approach to evaluate questionnaire data -- what
one can learn from violations of measurement invariance
- Title(参考訳): 教師なし学習によるアンケートデータの評価 --測定不均一性の違反から学べるもの--
- Authors: Max Hahn-Klimroth, Paul W. Dierkes, Matthias W. Kleespies
- Abstract要約: 本稿では,このような研究データに対する教師なし学習に基づくアプローチを提案する。
データ準備、アンケートのクラスタリング、得られたクラスタリングと各グループの特性に基づいて類似度を測定する。
グループ間の自然な比較と、グループの応答パターンの自然な記述を提供する。
- 参考スコア(独自算出の注目度): 2.4762962548352467
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: In several branches of the social sciences and humanities, surveys based on
standardized questionnaires are a prominent research tool. While there are a
variety of ways to analyze the data, some standard procedures have become
established. When those surveys want to analyze differences in the answer
patterns of different groups (e.g., countries, gender, age, ...), these
procedures can only be carried out in a meaningful way if there is measurement
invariance, i.e., the measured construct has psychometric equivalence across
groups. As recently raised as an open problem by Sauerwein et al. (2021), new
evaluation methods that work in the absence of measurement invariance are
needed.
This paper promotes an unsupervised learning-based approach to such research
data by proposing a procedure that works in three phases: data preparation,
clustering of questionnaires, and measuring similarity based on the obtained
clustering and the properties of each group. We generate synthetic data in
three data sets, which allows us to compare our approach with the PCA approach
under measurement invariance and under violated measurement invariance. As a
main result, we obtain that the approach provides a natural comparison between
groups and a natural description of the response patterns of the groups.
Moreover, it can be safely applied to a wide variety of data sets, even in the
absence of measurement invariance. Finally, this approach allows us to
translate (violations of) measurement invariance into a meaningful measure of
similarity.
- Abstract(参考訳): 社会科学と人文科学のいくつかの分野において、標準化されたアンケートに基づく調査は顕著な研究ツールである。
データ分析には様々な方法があるが、いくつかの標準手順が確立されている。
これらの調査は、異なるグループ(例えば、国、性別、年齢、...)の回答パターンの違いを分析したい場合、これらの手順は、測定不変性がある場合、すなわち、測定された構成物がグループ間で心理的に等価である場合にのみ意味のある方法で実行することができる。
sauerweinら(2021年)のオープン問題として最近提起されたように、測定の不変性無しで機能する新しい評価方法が必要である。
本稿では、データ準備、アンケートのクラスタリング、得られたクラスタリングと各グループの特性に基づく類似度の測定という3つのフェーズで機能する手順を提案し、そのような研究データに対する教師なし学習に基づくアプローチを提案する。
我々は3つのデータセットで合成データを生成し、測定不変性と測定不変性に反する条件下でのPCAアプローチと比較する。
その結果,本手法は,グループ間の自然な比較と,グループ内の応答パターンの自然な記述を提供することがわかった。
さらに、測定不変性がない場合でも、多種多様なデータセットに安全に適用することができる。
最後に、この手法により、測定不変性を意味のある類似度尺度に変換することができる。
関連論文リスト
- A structured regression approach for evaluating model performance across intersectional subgroups [53.91682617836498]
分散評価(disaggregated evaluation)は、AIフェアネスアセスメントにおける中心的なタスクであり、AIシステムのさまざまなサブグループ間でのパフォーマンスを測定することを目的としている。
非常に小さなサブグループであっても,信頼性の高いシステム性能推定値が得られることを示す。
論文 参考訳(メタデータ) (2024-01-26T14:21:45Z) - Measuring Adversarial Datasets [28.221635644616523]
研究者は、標準的なベンチマークデータセットでは明らかにできないモデル欠陥をキャプチャするために、さまざまな逆データセットをキュレートした。
これらの敵対的変換の意図的かつ意図しない結果を測定する方法はまだ存在しない。
NLPタスクのテキストインスタンスを記述した既存の定量化指標の体系的な調査を行った。
論文 参考訳(メタデータ) (2023-11-06T22:08:16Z) - Assaying Out-Of-Distribution Generalization in Transfer Learning [103.57862972967273]
私たちは、経験的に対処するメッセージの相違を強調して、以前の作業の統一的なビューを取ります。
私たちは9つの異なるアーキテクチャから、多数の、あるいは少数の設定で31K以上のネットワークを微調整しました。
論文 参考訳(メタデータ) (2022-07-19T12:52:33Z) - Estimating Structural Disparities for Face Models [54.062512989859265]
機械学習では、異なるサブ人口間でのモデルの性能や結果の差を測定することで、しばしば異質度の測定が定義される。
本研究では、人間の顔に訓練されたコンピュータビジョンモデルや、顔属性予測や影響推定などのタスクについて、そのような分析を行う。
論文 参考訳(メタデータ) (2022-04-13T05:30:53Z) - Spectral Clustering with Variance Information for Group Structure
Estimation in Panel Data [7.712669451925186]
まず、各係数の推定値のばらつきがグループ構造の推定に有用な情報を含んでいることを示す局所解析を行う。
次に、分散情報を明示的に考慮した一般的なパネルデータモデルに対して、観測不能なグルーピングを推定する手法を提案する。
論文 参考訳(メタデータ) (2022-01-05T19:16:16Z) - Selecting the suitable resampling strategy for imbalanced data
classification regarding dataset properties [62.997667081978825]
医学、情報検索、サイバーセキュリティ、ソーシャルメディアなどの多くのアプリケーションドメインでは、分類モデルの導入に使用されるデータセットは、各クラスのインスタンスの不平等な分布を持つことが多い。
この状況は不均衡データ分類と呼ばれ、少数民族の例では予測性能が低い。
オーバーサンプリングとアンダーサンプリングの技術は、各クラスの例の数とバランスをとることでこの問題に対処する、よく知られた戦略である。
論文 参考訳(メタデータ) (2021-12-15T18:56:39Z) - A Statistical Analysis of Summarization Evaluation Metrics using
Resampling Methods [60.04142561088524]
信頼区間は比較的広く,信頼性の高い自動測定値の信頼性に高い不確実性を示す。
多くのメトリクスはROUGEよりも統計的改善を示していないが、QAEvalとBERTScoreという2つの最近の研究は、いくつかの評価設定で行われている。
論文 参考訳(メタデータ) (2021-03-31T18:28:14Z) - Quantitative Evaluations on Saliency Methods: An Experimental Study [6.290238942982972]
我々は, 忠実性, 局在性, 偽陽性, 感度チェック, 安定性など, 指標の現状を簡単に要約する。
比較したすべての手法の中で、すべての指標において1つの説明法が他を圧倒することはないと結論づける。
論文 参考訳(メタデータ) (2020-12-31T14:13:30Z) - Measuring Disentanglement: A Review of Metrics [2.959278299317192]
データの変動要因を解き放つことを学ぶことは、AIにとって重要な問題です。
我々は,すべての指標を介入型,予測型,情報型という3つの家系に分類する新しい分類法を提案する。
幅広い実験を行い、表現特性を分離し、様々な側面におけるすべてのメトリクスを比較する。
論文 参考訳(メタデータ) (2020-12-16T21:28:25Z) - Towards Model-Agnostic Post-Hoc Adjustment for Balancing Ranking
Fairness and Algorithm Utility [54.179859639868646]
Bipartiteランキングは、ラベル付きデータから正の個人よりも上位の個人をランク付けするスコアリング機能を学ぶことを目的としている。
学習したスコアリング機能が、異なる保護グループ間で体系的な格差を引き起こすのではないかという懸念が高まっている。
本稿では、二部構成のランキングシナリオにおいて、それらのバランスをとるためのモデル後処理フレームワークを提案する。
論文 参考訳(メタデータ) (2020-06-15T10:08:39Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。