論文の概要: Psychometrics in Behavioral Software Engineering: A Methodological
Introduction with Guidelines
- arxiv url: http://arxiv.org/abs/2005.09959v4
- Date: Tue, 8 Jun 2021 13:10:37 GMT
- ステータス: 処理完了
- システム内更新日: 2023-05-19 06:00:45.029542
- Title: Psychometrics in Behavioral Software Engineering: A Methodological
Introduction with Guidelines
- Title(参考訳): 行動ソフトウェア工学における心理計測--ガイドラインによる方法論的紹介
- Authors: Daniel Graziotin, Per Lenberg, Robert Feldt, Stefan Wagner
- Abstract要約: 本稿では,ソフトウェア工学研究者のための測定器評価のための心理測定理論を紹介する。
項目プール,項目レビュー,パイロットテスト,項目分析,要因分析,項目の統計特性,信頼性,妥当性,テストバイアスの公平性など,新たな心理的構造を運用する際の活動について詳述する。
心理学からの確立した方法の採用に向けて,SE研究における文化の変化を奨励したい。
- 参考スコア(独自算出の注目度): 19.40714760075466
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: A meaningful and deep understanding of the human aspects of software
engineering (SE) requires psychological constructs to be considered. Psychology
theory can facilitate the systematic and sound development as well as the
adoption of instruments (e.g., psychological tests, questionnaires) to assess
these constructs. In particular, to ensure high quality, the psychometric
properties of instruments need evaluation. In this paper, we provide an
introduction to psychometric theory for the evaluation of measurement
instruments for SE researchers. We present guidelines that enable using
existing instruments and developing new ones adequately. We conducted a
comprehensive review of the psychology literature framed by the Standards for
Educational and Psychological Testing. We detail activities used when
operationalizing new psychological constructs, such as item pooling, item
review, pilot testing, item analysis, factor analysis, statistical property of
items, reliability, validity, and fairness in testing and test bias. We provide
an openly available example of a psychometric evaluation based on our
guideline. We hope to encourage a culture change in SE research towards the
adoption of established methods from psychology. To improve the quality of
behavioral research in SE, studies focusing on introducing, validating, and
then using psychometric instruments need to be more common.
- Abstract(参考訳): ソフトウェア工学(SE)の人間的側面を有意義かつ深く理解するには、心理的な構成を考える必要がある。
心理学理論は、これらの構造を評価するための機器(例えば、心理検査、アンケート)の採用と同様に、体系的および健全な発達を促進することができる。
特に、高品質を確保するためには、楽器の心理測定特性を評価する必要がある。
本稿では,SE研究者のための測定器評価のための心理測定理論について紹介する。
既存の機器を有効活用し,新しい機器を適切に開発するためのガイドラインを提示する。
本研究は,教育・心理テスト基準に基づく心理学文献の包括的レビューを行った。
項目プーリング,項目レビュー,パイロットテスト,項目分析,因子分析,項目の統計的特性,信頼性,妥当性,テストバイアスの公平性など,新たな心理的構成を運用する際に使用されるアクティビティを詳述する。
ガイドラインに基づいた心理測定評価のオープンに利用可能な例を示す。
心理学からの確立した方法の採用に向けて,SE研究における文化の変化を奨励したい。
SEにおける行動研究の質を向上させるためには、導入、検証、そして心理測定器の使用に焦点を当てた研究がより一般的である必要がある。
関連論文リスト
- Measuring the Mental Health of Content Reviewers, a Systematic Review [50.06646946044604]
多くの労働者は、長期的、潜在的に不可逆的な心理的害を報告している。
この研究は、少量の曝露の後でも、他の種類の専門家に心理的に害を与える活動と似ている。
この体系的なレビューは、他の専門職からの心理的対策を要約し、コンテンツレビュアーの経験と関連づけるものである。
論文 参考訳(メタデータ) (2025-02-01T00:50:15Z) - Are LLMs effective psychological assessors? Leveraging adaptive RAG for interpretable mental health screening through psychometric practice [2.9775344067885974]
本稿では,ソーシャルメディアの投稿を分析し,心理的アンケートを補完する適応型検索・拡張生成(RAG)手法を提案する。
本手法は,心理調査において各質問に対する最も関連性の高いユーザ投稿を検索し,ゼロショット環境でのアンケート結果の予測にLarge Language Models (LLMs) を用いる。
論文 参考訳(メタデータ) (2025-01-02T00:01:54Z) - Assessment and manipulation of latent constructs in pre-trained language models using psychometric scales [4.805861461250903]
本稿では,標準的な心理アンケートを自然言語推論のプロンプトに再構成する方法を示す。
我々は、88種類の公開モデルを用いて、人間のようなメンタルヘルス関連構造の存在を実証した。
論文 参考訳(メタデータ) (2024-09-29T11:00:41Z) - Quantifying AI Psychology: A Psychometrics Benchmark for Large Language Models [57.518784855080334]
大きな言語モデル(LLM)は例外的なタスク解決能力を示しており、人間に似た役割を担っている。
本稿では,LLMにおける心理学的次元を調査するための枠組みとして,心理学的識別,評価データセットのキュレーション,結果検証による評価について述べる。
本研究では,個性,価値観,感情,心の理論,モチベーション,知性の6つの心理学的側面を網羅した総合的心理測定ベンチマークを導入する。
論文 参考訳(メタデータ) (2024-06-25T16:09:08Z) - PsychoGAT: A Novel Psychological Measurement Paradigm through Interactive Fiction Games with LLM Agents [68.50571379012621]
心理的な測定は、精神健康、自己理解、そして個人の発達に不可欠である。
心理学ゲームAgenT(サイコガト)は、信頼性、収束妥当性、差別的妥当性などの心理学的指標において統計的に有意な卓越性を達成している。
論文 参考訳(メタデータ) (2024-02-19T18:00:30Z) - Precision psychiatry: predicting predictability [0.0]
私は精密精神医学の分野での10の課題をレビューします。
現実の人口と現実的な臨床結果の定義についての研究が必要である。
プラセボ効果や処方薬の非順守などの治療関連因子について検討する。
論文 参考訳(メタデータ) (2023-06-21T13:10:46Z) - From Static Benchmarks to Adaptive Testing: Psychometrics in AI Evaluation [60.14902811624433]
本稿では,静的評価手法から適応テストへのパラダイムシフトについて論じる。
これには、ベンチマークで各テスト項目の特性と価値を推定し、リアルタイムでアイテムを動的に調整することが含まれる。
我々は、AI評価にサイコメトリックを採用する現在のアプローチ、アドバンテージ、そして根底にある理由を分析します。
論文 参考訳(メタデータ) (2023-06-18T09:54:33Z) - Concepts and Experiments on Psychoanalysis Driven Computing [0.0]
本研究では,テキストを用いたインタラクティブメディアにおけるヒューマンファクターとユーザ認知の効果的な取り込みについて検討する。
我々は、ラカンの談話型の概念を用いて、テキストの実際の特性、品質、内容を捉え、深く理解する。
計算手法が精神分析と体系的に組み合わされるのはこれが初めてである。
論文 参考訳(メタデータ) (2022-09-29T19:27:22Z) - Evaluating and Inducing Personality in Pre-trained Language Models [78.19379997967191]
人間の個性理論を機械行動研究のツールとして活用することで,心理測定研究からインスピレーションを得た。
これらの疑問に答えるために,機械の動作を研究するためのMachine Personality Inventory(MPI)ツールを紹介した。
MPIは、ビッグファイブ・パーソナリティ・ファクター(Big Five Personality Factors、ビッグファイブ・パーソナリティ・ファクター)理論とパーソナリティ評価在庫に基づく標準化されたパーソナリティ・テストに従う。
パーソナリティ・プロンプト法(P2法)を考案し、特定のパーソナリティを持つLSMを制御可能な方法で誘導する。
論文 参考訳(メタデータ) (2022-05-20T07:32:57Z) - AGENT: A Benchmark for Core Psychological Reasoning [60.35621718321559]
直観心理学は、観察可能な行動を駆動する隠された精神変数を推論する能力です。
他のエージェントを推論する機械エージェントに対する近年の関心にもかかわらず、そのようなエージェントが人間の推論を駆動するコア心理学の原則を学ぶか保持するかは明らかではない。
本稿では,プロシージャが生成する3dアニメーション,エージェントを4つのシナリオで構成したベンチマークを提案する。
論文 参考訳(メタデータ) (2021-02-24T14:58:23Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。