論文の概要: Psychometrics in Behavioral Software Engineering: A Methodological
Introduction with Guidelines
- arxiv url: http://arxiv.org/abs/2005.09959v4
- Date: Tue, 8 Jun 2021 13:10:37 GMT
- ステータス: 処理完了
- システム内更新日: 2023-05-19 06:00:45.029542
- Title: Psychometrics in Behavioral Software Engineering: A Methodological
Introduction with Guidelines
- Title(参考訳): 行動ソフトウェア工学における心理計測--ガイドラインによる方法論的紹介
- Authors: Daniel Graziotin, Per Lenberg, Robert Feldt, Stefan Wagner
- Abstract要約: 本稿では,ソフトウェア工学研究者のための測定器評価のための心理測定理論を紹介する。
項目プール,項目レビュー,パイロットテスト,項目分析,要因分析,項目の統計特性,信頼性,妥当性,テストバイアスの公平性など,新たな心理的構造を運用する際の活動について詳述する。
心理学からの確立した方法の採用に向けて,SE研究における文化の変化を奨励したい。
- 参考スコア(独自算出の注目度): 19.40714760075466
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: A meaningful and deep understanding of the human aspects of software
engineering (SE) requires psychological constructs to be considered. Psychology
theory can facilitate the systematic and sound development as well as the
adoption of instruments (e.g., psychological tests, questionnaires) to assess
these constructs. In particular, to ensure high quality, the psychometric
properties of instruments need evaluation. In this paper, we provide an
introduction to psychometric theory for the evaluation of measurement
instruments for SE researchers. We present guidelines that enable using
existing instruments and developing new ones adequately. We conducted a
comprehensive review of the psychology literature framed by the Standards for
Educational and Psychological Testing. We detail activities used when
operationalizing new psychological constructs, such as item pooling, item
review, pilot testing, item analysis, factor analysis, statistical property of
items, reliability, validity, and fairness in testing and test bias. We provide
an openly available example of a psychometric evaluation based on our
guideline. We hope to encourage a culture change in SE research towards the
adoption of established methods from psychology. To improve the quality of
behavioral research in SE, studies focusing on introducing, validating, and
then using psychometric instruments need to be more common.
- Abstract(参考訳): ソフトウェア工学(SE)の人間的側面を有意義かつ深く理解するには、心理的な構成を考える必要がある。
心理学理論は、これらの構造を評価するための機器(例えば、心理検査、アンケート)の採用と同様に、体系的および健全な発達を促進することができる。
特に、高品質を確保するためには、楽器の心理測定特性を評価する必要がある。
本稿では,SE研究者のための測定器評価のための心理測定理論について紹介する。
既存の機器を有効活用し,新しい機器を適切に開発するためのガイドラインを提示する。
本研究は,教育・心理テスト基準に基づく心理学文献の包括的レビューを行った。
項目プーリング,項目レビュー,パイロットテスト,項目分析,因子分析,項目の統計的特性,信頼性,妥当性,テストバイアスの公平性など,新たな心理的構成を運用する際に使用されるアクティビティを詳述する。
ガイドラインに基づいた心理測定評価のオープンに利用可能な例を示す。
心理学からの確立した方法の採用に向けて,SE研究における文化の変化を奨励したい。
SEにおける行動研究の質を向上させるためには、導入、検証、そして心理測定器の使用に焦点を当てた研究がより一般的である必要がある。
関連論文リスト
- Assessment and manipulation of latent constructs in pre-trained language models using psychometric scales [4.805861461250903]
本稿では,標準的な心理アンケートを自然言語推論のプロンプトに再構成する方法を示す。
我々は、88種類の公開モデルを用いて、人間のようなメンタルヘルス関連構造の存在を実証した。
論文 参考訳(メタデータ) (2024-09-29T11:00:41Z) - Quantifying AI Psychology: A Psychometrics Benchmark for Large Language Models [57.518784855080334]
大きな言語モデル(LLM)は例外的なタスク解決能力を示しており、人間に似た役割を担っている。
本稿では,LLMにおける心理学的次元を調査するための枠組みとして,心理学的識別,評価データセットのキュレーション,結果検証による評価について述べる。
本研究では,個性,価値観,感情,心の理論,モチベーション,知性の6つの心理学的側面を網羅した総合的心理測定ベンチマークを導入する。
論文 参考訳(メタデータ) (2024-06-25T16:09:08Z) - PsychoGAT: A Novel Psychological Measurement Paradigm through Interactive Fiction Games with LLM Agents [68.50571379012621]
心理的な測定は、精神健康、自己理解、そして個人の発達に不可欠である。
心理学ゲームAgenT(サイコガト)は、信頼性、収束妥当性、差別的妥当性などの心理学的指標において統計的に有意な卓越性を達成している。
論文 参考訳(メタデータ) (2024-02-19T18:00:30Z) - Precision psychiatry: predicting predictability [0.0]
私は精密精神医学の分野での10の課題をレビューします。
現実の人口と現実的な臨床結果の定義についての研究が必要である。
プラセボ効果や処方薬の非順守などの治療関連因子について検討する。
論文 参考訳(メタデータ) (2023-06-21T13:10:46Z) - From Static Benchmarks to Adaptive Testing: Psychometrics in AI Evaluation [60.14902811624433]
本稿では,静的評価手法から適応テストへのパラダイムシフトについて論じる。
これには、ベンチマークで各テスト項目の特性と価値を推定し、リアルタイムでアイテムを動的に調整することが含まれる。
我々は、AI評価にサイコメトリックを採用する現在のアプローチ、アドバンテージ、そして根底にある理由を分析します。
論文 参考訳(メタデータ) (2023-06-18T09:54:33Z) - Concepts and Experiments on Psychoanalysis Driven Computing [0.0]
本研究では,テキストを用いたインタラクティブメディアにおけるヒューマンファクターとユーザ認知の効果的な取り込みについて検討する。
我々は、ラカンの談話型の概念を用いて、テキストの実際の特性、品質、内容を捉え、深く理解する。
計算手法が精神分析と体系的に組み合わされるのはこれが初めてである。
論文 参考訳(メタデータ) (2022-09-29T19:27:22Z) - Interpretability by design using computer vision for behavioral sensing
in child and adolescent psychiatry [3.975358343371988]
我々は機械学習を用いて行動規範や金の標準行動評価システムの概念を導出する。
私たちの評価は、ネガティブな感情、活動レベル/覚醒、不安に対する人間の専門家評価に匹敵するものでした。
論文 参考訳(メタデータ) (2022-07-11T09:07:08Z) - Evaluating and Inducing Personality in Pre-trained Language Models [78.19379997967191]
人間の個性理論を機械行動研究のツールとして活用することで,心理測定研究からインスピレーションを得た。
これらの疑問に答えるために,機械の動作を研究するためのMachine Personality Inventory(MPI)ツールを紹介した。
MPIは、ビッグファイブ・パーソナリティ・ファクター(Big Five Personality Factors、ビッグファイブ・パーソナリティ・ファクター)理論とパーソナリティ評価在庫に基づく標準化されたパーソナリティ・テストに従う。
パーソナリティ・プロンプト法(P2法)を考案し、特定のパーソナリティを持つLSMを制御可能な方法で誘導する。
論文 参考訳(メタデータ) (2022-05-20T07:32:57Z) - AGENT: A Benchmark for Core Psychological Reasoning [60.35621718321559]
直観心理学は、観察可能な行動を駆動する隠された精神変数を推論する能力です。
他のエージェントを推論する機械エージェントに対する近年の関心にもかかわらず、そのようなエージェントが人間の推論を駆動するコア心理学の原則を学ぶか保持するかは明らかではない。
本稿では,プロシージャが生成する3dアニメーション,エージェントを4つのシナリオで構成したベンチマークを提案する。
論文 参考訳(メタデータ) (2021-02-24T14:58:23Z) - Opportunities of a Machine Learning-based Decision Support System for
Stroke Rehabilitation Assessment [64.52563354823711]
リハビリテーションアセスメントは、患者の適切な介入を決定するために重要である。
現在の評価の実践は、主にセラピストの経験に依存しており、セラピストの可用性が限られているため、アセスメントは頻繁に実施される。
我々は、強化学習を用いて評価の健全な特徴を識別できるインテリジェントな意思決定支援システムを開発した。
論文 参考訳(メタデータ) (2020-02-27T17:04:07Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。