Fugu-MT 論文翻訳(概要): Psychometrics in Behavioral Software Engineering: A Methodological Introduction with Guidelines

論文の概要: Psychometrics in Behavioral Software Engineering: A Methodological Introduction with Guidelines

arxiv url: http://arxiv.org/abs/2005.09959v4
Date: Tue, 8 Jun 2021 13:10:37 GMT
ステータス: 翻訳完了
システム内更新日: 2023-05-19 06:00:45.029542
Title: Psychometrics in Behavioral Software Engineering: A Methodological Introduction with Guidelines
Title（参考訳）: 行動ソフトウェア工学における心理計測--ガイドラインによる方法論的紹介
Authors: Daniel Graziotin, Per Lenberg, Robert Feldt, Stefan Wagner
Abstract要約: 本稿では,ソフトウェア工学研究者のための測定器評価のための心理測定理論を紹介する。項目プール,項目レビュー,パイロットテスト,項目分析,要因分析,項目の統計特性,信頼性,妥当性,テストバイアスの公平性など,新たな心理的構造を運用する際の活動について詳述する。心理学からの確立した方法の採用に向けて,SE研究における文化の変化を奨励したい。
参考スコア（独自算出の注目度）: 19.40714760075466
License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
Abstract: A meaningful and deep understanding of the human aspects of software engineering (SE) requires psychological constructs to be considered. Psychology theory can facilitate the systematic and sound development as well as the adoption of instruments (e.g., psychological tests, questionnaires) to assess these constructs. In particular, to ensure high quality, the psychometric properties of instruments need evaluation. In this paper, we provide an introduction to psychometric theory for the evaluation of measurement instruments for SE researchers. We present guidelines that enable using existing instruments and developing new ones adequately. We conducted a comprehensive review of the psychology literature framed by the Standards for Educational and Psychological Testing. We detail activities used when operationalizing new psychological constructs, such as item pooling, item review, pilot testing, item analysis, factor analysis, statistical property of items, reliability, validity, and fairness in testing and test bias. We provide an openly available example of a psychometric evaluation based on our guideline. We hope to encourage a culture change in SE research towards the adoption of established methods from psychology. To improve the quality of behavioral research in SE, studies focusing on introducing, validating, and then using psychometric instruments need to be more common.
Abstract（参考訳）: ソフトウェア工学(SE)の人間的側面を有意義かつ深く理解するには、心理的な構成を考える必要がある。心理学理論は、これらの構造を評価するための機器(例えば、心理検査、アンケート)の採用と同様に、体系的および健全な発達を促進することができる。特に、高品質を確保するためには、楽器の心理測定特性を評価する必要がある。本稿では,SE研究者のための測定器評価のための心理測定理論について紹介する。既存の機器を有効活用し,新しい機器を適切に開発するためのガイドラインを提示する。本研究は,教育・心理テスト基準に基づく心理学文献の包括的レビューを行った。項目プーリング,項目レビュー,パイロットテスト,項目分析,因子分析,項目の統計的特性,信頼性,妥当性,テストバイアスの公平性など,新たな心理的構成を運用する際に使用されるアクティビティを詳述する。ガイドラインに基づいた心理測定評価のオープンに利用可能な例を示す。心理学からの確立した方法の採用に向けて,SE研究における文化の変化を奨励したい。 SEにおける行動研究の質を向上させるためには、導入、検証、そして心理測定器の使用に焦点を当てた研究がより一般的である必要がある。

関連論文リスト

Responsible Evaluation of AI for Mental Health [72.85175110624736]
メンタルヘルスケアにおけるAIツールの評価に対する現在のアプローチは、断片化されており、臨床実践、社会的コンテキスト、ファーストハンドのユーザエクスペリエンスと不整合である。本稿では,臨床の健全性,社会的文脈,公平性を統合した学際的枠組みを導入することにより,責任ある評価を再考する。
論文参考訳（メタデータ） (2026-01-20T12:55:10Z)
MoodAngels: A Retrieval-augmented Multi-agent Framework for Psychiatry Diagnosis [58.67342568632529]
MoodAngelsは、気分障害の診断のための最初の特殊なマルチエージェントフレームワークである。 MoodSynは、合成精神医学の1,173件のオープンソースデータセットである。
論文参考訳（メタデータ） (2025-06-04T09:18:25Z)
TestAgent: An Adaptive and Intelligent Expert for Human Assessment [62.060118490577366]
対話型エンゲージメントによる適応テストを強化するために,大規模言語モデル(LLM)を利用したエージェントであるTestAgentを提案する。 TestAgentは、パーソナライズされた質問の選択をサポートし、テストテイカーの応答と異常をキャプチャし、動的で対話的なインタラクションを通じて正確な結果を提供する。
論文参考訳（メタデータ） (2025-06-03T16:07:54Z)
Large Language Model Psychometrics: A Systematic Review of Evaluation, Validation, and Enhancement [16.608577295968942]
本稿は, LLM心理学の新しい学際分野について紹介し, 合成する。心理学は人格、価値観、知性といった人間の心理学の無形側面を定量化する。最終的にこのレビューは、人間レベルのAIに合わせて将来の評価パラダイムを開発するための実用的な洞察を提供する。
論文参考訳（メタデータ） (2025-05-13T05:47:51Z)
Measuring Mental Health Variables in Computational Research: Toward Validated, Dimensional, and Transdiagnostic Approaches [6.796386356785538]
コンピュータメンタルヘルス研究は、心理学的現象を予測し理解するためのモデルを開発するが、しばしば精神病理学的構成の不適切な尺度に依存する。本研究は,(1)検証対象よりも不確定な尺度に依存すること,(2)精神保健施設を次元ではなくカテゴリーとして扱うこと,(3)診断対象以外の障害特異的施設に焦点をあてること,の3つの主要な課題を同定する。
論文参考訳（メタデータ） (2025-04-04T21:11:41Z)
Measuring the Mental Health of Content Reviewers, a Systematic Review [50.06646946044604]
多くの労働者は、長期的、潜在的に不可逆的な心理的害を報告している。この研究は、少量の曝露の後でも、他の種類の専門家に心理的に害を与える活動と似ている。この体系的なレビューは、他の専門職からの心理的対策を要約し、コンテンツレビュアーの経験と関連づけるものである。
論文参考訳（メタデータ） (2025-02-01T00:50:15Z)
Are LLMs effective psychological assessors? Leveraging adaptive RAG for interpretable mental health screening through psychometric practice [2.9775344067885974]
本稿では,ソーシャルメディアの投稿を分析し,心理的アンケートを補完する適応型検索・拡張生成(RAG)手法を提案する。本手法は,心理調査において各質問に対する最も関連性の高いユーザ投稿を検索し,ゼロショット環境でのアンケート結果の予測にLarge Language Models (LLMs) を用いる。
論文参考訳（メタデータ） (2025-01-02T00:01:54Z)
Assessment and manipulation of latent constructs in pre-trained language models using psychometric scales [4.805861461250903]
本稿では,標準的な心理アンケートを自然言語推論のプロンプトに再構成する方法を示す。我々は、88種類の公開モデルを用いて、人間のようなメンタルヘルス関連構造の存在を実証した。
論文参考訳（メタデータ） (2024-09-29T11:00:41Z)
Quantifying AI Psychology: A Psychometrics Benchmark for Large Language Models [57.518784855080334]
大きな言語モデル(LLM)は例外的なタスク解決能力を示しており、人間に似た役割を担っている。本稿では,LLMにおける心理学的次元を調査するための枠組みとして,心理学的識別,評価データセットのキュレーション,結果検証による評価について述べる。本研究では,個性,価値観,感情,心の理論,モチベーション,知性の6つの心理学的側面を網羅した総合的心理測定ベンチマークを導入する。
論文参考訳（メタデータ） (2024-06-25T16:09:08Z)
PsychoGAT: A Novel Psychological Measurement Paradigm through Interactive Fiction Games with LLM Agents [68.50571379012621]
心理的な測定は、精神健康、自己理解、そして個人の発達に不可欠である。心理学ゲームAgenT(サイコガト)は、信頼性、収束妥当性、差別的妥当性などの心理学的指標において統計的に有意な卓越性を達成している。
論文参考訳（メタデータ） (2024-02-19T18:00:30Z)
Precision psychiatry: predicting predictability [0.0]
私は精密精神医学の分野での10の課題をレビューします。現実の人口と現実的な臨床結果の定義についての研究が必要である。プラセボ効果や処方薬の非順守などの治療関連因子について検討する。
論文参考訳（メタデータ） (2023-06-21T13:10:46Z)
From Static Benchmarks to Adaptive Testing: Psychometrics in AI Evaluation [60.14902811624433]
本稿では,静的評価手法から適応テストへのパラダイムシフトについて論じる。これには、ベンチマークで各テスト項目の特性と価値を推定し、リアルタイムでアイテムを動的に調整することが含まれる。我々は、AI評価にサイコメトリックを採用する現在のアプローチ、アドバンテージ、そして根底にある理由を分析します。
論文参考訳（メタデータ） (2023-06-18T09:54:33Z)
Concepts and Experiments on Psychoanalysis Driven Computing [0.0]
本研究では,テキストを用いたインタラクティブメディアにおけるヒューマンファクターとユーザ認知の効果的な取り込みについて検討する。我々は、ラカンの談話型の概念を用いて、テキストの実際の特性、品質、内容を捉え、深く理解する。計算手法が精神分析と体系的に組み合わされるのはこれが初めてである。
論文参考訳（メタデータ） (2022-09-29T19:27:22Z)
Interpretability by design using computer vision for behavioral sensing in child and adolescent psychiatry [3.975358343371988]
我々は機械学習を用いて行動規範や金の標準行動評価システムの概念を導出する。私たちの評価は、ネガティブな感情、活動レベル/覚醒、不安に対する人間の専門家評価に匹敵するものでした。
論文参考訳（メタデータ） (2022-07-11T09:07:08Z)
Evaluating and Inducing Personality in Pre-trained Language Models [78.19379997967191]
人間の個性理論を機械行動研究のツールとして活用することで,心理測定研究からインスピレーションを得た。これらの疑問に答えるために,機械の動作を研究するためのMachine Personality Inventory(MPI)ツールを紹介した。 MPIは、ビッグファイブ・パーソナリティ・ファクター(Big Five Personality Factors、ビッグファイブ・パーソナリティ・ファクター)理論とパーソナリティ評価在庫に基づく標準化されたパーソナリティ・テストに従う。パーソナリティ・プロンプト法(P2法)を考案し、特定のパーソナリティを持つLSMを制御可能な方法で誘導する。
論文参考訳（メタデータ） (2022-05-20T07:32:57Z)
AGENT: A Benchmark for Core Psychological Reasoning [60.35621718321559]
直観心理学は、観察可能な行動を駆動する隠された精神変数を推論する能力です。他のエージェントを推論する機械エージェントに対する近年の関心にもかかわらず、そのようなエージェントが人間の推論を駆動するコア心理学の原則を学ぶか保持するかは明らかではない。本稿では,プロシージャが生成する3dアニメーション,エージェントを4つのシナリオで構成したベンチマークを提案する。
論文参考訳（メタデータ） (2021-02-24T14:58:23Z)
Opportunities of a Machine Learning-based Decision Support System for Stroke Rehabilitation Assessment [64.52563354823711]
リハビリテーションアセスメントは、患者の適切な介入を決定するために重要である。現在の評価の実践は、主にセラピストの経験に依存しており、セラピストの可用性が限られているため、アセスメントは頻繁に実施される。我々は、強化学習を用いて評価の健全な特徴を識別できるインテリジェントな意思決定支援システムを開発した。
論文参考訳（メタデータ） (2020-02-27T17:04:07Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。