論文の概要: ALIGNS: Unlocking nomological networks in psychological measurement through a large language model
- arxiv url: http://arxiv.org/abs/2509.09723v1
- Date: Wed, 10 Sep 2025 04:21:02 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-09-15 16:03:07.852316
- Title: ALIGNS: Unlocking nomological networks in psychological measurement through a large language model
- Title(参考訳): ALIGNS:大規模言語モデルによる心理学的計測におけるノモロジーネットワークのアンロック
- Authors: Kai R. Larsen, Sen Yan, Roland Müller, Lan Sang, Mikko Rönkkö, Ravi Starzl, Donald Edmondson,
- Abstract要約: 本稿では,評価されたアンケート尺度を訓練した大規模言語モデルベースシステム,ALIGNS の生成のための潜時指標分析について紹介する。
ALIGNSは心理学、医学、社会政策、その他の分野にまたがる550,000以上の指標を含む3つの包括的なノモロジーネットワークを提供している。
これは、測定バリデーションにおける基礎的な問題を解決するために、大きな言語モデルの最初の応用である。
- 参考スコア(独自算出の注目度): 0.9696659544494058
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Psychological measurement is critical to many disciplines. Despite advances in measurement, building nomological networks, theoretical maps of how concepts and measures relate to establish validity, remains a challenge 70 years after Cronbach and Meehl proposed them as fundamental to validation. This limitation has practical consequences: clinical trials may fail to detect treatment effects, and public policy may target the wrong outcomes. We introduce Analysis of Latent Indicators to Generate Nomological Structures (ALIGNS), a large language model-based system trained with validated questionnaire measures. ALIGNS provides three comprehensive nomological networks containing over 550,000 indicators across psychology, medicine, social policy, and other fields. This represents the first application of large language models to solve a foundational problem in measurement validation. We report classification accuracy tests used to develop the model, as well as three evaluations. In the first evaluation, the widely used NIH PROMIS anxiety and depression instruments are shown to converge into a single dimension of emotional distress. The second evaluation examines child temperament measures and identifies four potential dimensions not captured by current frameworks, and questions one existing dimension. The third evaluation, an applicability check, engages expert psychometricians who assess the system's importance, accessibility, and suitability. ALIGNS is freely available at nomologicalnetwork.org, complementing traditional validation methods with large-scale nomological analysis.
- Abstract(参考訳): 心理学的な測定は多くの分野において重要である。
ノモロジーネットワークの構築、概念と測度がどのように妥当性を確立するかの理論地図は、測定の進歩にもかかわらず、クロンバッハとミールが検証の基礎として提案してから70年が経過した今も挑戦である。
この制限は実際的な結果をもたらし、臨床試験は治療効果の検出に失敗し、公共政策は間違った結果を狙う可能性がある。
本稿では,評価されたアンケート尺度を訓練した大規模言語モデルベースシステム,ALIGNS の生成のための潜時指標分析について紹介する。
ALIGNSは心理学、医学、社会政策、その他の分野にまたがる550,000以上の指標を含む3つの包括的なノモロジーネットワークを提供している。
これは、測定バリデーションにおける基礎的な問題を解決するために、大きな言語モデルの最初の応用である。
本モデルの開発に使用した分類精度試験と3つの評価結果について報告する。
最初の評価では、広く使われているNIH PROMIS不安と抑うつ器は、単一の感情的苦痛の次元に収束することが示されている。
第2の評価では、子どもの気質測定を検証し、現在の枠組みで捉えていない4つの潜在的次元を特定し、既存の次元に疑問を投げかける。
3つ目の評価は、適用性チェックであり、システムの重要性、アクセシビリティ、適合性を評価する専門家の心理測定士を雇う。
ALIGNSはnomologicalnetwork.orgで無料で利用可能であり、従来のバリデーション手法と大規模なノモロジー解析を補完する。
関連論文リスト
- AI Models for Depressive Disorder Detection and Diagnosis: A Review [0.9012198585960441]
うつ病性障害は世界中で障害の原因の1つとなっているが、診断は主観的臨床評価に大きく依存している。
本稿では,55の鍵研究の体系的レビューに基づいて,最先端のAI手法の発見と診断に関する包括的調査を行う。
論文 参考訳(メタデータ) (2025-08-16T11:46:48Z) - Medical Reasoning in the Era of LLMs: A Systematic Review of Enhancement Techniques and Applications [59.721265428780946]
医学における大きな言語モデル(LLM)は印象的な能力を実現しているが、体系的で透明で検証可能な推論を行う能力に重大なギャップが残っている。
本稿は、この新興分野に関する最初の体系的なレビューを提供する。
本稿では,学習時間戦略とテスト時間メカニズムに分類した推論強化手法の分類法を提案する。
論文 参考訳(メタデータ) (2025-08-01T14:41:31Z) - A validity-guided workflow for robust large language model research in psychology [0.0]
大規模言語モデル(LLM)は、研究ツール、評価対象、人間のシミュレータ、認知モデルとして、心理学研究に急速に統合されている。
これらの「測定幻覚」は、統計的成果を心理学的現象として生み出すもので、成長する研究機関の妥当性を損なうものである。
精神測定と因果推論を統合した二重正当性フレームワークによって導かれた6段階のワークフローで、妥当性要件を研究野心に拡張する。
論文 参考訳(メタデータ) (2025-07-06T18:06:12Z) - From Prompts to Constructs: A Dual-Validity Framework for LLM Research in Psychology [0.0]
我々は、AI心理学の堅牢な科学を構築するには、信頼度測定の原則と音因推論の標準を統合する必要があると論じる。
我々は、この統合を導くための二重正当性フレームワークを提案し、このフレームワークは、主張を支持するために必要な証拠が、その科学的野心によってどのようにスケールするかを明確にする。
論文 参考訳(メタデータ) (2025-06-20T02:38:42Z) - Measuring Mental Health Variables in Computational Research: Toward Validated, Dimensional, and Transdiagnostic Approaches [6.796386356785538]
コンピュータメンタルヘルス研究は、心理学的現象を予測し理解するためのモデルを開発するが、しばしば精神病理学的構成の不適切な尺度に依存する。
本研究は,(1)検証対象よりも不確定な尺度に依存すること,(2)精神保健施設を次元ではなくカテゴリーとして扱うこと,(3)診断対象以外の障害特異的施設に焦点をあてること,の3つの主要な課題を同定する。
論文 参考訳(メタデータ) (2025-04-04T21:11:41Z) - Evaluating Generative AI Systems is a Social Science Measurement Challenge [78.35388859345056]
我々は,GenAIシステムの能力,影響,機会,リスクに関連する概念を測定するための枠組みを提案する。
このフレームワークは、背景概念、体系化された概念、測定器、インスタンスレベルの測定そのものの4つのレベルを区別する。
論文 参考訳(メタデータ) (2024-11-17T02:35:30Z) - Long-Range Biometric Identification in Real World Scenarios: A Comprehensive Evaluation Framework Based on Missions [11.557368031775717]
本稿では,高度・範囲の個人を特定するための研究ソリューションについて検討する。
顔と身体の特徴を融合させることにより,有効な長距離識別のための堅牢な生体計測システムの開発を提案する。
論文 参考訳(メタデータ) (2024-09-03T02:17:36Z) - Geometric Deep Learning for Structure-Based Drug Design: A Survey [83.87489798671155]
構造に基づく薬物設計(SBDD)は、タンパク質の3次元幾何学を利用して、潜在的な薬物候補を特定する。
近年の幾何学的深層学習の進歩は、3次元幾何学的データを効果的に統合・処理し、この分野を前進させてきた。
論文 参考訳(メタデータ) (2023-06-20T14:21:58Z) - Position: AI Evaluation Should Learn from How We Test Humans [65.36614996495983]
人間の評価のための20世紀起源の理論である心理測定は、今日のAI評価における課題に対する強力な解決策になり得る、と我々は主張する。
論文 参考訳(メタデータ) (2023-06-18T09:54:33Z) - Affect Analysis in-the-wild: Valence-Arousal, Expressions, Action Units
and a Unified Framework [83.21732533130846]
Aff-Wild と Aff-Wild2 の2つである。
これは、これらのデータベースで訓練された深層ニューラルネットワークの2つのクラスの設計を示す。
インパクト認識を共同で学び、効果的に一般化し、実行することができる新しいマルチタスクおよび全体主義のフレームワークが提示されます。
論文 参考訳(メタデータ) (2021-03-29T17:36:20Z) - Pose-based Body Language Recognition for Emotion and Psychiatric Symptom
Interpretation [75.3147962600095]
通常のRGBビデオから始まるボディーランゲージに基づく感情認識のための自動フレームワークを提案する。
心理学者との連携により,精神症状予測の枠組みを拡張した。
提案されたフレームワークの特定のアプリケーションドメインは限られた量のデータしか供給しないため、フレームワークは小さなトレーニングセットで動作するように設計されている。
論文 参考訳(メタデータ) (2020-10-30T18:45:16Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。