論文の概要: Projective Psychological Assessment of Large Multimodal Models Using Thematic Apperception Tests
- arxiv url: http://arxiv.org/abs/2602.17108v1
- Date: Thu, 19 Feb 2026 06:08:33 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-02-20 15:21:28.721118
- Title: Projective Psychological Assessment of Large Multimodal Models Using Thematic Apperception Tests
- Title(参考訳): 主題認識テストを用いた大規模マルチモーダルモデルの投影心理学的評価
- Authors: Anton Dzega, Aviad Elyashar, Ortal Slobodin, Odeya Cohen, Rami Puzis,
- Abstract要約: 本研究では,LMM(Large Multimodal Models)の性格特性が,非言語的モダリティによって評価できるかどうかを検討する。
評価者は、TAT応答を理解し分析する優れた能力を示した。
- 参考スコア(独自算出の注目度): 5.119837168333715
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Thematic Apperception Test (TAT) is a psychometrically grounded, multidimensional assessment framework that systematically differentiates between cognitive-representational and affective-relational components of personality-like functioning. This test is a projective psychological framework designed to uncover unconscious aspects of personality. This study examines whether the personality traits of Large Multimodal Models (LMMs) can be assessed through non-language-based modalities, using the Social Cognition and Object Relations Scale - Global (SCORS-G). LMMs are employed in two distinct roles: as subject models (SMs), which generate stories in response to TAT images, and as evaluator models (EMs), who assess these narratives using the SCORS-G framework. Evaluators demonstrated an excellent ability to understand and analyze TAT responses. Their interpretations are highly consistent with those of human experts. Assessment results highlight that all models understand interpersonal dynamics very well and have a good grasp of the concept of self. However, they consistently fail to perceive and regulate aggression. Performance varied systematically across model families, with larger and more recent models consistently outperforming smaller and earlier ones across SCORS-G dimensions.
- Abstract(参考訳): Thematic Apperception Test (TAT) は、認知的・表現的・感情的・関係的要素を体系的に区別する心理学的基礎を持つ多次元評価フレームワークである。
このテストは、無意識の個性の側面を明らかにするために設計された投影心理学的枠組みである。
本研究では,社会認知・対象関係尺度(SCORS-G)を用いて,LMM(Large Multimodal Models)の性格特性を非言語的モダリティによって評価できるかどうかを検討する。
LMMは、主題モデル(SM)と、これらの物語をSCORS-Gフレームワークを用いて評価する評価モデル(EM)の2つの異なる役割で採用されている。
評価者は、TAT応答を理解し分析する優れた能力を示した。
彼らの解釈は、人間の専門家の解釈と非常に一致している。
評価結果は、すべてのモデルが対人関係のダイナミクスを非常によく理解し、自己の概念を十分に把握していることを強調している。
しかし、彼らは常に攻撃を察知し、規制することに失敗している。
モデルファミリ間では系統的に性能が変化し、より大規模で最近のモデルはSCORS-G次元においてより小さく、より古いモデルよりも一貫して優れていた。
関連論文リスト
- HUMANLLM: Benchmarking and Reinforcing LLM Anthropomorphism via Human Cognitive Patterns [59.17423586203706]
本稿では,心理的パターンを因果力の相互作用として扱うフレームワークであるHUMANLLMを提案する。
12,000の学術論文から244のパターンを構築し、2-5のパターンが相互に強化、衝突、変調されるシナリオ11,359を合成する。
我々の二重レベルチェックリストは、個々のパターンの忠実度と創発的なマルチパターンのダイナミクスを評価し、強い人間のアライメントを達成する。
論文 参考訳(メタデータ) (2026-01-15T08:56:53Z) - From Visual Perception to Deep Empathy: An Automated Assessment Framework for House-Tree-Person Drawings Using Multimodal LLMs and Multi-Agent Collaboration [18.359999860873426]
1948年にジョン・バックによって導入されたハウス・トレー・パーソンの描画テストは、臨床心理学において広く使われている射影技術である。
異種スコアリング基準、試験員の主観的経験への依存、統一的な定量的コーディングシステムがないといった課題に長年直面してきた。
役割を分割することで、心理的推論から特徴認識を分離し、デジタルメンタルヘルスサービスのための新しいパラダイムを提供するマルチエージェントフレームワークを提案する。
論文 参考訳(メタデータ) (2025-12-23T09:26:23Z) - Exploring a Gamified Personality Assessment Method through Interaction with LLM Agents Embodying Different Personalities [45.56431615835303]
本研究では,個性表現の多元性に着目し,個性評価のための対話的アプローチについて検討する。
マルチパーソナリティ表現(Multi-PR GPA)を用いたゲーミフィケーション・パーソナリティ・アセスメントの枠組みを提案する。
論文 参考訳(メタデータ) (2025-07-05T11:17:20Z) - Measuring How LLMs Internalize Human Psychological Concepts: A preliminary analysis [0.0]
本研究では,大規模言語モデルと人間の心理的次元間の概念整合性を評価する枠組みを開発する。
GPT-4モデルは優れた分類精度(66.2%)を獲得し、GPT-3.5(55.9%)とBERT(48.1%)を大きく上回った。
以上の結果から,現代のLLMは人間の心理的構造を計測可能な精度で近似できることが示された。
論文 参考訳(メタデータ) (2025-06-29T01:56:56Z) - Beyond Self-Reports: Multi-Observer Agents for Personality Assessment in Large Language Models [2.7010154811483167]
本稿では,LLMエージェントの性格特性評価のための新しいマルチ・オブザーバ・フレームワークを提案する。
自己評価に頼る代わりに、複数のオブザーバエージェントを採用する。
これらの評価は従来の自己評価よりも人間の判断と密接に一致していることを示す。
論文 参考訳(メタデータ) (2025-04-11T10:03:55Z) - PersLLM: A Personified Training Approach for Large Language Models [66.16513246245401]
データ構築とモデルチューニングを改善するためのフレームワークPersLLMを提案する。
データ利用が不十分な場合には、Chain-of-Thoughtプロンプトやアンチインダクションといった戦略を取り入れます。
厳密な振舞いパターンを設計し,モデルの性格の特異性とダイナミズムを高めるために自動DPOを導入する。
論文 参考訳(メタデータ) (2024-07-17T08:13:22Z) - Evaluating Large Language Models with Psychometrics [59.821829073478376]
本稿では,Large Language Models (LLMs) の心理的構造を定量化するための総合的ベンチマークを提案する。
私たちの研究は、13のデータセットで評価された5つの重要な心理的構成要素、人格、価値観、感情的知性、心の理論、自己効力性を特定します。
LLMの自己報告特性と実際のシナリオにおける応答パターンとの間に大きな相違が発見され,その挙動の複雑さが明らかになった。
論文 参考訳(メタデータ) (2024-06-25T16:09:08Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。