論文の概要: Evidence of Cognitive Deficits andDevelopmental Advances in Generative AI: A Clock Drawing Test Analysis
- arxiv url: http://arxiv.org/abs/2410.11756v1
- Date: Tue, 15 Oct 2024 16:27:22 GMT
- ステータス: 翻訳完了
- システム内更新日: 2024-10-16 14:02:29.112239
- Title: Evidence of Cognitive Deficits andDevelopmental Advances in Generative AI: A Clock Drawing Test Analysis
- Title(参考訳): 認知的欠陥のエビデンスと生成AIの進歩--クロック描画テスト分析
- Authors: Isaac R. Galatzer-Levy, Jed McGiffin, David Munday, Xin Liu, Danny Karmon, Ilia Labzovsky, Rivka Moroshko, Amir Zait, Daniel McDuff,
- Abstract要約: 本研究は, 視覚空間計画と組織に関する神経心理学的評価である, Clock Drawing Test (CDT) において, いくつかのGenAIモデルがどのように機能するかを考察する。
モデルは時計のような図面を作成するが、正確な時間表現に苦慮し、軽度に重症な認知障害に似た欠陥を示す。
- 参考スコア(独自算出の注目度): 17.5336703613751
- License:
- Abstract: Generative AI's rapid advancement sparks interest in its cognitive abilities, especially given its capacity for tasks like language understanding and code generation. This study explores how several recent GenAI models perform on the Clock Drawing Test (CDT), a neuropsychological assessment of visuospatial planning and organization. While models create clock-like drawings, they struggle with accurate time representation, showing deficits similar to mild-severe cognitive impairment (Wechsler, 2009). Errors include numerical sequencing issues, incorrect clock times, and irrelevant additions, despite accurate rendering of clock features. Only GPT 4 Turbo and Gemini Pro 1.5 produced the correct time, scoring like healthy individuals (4/4). A follow-up clock-reading test revealed only Sonnet 3.5 succeeded, suggesting drawing deficits stem from difficulty with numerical concepts. These findings may reflect weaknesses in visual-spatial understanding, working memory, or calculation, highlighting strengths in learned knowledge but weaknesses in reasoning. Comparing human and machine performance is crucial for understanding AI's cognitive capabilities and guiding development toward human-like cognitive functions.
- Abstract(参考訳): 生成AIの急速な進歩は、特に言語理解やコード生成といったタスクの能力を考えると、その認知能力への関心を喚起する。
本研究は, 視覚空間計画と組織に関する神経心理学的評価である, Clock Drawing Test (CDT) において, いくつかのGenAIモデルがどのように機能するかを考察する。
モデルは時計のような図面を作成するが、正確な時間表現に苦慮し、軽度に重症な認知障害に似た欠陥を示す(Wechsler, 2009)。
エラーには、数値的なシークエンシングの問題、不正なクロック時間、正確なクロック特性のレンダリングにもかかわらず無関係な追加が含まれている。
GPT 4 Turbo と Gemini Pro 1.5 のみが、健康な人(4/4)と同様のスコアで正しい時間を生成した。
追従試験の結果、ソネット3.5のみが成功し、数値的な概念の難しさによる欠点が示唆された。
これらの発見は、視覚的空間的理解、作業記憶、計算の弱点を反映し、学習知識の強みと推論の弱さを強調させる。
人間と機械のパフォーマンスを比較することは、AIの認知能力を理解し、人間のような認知機能に向けた開発を導くために重要である。
関連論文リスト
- Auto Detecting Cognitive Events Using Machine Learning on Pupillary Data [0.0]
瞳孔の大きさは認知作業負荷の貴重な指標であり、自律神経系によって支配される注意の変化と覚醒を反映している。
本研究では、機械学習を用いて個人が経験した認知イベントを自動的に検出する可能性について検討する。
論文 参考訳(メタデータ) (2024-10-18T04:54:46Z) - Metacognitive Monitoring: A Human Ability Beyond Generative Artificial Intelligence [0.0]
大規模言語モデル(LLM)は、人間の認知過程と顕著に一致している。
本研究は,ChatGPTがヒトに類似したメタ認知モニタリング能力を持っているかを検討する。
論文 参考訳(メタデータ) (2024-10-17T09:42:30Z) - Visual Agents as Fast and Slow Thinkers [88.6691504568041]
本稿では、Fast and Slow Thinking機構を視覚エージェントに組み込んだFaSTを紹介する。
FaSTは、システム1/2モード間の動的選択にスイッチアダプタを使用する。
モデルの信頼性を調整し、新しいコンテキストデータを統合することで、不確実で目に見えないオブジェクトに取り組む。
論文 参考訳(メタデータ) (2024-08-16T17:44:02Z) - The Generative AI Paradox: "What It Can Create, It May Not Understand" [81.89252713236746]
生成AIの最近の波は、潜在的に超人的な人工知能レベルに対する興奮と懸念を引き起こしている。
同時に、モデルは、専門家でない人でも期待できないような理解の基本的な誤りを示している。
一見超人的な能力と、ごく少数の人間が起こすエラーの持続性を、どうやって再現すればよいのか?
論文 参考訳(メタデータ) (2023-10-31T18:07:07Z) - Empowering Psychotherapy with Large Language Models: Cognitive
Distortion Detection through Diagnosis of Thought Prompting [82.64015366154884]
本研究では,認知的歪み検出の課題について検討し,思考の早期発見(DoT)を提案する。
DoTは、事実と思考を分離するための主観的評価、思考と矛盾する推論プロセスを引き出すための対照的な推論、認知スキーマを要約するスキーマ分析という3つの段階を通して、患者のスピーチの診断を行う。
実験により、DoTは認知的歪み検出のためのChatGPTよりも大幅に改善され、一方で人間の専門家が承認した高品質な合理性を生成することが示された。
論文 参考訳(メタデータ) (2023-10-11T02:47:21Z) - Incremental procedural and sensorimotor learning in cognitive humanoid
robots [52.77024349608834]
本研究は,手順を段階的に学習する認知エージェントを提案する。
各サブステージで必要とされる認知機能と, エージェントが未解決の課題に, 新たな機能の追加がどう対処するかを示す。
結果は、このアプローチが複雑なタスクを段階的に解くことができることを示している。
論文 参考訳(メタデータ) (2023-04-30T22:51:31Z) - Mind meets machine: Unravelling GPT-4's cognitive psychology [0.7302002320865727]
大規模言語モデル(LLM)は、人間レベルのタスクを実行する能力がますます高まっている強力なツールとして出現している。
本研究は,CommonsenseQA, SuperGLUE, MATH, HANSなどのデータセットにおけるGPT-4の性能評価に焦点を当てた。
GPT-4は,従来の最先端モデルと比較して認知心理学的タスクにおいて高い精度を示すことを示す。
論文 参考訳(メタデータ) (2023-03-20T20:28:26Z) - CogAlign: Learning to Align Textual Neural Representations to Cognitive
Language Processing Signals [60.921888445317705]
自然言語処理モデルに認知言語処理信号を統合するためのCogAlignアプローチを提案する。
我々は、CogAlignが、パブリックデータセット上の最先端モデルよりも、複数の認知機能で大幅な改善を実現していることを示す。
論文 参考訳(メタデータ) (2021-06-10T07:10:25Z) - Bongard-LOGO: A New Benchmark for Human-Level Concept Learning and
Reasoning [78.13740873213223]
ボナード問題(BP)は、インテリジェントシステムにおける視覚認知へのインスピレーションとして導入された。
我々は人間レベルの概念学習と推論のための新しいベンチマークBongard-LOGOを提案する。
論文 参考訳(メタデータ) (2020-10-02T03:19:46Z) - Time Perception: A Review on Psychological, Computational and Robotic
Models [2.223733768286313]
本稿では,心理学と神経科学の文献から,時間知覚の特徴とモデルについて紹介する。
時間知覚の創発的な計算モデルとロボットモデルについて要約する。
ほとんどのタイミングモデルは、感覚のタイミング(例えば、間隔を評価する能力)または運動のタイミング(すなわち、間隔を再現する能力)のために開発される。
論文 参考訳(メタデータ) (2020-07-23T08:16:47Z) - Visualizing and Understanding Vision System [0.6510507449705342]
視覚認識再構成ネットワーク (RRN) を用いて, 発達, 認識, 学習, 忘れるメカニズムについて検討する。
数値認識研究では、RRNが様々な視聴条件下でオブジェクト不変性表現を維持できるのを目撃する。
学習・忘れ研究において、本来のシナプス接続のパターン特異性を保ちつつ、全シナプスを低等級に調整することで、新規な構造認識を行う。
論文 参考訳(メタデータ) (2020-06-11T07:08:49Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。