論文の概要: Modeling Multi-Dimensional Cognitive States in Large Language Models under Cognitive Crowding
- arxiv url: http://arxiv.org/abs/2604.17174v1
- Date: Sun, 19 Apr 2026 00:08:35 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-04-21 21:52:52.368752
- Title: Modeling Multi-Dimensional Cognitive States in Large Language Models under Cognitive Crowding
- Title(参考訳): 認知的群集下における大規模言語モデルにおける多次元認知状態のモデル化
- Authors: Lin Zhong, Siyu Zhu, Zizhen Yuan, Jinhao Cui, Xinyang Zhao, Lingzhi Wang, Hao Chen, Qing Liao,
- Abstract要約: 既存の大規模言語モデル(LLM)は、主に独立したタスクに対処する。
上記の4次元にわたる統一アノテーションを備えた最初のベンチマークであるCognitiveBenchを構築した。
その結果,HyCoLLMは多次元認知理解を大幅に改善し,8Bパラメータモデルが強いベースラインを上回ることを示す。
- 参考スコア(独自算出の注目度): 15.343689055331028
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Modeling human cognitive states is essential for advanced artificial intelligence. Existing Large Language Models (LLMs) mainly address isolated tasks such as emotion analysis or stance detection, and fail to capture interactions among cognitive dimensions defined in psychology, including emotion, thinking style, stance, and intention. To bridge this gap, we construct CognitiveBench, the first benchmark with unified annotations across the above four dimensions. Experiments on CognitiveBench show that although LLMs perform well on single dimension tasks, their performance drops sharply in joint multi-dimensional modeling. Using Gromov $δ$-hyperbolicity analysis, we find that CognitiveBench exhibits a strong hierarchical structure. We attribute the performance bottleneck to ``Cognitive Crowding'', where hierarchical cognitive states require exponential representational space, while the Euclidean space of LLMs grows only polynomially, causing representation overlap and degraded performance. To address this mismatch, we propose HyCoLLM, which models cognitive states in hyperbolic space and aligns LLM representations via Hyperbolic Guided Alignment Tuning. Results show that HyCoLLM substantially improves multi-dimensional cognitive understanding, allowing 8B parameter model to outperform strong baselines, including GPT-4o.
- Abstract(参考訳): 人間の認知状態をモデル化することは高度な人工知能にとって不可欠である。
既存の大規模言語モデル(LLM)は主に感情分析や姿勢検出のような孤立したタスクに対処し、感情、思考スタイル、姿勢、意図を含む心理学で定義された認知的次元間の相互作用を捉えない。
このギャップを埋めるために、上記の4次元にわたる統一アノテーションを備えた最初のベンチマークであるCognitiveBenchを構築します。
CognitiveBenchの実験では、LLMは単一次元のタスクでうまく機能するが、その性能は共同多次元モデリングにおいて急激に低下する。
Gromov $δ$-hyperbolicity解析を用いて、CognitiveBenchは強い階層構造を示す。
階層的認知状態は指数的表現空間を必要とするが、LLMのユークリッド空間は多項式的にのみ成長し、表現重なりと劣化性能をもたらす。
このミスマッチに対処するため,HyCoLLMを提案する。
その結果,HyCoLLMは多次元認知理解を著しく改善し,GPT-4oを含む8Bパラメータモデルが強いベースラインより優れていることがわかった。
関連論文リスト
- Mechanistic Decoding of Cognitive Constructs in LLMs [0.0]
本稿では,表現工学に基づく認知的リバースエンジニアリングフレームワークを提案する。
評価理論を部分空間化、回帰に基づく重み付け、双方向因果操りと組み合わせることで、2つの心理学的先駆者(妬み)を分離・定量化する。
また, 有害な情動状態が機械的に検出され, 外科的に抑制される可能性を示し, マルチエージェント環境におけるAIの安全性に対する表現的モニタリングと介入への道のりが示唆された。
論文 参考訳(メタデータ) (2026-04-16T03:54:03Z) - Toward Cognitive Supersensing in Multimodal Large Language Model [67.15559571626747]
我々は,MLLMに人間のような視覚的特徴を付与する訓練パラダイムであるCognitive Supersensingを紹介する。
実験では、CogSense-BenchでCognitive Supersensingを訓練したMLLMが、最先端のベースラインを大きく上回った。
私たちはCogSense-Benchとモデルウェイトをオープンソースにします。
論文 参考訳(メタデータ) (2026-02-02T02:19:50Z) - UniCog: Uncovering Cognitive Abilities of LLMs through Latent Mind Space Analysis [69.50752734049985]
成長する研究機関は、大きな言語モデル(LLM)の認知過程が人間のものと根本的に異なることを示唆している。
潜在心空間を介してLLM認知を分析する統一フレームワークUniCogを提案する。
論文 参考訳(メタデータ) (2026-01-25T16:19:00Z) - HUMANLLM: Benchmarking and Reinforcing LLM Anthropomorphism via Human Cognitive Patterns [59.17423586203706]
本稿では,心理的パターンを因果力の相互作用として扱うフレームワークであるHUMANLLMを提案する。
12,000の学術論文から244のパターンを構築し、2-5のパターンが相互に強化、衝突、変調されるシナリオ11,359を合成する。
我々の二重レベルチェックリストは、個々のパターンの忠実度と創発的なマルチパターンのダイナミクスを評価し、強い人間のアライメントを達成する。
論文 参考訳(メタデータ) (2026-01-15T08:56:53Z) - Cognitive Foundations for Reasoning and Their Manifestation in LLMs [63.12951576410617]
大規模言語モデル(LLM)は複雑な問題を解くが、単純な変種では失敗し、人間の推論と根本的に異なるメカニズムによって正しい出力を達成することを示唆している。
我々は認知科学研究を、推論不変量、メタ認知制御、推論と知識の組織化のための表現、変換操作にまたがる28の認知要素の分類学に合成する。
複雑な問題に対して66.7%の性能向上を図り、成功構造を自動的に把握するテストタイム推論ガイダンスを開発した。
論文 参考訳(メタデータ) (2025-11-20T18:59:00Z) - 11Plus-Bench: Demystifying Multimodal LLM Spatial Reasoning with Cognitive-Inspired Analysis [54.24689751375923]
本研究では,最先端MLLMの空間的推論能力を評価するためのシステム評価フレームワークを提案する。
14個のMLLMの実験と人間の評価により、現在のMLLMは空間認知の早期の兆候を示すことが明らかとなった。
これらの知見は,現在のMLLMの空間的推論能力の出現能力と限界の両方を浮き彫りにしている。
論文 参考訳(メタデータ) (2025-08-27T17:22:34Z) - Human Cognitive Benchmarks Reveal Foundational Visual Gaps in MLLMs [65.93003087656754]
VisFactorは、よく確立された認知心理学評価から20の視覚中心のサブテストをデジタル化するベンチマークである。
GPT、Gemini、Claude、LLaMA、Qwen、SEEDファミリーから20のフロンティアマルチモーダル言語モデル(MLLM)を評価する。
最高のパフォーマンスモデルは100点中25.19点のスコアしか得られず、精神的な回転、空間的関係推論、図形の識別といったタスクに一貫して失敗する。
論文 参考訳(メタデータ) (2025-02-23T04:21:32Z) - Unlocking Structured Thinking in Language Models with Cognitive Prompting [0.0]
大規模言語モデル(LLM)における問題解決を導く新しいアプローチとして認知的プロンプトを提案する。
本稿では,認知操作の決定論的シーケンス,自己適応型,ハイブリッド型という3つの変種を紹介する。
LLaMA, Gemma2, Qwenの各モデルの算術的推論ベンチマークGSM8Kにおける実験により、認知的プロンプトは標準的な質問応答に比べて性能が大幅に向上することが示された。
論文 参考訳(メタデータ) (2024-10-03T19:53:47Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。