論文の概要: Computer Vision Modeling of the Development of Geometric and Numerical Concepts in Humans
- arxiv url: http://arxiv.org/abs/2511.15029v1
- Date: Wed, 19 Nov 2025 01:50:35 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-11-20 15:51:28.588331
- Title: Computer Vision Modeling of the Development of Geometric and Numerical Concepts in Humans
- Title(参考訳): 人体における幾何学的・数値的概念の発達に関するコンピュータビジョンモデリング
- Authors: Zekun Wang, Sashank Varma,
- Abstract要約: コンピュータビジョンモデルは,大人と同様の幾何学的,数値的概念の潜在表現を学習する。
数の場合,経験を伴う人間の心的数列の表現の出現に,発達的アライメントが現れる。
- 参考スコア(独自算出の注目度): 4.874217616308983
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Mathematical thinking is a fundamental aspect of human cognition. Cognitive scientists have investigated the mechanisms that underlie our ability to thinking geometrically and numerically, to take two prominent examples, and developmental scientists have documented the trajectories of these abilities over the lifespan. Prior research has shown that computer vision (CV) models trained on the unrelated task of image classification nevertheless learn latent representations of geometric and numerical concepts similar to those of adults. Building on this demonstrated cognitive alignment, the current study investigates whether CV models also show developmental alignment: whether their performance improvements across training to match the developmental progressions observed in children. In a detailed case study of the ResNet-50 model, we show that this is the case. For the case of geometry and topology, we find developmental alignment for some classes of concepts (Euclidean Geometry, Geometrical Figures, Metric Properties, Topology) but not others (Chiral Figures, Geometric Transformations, Symmetrical Figures). For the case of number, we find developmental alignment in the emergence of a human-like ``mental number line'' representation with experience. These findings show the promise of computer vision models for understanding the development of mathematical understanding in humans. They point the way to future research exploring additional model architectures and building larger benchmarks.
- Abstract(参考訳): 数学的思考は人間の認知の基本的な側面である。
認知科学者は、幾何学的および数値的に考える能力の基盤となるメカニズムを調査し、2つの顕著な例を取り、発達科学者は、これらの能力の寿命に関する軌跡を文書化した。
従来の研究では、コンピュータビジョン(CV)モデルは、画像分類の非関係なタスクに基づいて訓練されているが、それでも、大人と同様の幾何学的および数値的概念の潜在表現を学習している。
本研究は, CVモデルが発達的アライメント(発達的アライメント, 発達的アライメント, 発達的アライメント, 発達的アライメント, 発達的アライメント, 発達的アライメント, 発達的アライメント)を示すかを検討した。
ResNet-50モデルの詳細なケーススタディでは、これがそうであることを示す。
幾何学やトポロジーの場合、いくつかの概念のクラス(ユークリッド幾何学、幾何学的図形、計量的性質、位相)の発達的アライメントが見つかるが、他のクラス(光学的図形、幾何学的変換、対称的図形)は見つからない。
数の場合,人間のような「数行」表現の出現に,経験を伴う発達的アライメントが現れる。
これらの結果は、人間の数学的理解の発達を理解するためのコンピュータビジョンモデルの可能性を示唆している。
彼らは、将来の研究で追加のモデルアーキテクチャを探求し、より大きなベンチマークを構築する方法を示している。
関連論文リスト
- Computer Vision Models Show Human-Like Sensitivity to Geometric and Topological Concepts [1.935452308279137]
コンピュータビジョンモデルと幾何学的・トポロジカル(GT)概念に対する人間の感度について検討する。
私たちは、大規模な画像データセットに基づいてトレーニングされたコンピュータビジョンモデルを使用します。
トランスフォーマーベースのモデルは、幼児よりも高い総合的精度を達成する。
論文 参考訳(メタデータ) (2025-05-19T16:04:53Z) - Geometric Origins of Bias in Deep Neural Networks: A Human Visual System Perspective [1.7315645623674356]
ディープニューラルネットワーク(DNN)におけるバイアス形成は、依然として批判的だが理解されていない課題である。
人間の視覚システムに触発されて,クラス固有の知覚マニフォールドの幾何学的複雑さをモデルバイアスに結びつける幾何学的分析フレームワークを提案する。
この解析を支援するために,知覚多様体の幾何学的性質を計算するために設計された知覚多様体幾何学ライブラリを提案する。
論文 参考訳(メタデータ) (2025-02-17T13:54:02Z) - Human-Centric Foundation Models: Perception, Generation and Agentic Modeling [79.97999901785772]
人間中心のファンデーションモデルは、多様な人間中心のタスクを単一のフレームワークに統合します。
我々は,現在のアプローチを4つのグループに分類する分類法を提案することで,HcFMの包括的概要を示す。
この調査は、より堅牢で汎用的でインテリジェントなデジタルヒューマン・エンボディメントモデリングを目指す研究者や実践者のロードマップとして機能することを目的としている。
論文 参考訳(メタデータ) (2025-02-12T16:38:40Z) - Generative Physical AI in Vision: A Survey [78.07014292304373]
遺伝子人工知能(AI)は、コンピュータビジョンの分野を急速に進歩させ、機械が前例のない高度なビジュアルデータを作成し、解釈できるようにする。
この変換は、現実的な画像、ビデオ、および3D/4Dコンテンツを生成するための生成モデルの基礎の上に構築されている。
生成モデルが進化して物理リアリズムと動的シミュレーションを統合するにつれ、「世界シミュレータ」として機能する可能性が拡大する。
論文 参考訳(メタデータ) (2025-01-19T03:19:47Z) - A Survey of Geometric Graph Neural Networks: Data Structures, Models and Applications [71.809127869349]
本稿では、幾何学的メッセージパッシングの観点から、既存のモデルの統一的なビューを提供するデータ構造として幾何学的グラフを定式化する。
また、方法論開発と実験評価の後の研究を促進するために、アプリケーションと関連するデータセットを要約する。
論文 参考訳(メタデータ) (2024-03-01T12:13:04Z) - Human-Like Geometric Abstraction in Large Pre-trained Neural Networks [6.650735854030166]
幾何学的視覚処理の認知科学における経験的結果を再考する。
幾何学的視覚処理における3つの重要なバイアスを同定する。
我々は、人間のバイアスを調査する文献からタスクをテストし、AIで使用される大規模なトレーニング済みニューラルネットワークモデルにより、より人間的な抽象幾何学的処理が示されることを示した。
論文 参考訳(メタデータ) (2024-02-06T17:59:46Z) - Symmetry-Informed Geometric Representation for Molecules, Proteins, and
Crystalline Materials [66.14337835284628]
幾何戦略の有効性をベンチマークできるGeom3Dというプラットフォームを提案する。
Geom3Dは16の高度な対称性インフォームド幾何表現モデルと46の多様なデータセット上の14の幾何事前学習方法を含んでいる。
論文 参考訳(メタデータ) (2023-06-15T05:37:25Z) - Geoclidean: Few-Shot Generalization in Euclidean Geometry [36.203651858533]
ユークリッド幾何学は数学的思考の最も初期の形態の一つである。
自然画像で訓練されたコンピュータビジョンモデルはユークリッド幾何学と同じ感度を示すのだろうか?
ユークリッド幾何学のためのドメイン固有言語であるGeoclideanを紹介する。
論文 参考訳(メタデータ) (2022-11-30T01:17:22Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。