論文の概要: A Number Sense as an Emergent Property of the Manipulating Brain
- arxiv url: http://arxiv.org/abs/2012.04132v3
- Date: Thu, 9 Nov 2023 02:49:20 GMT
- ステータス: 処理完了
- システム内更新日: 2023-11-10 19:24:10.272084
- Title: A Number Sense as an Emergent Property of the Manipulating Brain
- Title(参考訳): 操作する脳の創発的特性としての数感覚
- Authors: Neehar Kondapaneni, Pietro Perona
- Abstract要約: 本研究では,非教師なしの日常体験を通じて,多くの感覚を身につける人間の能力を再現するモデルを提案する。
教師の監督なくしてそのような数感覚の獲得が可能かどうかは不明である。
その結果,無関係な行動予測のタスクを学習することで,予期せぬイメージ表現が出現し,数値の知覚と表現を先導する規則性を示すことがわかった。
- 参考スコア(独自算出の注目度): 19.122716783575427
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Artificial intelligence (AI) systems struggle to generalize beyond their
training data and abstract general properties from the specifics of the
training examples. We propose a model that reproduces the apparent human
ability to come up with a number sense through unsupervised everyday
experience. The ability to understand and manipulate numbers and quantities
emerges during childhood, but the mechanism through which humans acquire and
develop this ability is still poorly understood. In particular, it is not known
whether acquiring such a number sense is possible without supervision from a
teacher. We explore this question through a model, assuming that the learner is
able to pick and place small objects and will spontaneously engage in
undirected manipulation. We assume that the learner's visual system will
monitor the changing arrangements of objects in the scene and will learn to
predict the effects of each action by comparing perception with the efferent
signal of the motor system. We model perception using standard deep networks
for feature extraction and classification. We find that, from learning the
unrelated task of action prediction, an unexpected image representation emerges
exhibiting regularities that foreshadow the perception and representation of
numbers. These include distinct categories for the first few natural numbers, a
strict ordering of the numbers, and a one-dimensional signal that correlates
with numerical quantity. As a result, our model acquires the ability to
estimate numerosity and subitize. Remarkably, subitization and numerosity
estimation extrapolate to scenes containing many objects, far beyond the three
objects used during training. We conclude that important aspects of a facility
with numbers and quantities may be learned without teacher supervision.
- Abstract(参考訳): 人工知能(AI)システムは、トレーニングデータを超えて一般化し、トレーニングサンプルの具体例から一般的なプロパティを抽象化するのに苦労する。
本研究では, 教師なしの日常体験を通じて, 人間の目に見える能力を再現するモデルを提案する。
幼少期には数と量を理解して操作する能力が出現するが、人間の獲得と発達のメカニズムはいまだに理解されていない。
特に、教師の監督なくしてそのような数感覚の獲得が可能かどうかは不明である。
私たちは、学習者が小さなオブジェクトを選択・配置でき、意図しない操作を自発的に行うことができると仮定して、モデルを通してこの質問を探求する。
学習者の視覚システムは、シーン内の物体の配置の変化を監視し、各動作の効果を、運動系の感覚信号と比較することにより予測する。
特徴抽出と分類のための標準ディープネットワークを用いた知覚をモデル化する。
行動予測の無関係なタスクから学ぶと、予期せぬ画像表現が出現し、数字の知覚と表現を予見する正則性を示すことが分かる。
これらには、最初の数個の自然数の異なるカテゴリ、数字の厳密な順序付け、数量と相関する1次元信号が含まれる。
その結果,本モデルでは,数奇性の推定と減算が可能となった。
驚くべきことに、subitization と numerosity estimation は、トレーニングで使われる3つのオブジェクトをはるかに超えて、多くのオブジェクトを含むシーンに外挿する。
教師の指導なしに数と量を持つ施設の重要な側面を学ぶことができると結論付けた。
関連論文リスト
- Estimating the distribution of numerosity and non-numerical visual magnitudes in natural scenes using computer vision [0.08192907805418582]
自然の視覚的な場面では、異なる数列の出現頻度は、電力法分布に従うことを示す。
本研究では, 連続度と数値の相関構造が, データセット, シーンタイプ間で安定であることを示す。
論文 参考訳(メタデータ) (2024-09-17T09:49:29Z) - Visual Enumeration is Challenging for Large-scale Generative AI [0.08192907805418582]
人間は、数えなくても、視覚的なシーンの物体の数を簡単に判断できる。
大規模生成人工知能(AI)システムに人間のような数感覚があるかどうかを考察する。
論文 参考訳(メタデータ) (2024-01-09T18:18:32Z) - Neural feels with neural fields: Visuo-tactile perception for in-hand
manipulation [57.60490773016364]
マルチフィンガーハンドの視覚と触覚を組み合わせることで,手動操作時の物体の姿勢と形状を推定する。
提案手法であるNeuralFeelsは,ニューラルネットワークをオンラインで学習することでオブジェクトの形状を符号化し,ポーズグラフ問題を最適化して共同で追跡する。
私たちの結果は、タッチが少なくとも、洗練され、そして最も最良のものは、手動操作中に視覚的推定を曖昧にすることを示しています。
論文 参考訳(メタデータ) (2023-12-20T22:36:37Z) - What Makes Pre-Trained Visual Representations Successful for Robust
Manipulation? [57.92924256181857]
照明やシーンテクスチャの微妙な変化の下では,操作や制御作業のために設計された視覚表現が必ずしも一般化されないことがわかった。
創発的セグメンテーション能力は,ViTモデルにおける分布外一般化の強い予測因子であることがわかった。
論文 参考訳(メタデータ) (2023-11-03T18:09:08Z) - Stochastic Coherence Over Attention Trajectory For Continuous Learning
In Video Streams [64.82800502603138]
本稿では,映像ストリーム中のピクセルワイズ表現を段階的かつ自律的に開発するための,ニューラルネットワークに基づく新しいアプローチを提案する。
提案手法は, 参加者の入場地を観察することで, エージェントが学習できる, 人間の様の注意機構に基づく。
実験では,3次元仮想環境を利用して,映像ストリームを観察することで,エージェントが物体の識別を学べることを示す。
論文 参考訳(メタデータ) (2022-04-26T09:52:31Z) - Understanding top-down attention using task-oriented ablation design [0.22940141855172028]
トップダウンの注目により、ニューラルネットワークは、人工的および生物学的の両方において、与えられたタスクに最も関連性の高い情報に集中することができる。
我々は,タスク指向アブレーション設計と呼ばれる一般的なフレームワークに基づく計算実験により,この問題に対処することを目指している。
2つのニューラルネットワークの性能を比較する。
論文 参考訳(メタデータ) (2021-06-08T21:01:47Z) - Object Based Attention Through Internal Gating [4.941630596191806]
本稿では,物体に基づく注目のニューラルネットワークモデルを提案する。
私たちのモデルは、トップダウンとリカレントの両方に注意が向けられる方法を捉えています。
我々のモデルは神経科学からのさまざまな発見を再現している。
論文 参考訳(メタデータ) (2021-06-08T17:20:50Z) - Self-Supervision by Prediction for Object Discovery in Videos [62.87145010885044]
本稿では,この予測タスクを自己監督として利用し,画像シーケンス表現のための新しいオブジェクト中心モデルを構築する。
私たちのフレームワークは、手動アノテーションや事前トレーニングされたネットワークを使わずにトレーニングできます。
最初の実験では、提案されたパイプラインがオブジェクト中心のビデオ予測への有望なステップであることを確認した。
論文 参考訳(メタデータ) (2021-03-09T19:14:33Z) - What Can You Learn from Your Muscles? Learning Visual Representation
from Human Interactions [50.435861435121915]
視覚のみの表現よりも優れた表現を学べるかどうかを調べるために,人間のインタラクションとアテンション・キューを用いている。
実験の結果,我々の「音楽監督型」表現は,視覚のみの最先端手法であるMoCoよりも優れていた。
論文 参考訳(メタデータ) (2020-10-16T17:46:53Z) - A robot that counts like a child: a developmental model of counting and
pointing [69.26619423111092]
実物を数えることができる新しい神経ロボティクスモデルを導入する。
このモデルにより,エンボディメントと数値認識の相互作用を調べることができる。
トレーニングされたモデルは、アイテムのセットをカウントすることができ、同時にそれらを指し示します。
論文 参考訳(メタデータ) (2020-08-05T21:06:27Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。