論文の概要: A Number Sense as an Emergent Property of the Manipulating Brain
- arxiv url: http://arxiv.org/abs/2012.04132v2
- Date: Mon, 22 Feb 2021 09:51:43 GMT
- ステータス: 処理完了
- システム内更新日: 2021-05-18 04:36:00.906611
- Title: A Number Sense as an Emergent Property of the Manipulating Brain
- Title(参考訳): 操作する脳の創発的特性としての数感覚
- Authors: Neehar Kondapaneni, Pietro Perona
- Abstract要約: 本研究では,小さな物体を自在に操作し,シーンの変化を予測するモデルを提案する。
数値と量を持つ施設の重要な側面は教師の明示的な監督なしに学ぶことができると結論づけた。
- 参考スコア(独自算出の注目度): 25.034360614597972
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: The ability to understand and manipulate numbers and quantities emerges
during childhood, but the mechanism through which this ability is developed is
still poorly understood. In particular, it is not known whether acquiring such
a {\em number sense} is possible without supervision from a teacher.
To explore this question, we propose a model in which spontaneous and
undirected manipulation of small objects trains perception to predict the
resulting scene changes. We find that, from this task, an image representation
emerges that exhibits regularities that foreshadow numbers and quantity. These
include distinct categories for zero and the first few natural numbers, a
notion of order, and a signal that correlates with numerical quantity. As a
result, our model acquires the ability to estimate the number of objects in the
scene, as well as {\em subitization}, i.e. the ability to recognize at a glance
the exact number of objects in small scenes. We conclude that important aspects
of a facility with numbers and quantities may be learned without explicit
teacher supervision.
- Abstract(参考訳): 数量や量を理解・操作する能力は幼少期に出現するが、この能力が発達するメカニズムはいまだに理解されていない。
特に、教師の監督なくしてそのような「数感覚」を得ることが可能かどうかは不明である。
そこで本研究では,小型物体の自発的・非間接的操作が知覚を訓練し,シーン変化を予測できるモデルを提案する。
このタスクから、数と量を予測できる正則性を示す画像表現が現れていることが分かる。
それらには、ゼロと最初の数個の自然数、順序の概念、数値量と相関する信号の異なるカテゴリが含まれる。
その結果、このモデルでは、シーン内のオブジェクトの数を推定できるようになり、また {\em subitization {\displaystyle {\em subitization} も得られる。
小さなシーンでオブジェクトの正確な数を一目で認識する能力。
数値と量を持つ施設の重要な側面は教師の明示的な監督なしに学ぶことができると結論づけた。
関連論文リスト
- Estimating the distribution of numerosity and non-numerical visual magnitudes in natural scenes using computer vision [0.08192907805418582]
自然の視覚的な場面では、異なる数列の出現頻度は、電力法分布に従うことを示す。
本研究では, 連続度と数値の相関構造が, データセット, シーンタイプ間で安定であることを示す。
論文 参考訳(メタデータ) (2024-09-17T09:49:29Z) - Visual Enumeration is Challenging for Large-scale Generative AI [0.08192907805418582]
人間は、数えなくても、視覚的なシーンの物体の数を簡単に判断できる。
大規模生成人工知能(AI)システムに人間のような数感覚があるかどうかを考察する。
論文 参考訳(メタデータ) (2024-01-09T18:18:32Z) - Neural feels with neural fields: Visuo-tactile perception for in-hand
manipulation [57.60490773016364]
マルチフィンガーハンドの視覚と触覚を組み合わせることで,手動操作時の物体の姿勢と形状を推定する。
提案手法であるNeuralFeelsは,ニューラルネットワークをオンラインで学習することでオブジェクトの形状を符号化し,ポーズグラフ問題を最適化して共同で追跡する。
私たちの結果は、タッチが少なくとも、洗練され、そして最も最良のものは、手動操作中に視覚的推定を曖昧にすることを示しています。
論文 参考訳(メタデータ) (2023-12-20T22:36:37Z) - What Makes Pre-Trained Visual Representations Successful for Robust
Manipulation? [57.92924256181857]
照明やシーンテクスチャの微妙な変化の下では,操作や制御作業のために設計された視覚表現が必ずしも一般化されないことがわかった。
創発的セグメンテーション能力は,ViTモデルにおける分布外一般化の強い予測因子であることがわかった。
論文 参考訳(メタデータ) (2023-11-03T18:09:08Z) - Stochastic Coherence Over Attention Trajectory For Continuous Learning
In Video Streams [64.82800502603138]
本稿では,映像ストリーム中のピクセルワイズ表現を段階的かつ自律的に開発するための,ニューラルネットワークに基づく新しいアプローチを提案する。
提案手法は, 参加者の入場地を観察することで, エージェントが学習できる, 人間の様の注意機構に基づく。
実験では,3次元仮想環境を利用して,映像ストリームを観察することで,エージェントが物体の識別を学べることを示す。
論文 参考訳(メタデータ) (2022-04-26T09:52:31Z) - Understanding top-down attention using task-oriented ablation design [0.22940141855172028]
トップダウンの注目により、ニューラルネットワークは、人工的および生物学的の両方において、与えられたタスクに最も関連性の高い情報に集中することができる。
我々は,タスク指向アブレーション設計と呼ばれる一般的なフレームワークに基づく計算実験により,この問題に対処することを目指している。
2つのニューラルネットワークの性能を比較する。
論文 参考訳(メタデータ) (2021-06-08T21:01:47Z) - Object Based Attention Through Internal Gating [4.941630596191806]
本稿では,物体に基づく注目のニューラルネットワークモデルを提案する。
私たちのモデルは、トップダウンとリカレントの両方に注意が向けられる方法を捉えています。
我々のモデルは神経科学からのさまざまな発見を再現している。
論文 参考訳(メタデータ) (2021-06-08T17:20:50Z) - Self-Supervision by Prediction for Object Discovery in Videos [62.87145010885044]
本稿では,この予測タスクを自己監督として利用し,画像シーケンス表現のための新しいオブジェクト中心モデルを構築する。
私たちのフレームワークは、手動アノテーションや事前トレーニングされたネットワークを使わずにトレーニングできます。
最初の実験では、提案されたパイプラインがオブジェクト中心のビデオ予測への有望なステップであることを確認した。
論文 参考訳(メタデータ) (2021-03-09T19:14:33Z) - What Can You Learn from Your Muscles? Learning Visual Representation
from Human Interactions [50.435861435121915]
視覚のみの表現よりも優れた表現を学べるかどうかを調べるために,人間のインタラクションとアテンション・キューを用いている。
実験の結果,我々の「音楽監督型」表現は,視覚のみの最先端手法であるMoCoよりも優れていた。
論文 参考訳(メタデータ) (2020-10-16T17:46:53Z) - A robot that counts like a child: a developmental model of counting and
pointing [69.26619423111092]
実物を数えることができる新しい神経ロボティクスモデルを導入する。
このモデルにより,エンボディメントと数値認識の相互作用を調べることができる。
トレーニングされたモデルは、アイテムのセットをカウントすることができ、同時にそれらを指し示します。
論文 参考訳(メタデータ) (2020-08-05T21:06:27Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。