論文の概要: Machine Number Sense: A Dataset of Visual Arithmetic Problems for
Abstract and Relational Reasoning
- arxiv url: http://arxiv.org/abs/2004.12193v1
- Date: Sat, 25 Apr 2020 17:14:58 GMT
- ステータス: 処理完了
- システム内更新日: 2022-12-09 21:52:17.627626
- Title: Machine Number Sense: A Dataset of Visual Arithmetic Problems for
Abstract and Relational Reasoning
- Title(参考訳): 機械数感覚:抽象的・関係的推論のための視覚的算術問題のデータセット
- Authors: Wenhe Zhang, Chi Zhang, Yixin Zhu, Song-Chun Zhu
- Abstract要約: 文法モデルを用いて自動生成される視覚的算術問題からなるデータセット、MNS(Machine Number Sense)を提案する。
これらの視覚的算術問題は幾何学的フィギュアの形をしている。
我々は、この視覚的推論タスクのベースラインとして、4つの主要なニューラルネットワークモデルを用いて、MNSデータセットをベンチマークする。
- 参考スコア(独自算出の注目度): 95.18337034090648
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: As a comprehensive indicator of mathematical thinking and intelligence, the
number sense (Dehaene 2011) bridges the induction of symbolic concepts and the
competence of problem-solving. To endow such a crucial cognitive ability to
machine intelligence, we propose a dataset, Machine Number Sense (MNS),
consisting of visual arithmetic problems automatically generated using a
grammar model--And-Or Graph (AOG). These visual arithmetic problems are in the
form of geometric figures: each problem has a set of geometric shapes as its
context and embedded number symbols. Solving such problems is not trivial; the
machine not only has to recognize the number, but also to interpret the number
with its contexts, shapes, and relations (e.g., symmetry) together with proper
operations. We benchmark the MNS dataset using four predominant neural network
models as baselines in this visual reasoning task. Comprehensive experiments
show that current neural-network-based models still struggle to understand
number concepts and relational operations. We show that a simple brute-force
search algorithm could work out some of the problems without context
information. Crucially, taking geometric context into account by an additional
perception module would provide a sharp performance gain with fewer search
steps. Altogether, we call for attention in fusing the classic search-based
algorithms with modern neural networks to discover the essential number
concepts in future research.
- Abstract(参考訳): 数学的思考と知能の包括的指標として、数感覚(dehaene 2011)は象徴的概念の誘導と問題解決能力の橋渡しとなる。
このような重要な認知能力をマシンインテリジェンスに付与するために,文法モデルとグラフ(aog)を用いて自動生成する視覚演算問題からなるデータセットであるマシンナンバーセンス(mns)を提案する。
これらの視覚的算術問題は幾何学的フィギュアの形式であり、各問題はその文脈と埋め込み数記号として幾何学的形状の集合を持つ。
そのような問題を解くことは自明な問題ではなく、機械は数を認識するだけでなく、その数とその文脈、形、関係(対称性など)を適切な操作と共に解釈する必要がある。
この視覚的推論タスクのベースラインとして, 4つのニューラルネットワークモデルを用いて, MNSデータセットをベンチマークした。
総合的な実験によると、現在のニューラルネットワークベースのモデルは、数の概念やリレーショナル操作を理解するのに依然として苦労している。
単純なブルートフォース探索アルゴリズムが文脈情報なしで問題のいくつかを解決できることを示す。
重要なことに、幾何学的コンテキストを追加の知覚モジュールで考慮すれば、より少ない探索ステップでパフォーマンスが向上する。
また、従来の検索アルゴリズムを現代のニューラルネットワークと融合させて、将来の研究で不可欠な数の概念を発見することにも注目する。
関連論文リスト
- Learning Differentiable Logic Programs for Abstract Visual Reasoning [18.82429807065658]
微分フォワード推論は、勾配に基づく機械学習パラダイムと推論を統合するために開発された。
NEUMANNはグラフベースの微分可能フォワード推論器で、メッセージをメモリ効率のよい方法で送信し、構造化プログラムを関手で処理する。
NEUMANNは視覚的推論タスクを効率的に解き、神経、象徴的、神経-象徴的ベースラインを上回ります。
論文 参考訳(メタデータ) (2023-07-03T11:02:40Z) - The Clock and the Pizza: Two Stories in Mechanistic Explanation of
Neural Networks [59.26515696183751]
ニューラルネットワークにおけるアルゴリズム発見は、時としてより複雑であることを示す。
単純な学習問題でさえ、驚くほど多様なソリューションを許容できることが示されています。
論文 参考訳(メタデータ) (2023-06-30T17:59:13Z) - Can neural networks do arithmetic? A survey on the elementary numerical
skills of state-of-the-art deep learning models [0.424243593213882]
深層学習モデルが量と記号数の基本的な理解を持っているかどうかは不明である。
我々は最近の文献を批判的に検証し、基礎的な数値と算術の知識をテストするために設計された比較的単純なタスクによって、最先端のアーキテクチャでさえしばしば不足していると結論付けている。
論文 参考訳(メタデータ) (2023-03-14T09:30:52Z) - Are Deep Neural Networks SMARTer than Second Graders? [85.60342335636341]
6~8歳児を対象としたビジュオ言語パズルの解法において,ニューラルネットワークの抽象化,推論,一般化能力の評価を行った。
我々のデータセットは101のユニークなパズルで構成されており、各パズルは絵の質問で構成されており、それらの解には算術、代数学、空間推論を含むいくつかの基本的なスキルが混在している必要がある。
実験により、強力なディープモデルは教師付き設定でパズルに合理的な性能を与えるが、一般化のために解析するとランダムな精度よりは良くないことが明らかになった。
論文 参考訳(メタデータ) (2022-12-20T04:33:32Z) - Learning Iterative Reasoning through Energy Minimization [77.33859525900334]
ニューラルネットワークを用いた反復推論のための新しいフレームワークを提案する。
すべての出力に対してエネルギーランドスケープをパラメータ化するために、ニューラルネットワークをトレーニングします。
エネルギー最小化ステップとして反復推論の各ステップを実装し,最小限のエネルギー解を求める。
論文 参考訳(メタデータ) (2022-06-30T17:44:20Z) - Abstraction, Reasoning and Deep Learning: A Study of the "Look and Say"
Sequence [0.0]
ディープニューラルネットワークは、大規模なデータセットでトレーニングされた場合、高い能力(精度で測定される)を示すことができる。
パズルデータ「Look and Say」の2つのセット実験について報告する。
トレーニングデータとテストデータの両方で)驚くべき精度にもかかわらず、実際のL&Sシーケンス上でのトレーニングプログラムのパフォーマンスは悪いです。
論文 参考訳(メタデータ) (2021-09-27T01:41:37Z) - Neural-Symbolic Solver for Math Word Problems with Auxiliary Tasks [130.70449023574537]
我々のNS-rは、問題を読み取り、問題をエンコードする問題リーダーと、記号方程式を生成するプログラマと、答えを得るシンボリックエグゼキュータから構成される。
また, 目的表現の監督とともに, 4つの新たな補助的目的によって, 異なる記号的推論を強制的に行うように最適化した。
論文 参考訳(メタデータ) (2021-07-03T13:14:58Z) - SMART: A Situation Model for Algebra Story Problems via Attributed
Grammar [74.1315776256292]
本稿では, 問題解決における人間の精神状態を表現する心理学研究から生まれた, emphsituation modelの概念を紹介する。
提案モデルでは,より優れた解釈性を保ちながら,従来のすべてのニューラルソルバを大きなマージンで上回る結果が得られた。
論文 参考訳(メタデータ) (2020-12-27T21:03:40Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。