論文の概要: Can neural networks do arithmetic? A survey on the elementary numerical
skills of state-of-the-art deep learning models
- arxiv url: http://arxiv.org/abs/2303.07735v1
- Date: Tue, 14 Mar 2023 09:30:52 GMT
- ステータス: 処理完了
- システム内更新日: 2023-03-15 15:49:07.185795
- Title: Can neural networks do arithmetic? A survey on the elementary numerical
skills of state-of-the-art deep learning models
- Title(参考訳): ニューラルネットワークは算術できるのか?
最先端ディープラーニングモデルの初歩的数値的技能に関する調査研究
- Authors: Alberto Testolin
- Abstract要約: 深層学習モデルが量と記号数の基本的な理解を持っているかどうかは不明である。
我々は最近の文献を批判的に検証し、基礎的な数値と算術の知識をテストするために設計された比較的単純なタスクによって、最先端のアーキテクチャでさえしばしば不足していると結論付けている。
- 参考スコア(独自算出の注目度): 0.424243593213882
- License: http://creativecommons.org/licenses/by-nc-nd/4.0/
- Abstract: Creating learning models that can exhibit sophisticated reasoning skills is
one of the greatest challenges in deep learning research, and mathematics is
rapidly becoming one of the target domains for assessing scientific progress in
this direction. In the past few years there has been an explosion of neural
network architectures, data sets, and benchmarks specifically designed to
tackle mathematical problems, reporting notable success in disparate fields
such as automated theorem proving, numerical integration, and discovery of new
conjectures or matrix multiplication algorithms. However, despite these
impressive achievements it is still unclear whether deep learning models
possess an elementary understanding of quantities and symbolic numbers. In this
survey we critically examine the recent literature, concluding that even
state-of-the-art architectures often fall short when probed with relatively
simple tasks designed to test basic numerical and arithmetic knowledge.
- Abstract(参考訳): 高度な推論スキルを発揮できる学習モデルを作成することは、ディープラーニング研究の最大の課題の1つであり、数学はこの方向の科学的進歩を評価するためのターゲット領域の1つに急速になっている。
過去数年間、数学的な問題に対処するために設計されたニューラルネットワークアーキテクチャ、データセット、ベンチマークの爆発があり、自動定理証明、数値積分、新しい予想や行列乗算アルゴリズムの発見など、異なる分野における顕著な成功を報告している。
しかし、これらの顕著な成果にもかかわらず、深層学習モデルが量と記号数の基本的な理解を持っているかどうかは不明である。
本研究では最近の文献を批判的に検討し,基本的な数値的,算術的知識をテストするための比較的単純なタスクを探索する場合,最先端のアーキテクチャでさえ不足することが多いことを結論づけた。
関連論文リスト
- Learning to solve arithmetic problems with a virtual abacus [0.35911228556176483]
本稿では,認知エージェントが算術的問題を解くための学習方法をシミュレートする,深層強化学習フレームワークを提案する。
提案モデルでは,複数桁の加算と減算をうまく学習し,誤差率を1%以下に抑えることができた。
最も一般的なエラーパターンを分析して、設計選択による制限とバイアスをよりよく理解します。
論文 参考訳(メタデータ) (2023-01-17T13:25:52Z) - A Survey of Deep Learning for Mathematical Reasoning [71.88150173381153]
我々は過去10年間の数学的推論とディープラーニングの交差点における重要なタスク、データセット、方法についてレビューする。
大規模ニューラルネットワークモデルの最近の進歩は、新しいベンチマークと、数学的推論にディープラーニングを使用する機会を開放している。
論文 参考訳(メタデータ) (2022-12-20T18:46:16Z) - Are Deep Neural Networks SMARTer than Second Graders? [85.60342335636341]
6~8歳児を対象としたビジュオ言語パズルの解法において,ニューラルネットワークの抽象化,推論,一般化能力の評価を行った。
我々のデータセットは101のユニークなパズルで構成されており、各パズルは絵の質問で構成されており、それらの解には算術、代数学、空間推論を含むいくつかの基本的なスキルが混在している必要がある。
実験により、強力なディープモデルは教師付き設定でパズルに合理的な性能を与えるが、一般化のために解析するとランダムな精度よりは良くないことが明らかになった。
論文 参考訳(メタデータ) (2022-12-20T04:33:32Z) - Neural Architecture Search for Dense Prediction Tasks in Computer Vision [74.9839082859151]
ディープラーニングは、ニューラルネットワークアーキテクチャエンジニアリングに対する需要の高まりにつながっている。
ニューラルネットワーク検索(NAS)は、手動ではなく、データ駆動方式でニューラルネットワークアーキテクチャを自動設計することを目的としている。
NASはコンピュータビジョンの幅広い問題に適用されている。
論文 参考訳(メタデータ) (2022-02-15T08:06:50Z) - Geometric Deep Learning: Grids, Groups, Graphs, Geodesics, and Gauges [50.22269760171131]
過去10年間、データサイエンスと機械学習の実験的な革命が、ディープラーニングの手法によって生まれた。
このテキストは、統一幾何学的原理によって事前に定義された規則性を公開することに関するものである。
CNN、RNN、GNN、Transformersなど、最も成功したニューラルネットワークアーキテクチャを研究するための一般的な数学的フレームワークを提供する。
論文 参考訳(メタデータ) (2021-04-27T21:09:51Z) - Towards a Mathematical Understanding of Neural Network-Based Machine
Learning: what we know and what we don't [11.447492237545788]
この記事では、ニューラルネットワークベースの機械学習の成功と微妙さの背景にある理由を理解するために、ここ数年で達成された成果についてレビューする。
古き良き応用数学の伝統において、厳密な数学的結果だけでなく、注意深い数値実験から得られた洞察にも注目する。
論文 参考訳(メタデータ) (2020-09-22T17:55:47Z) - Knowledge Distillation: A Survey [87.51063304509067]
ディープニューラルネットワークは、特にコンピュータビジョンタスクにおいて、産業と学術の両方で成功している。
リソースが限られているデバイスに、これらの面倒なディープモデルをデプロイすることは難しい。
知識蒸留は、大きな教師モデルから小さな学生モデルを効果的に学習する。
論文 参考訳(メタデータ) (2020-06-09T21:47:17Z) - Machine Number Sense: A Dataset of Visual Arithmetic Problems for
Abstract and Relational Reasoning [95.18337034090648]
文法モデルを用いて自動生成される視覚的算術問題からなるデータセット、MNS(Machine Number Sense)を提案する。
これらの視覚的算術問題は幾何学的フィギュアの形をしている。
我々は、この視覚的推論タスクのベースラインとして、4つの主要なニューラルネットワークモデルを用いて、MNSデータセットをベンチマークする。
論文 参考訳(メタデータ) (2020-04-25T17:14:58Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。