論文の概要: Machine learning and information theory concepts towards an AI
Mathematician
- arxiv url: http://arxiv.org/abs/2403.04571v1
- Date: Thu, 7 Mar 2024 15:12:06 GMT
- ステータス: 処理完了
- システム内更新日: 2024-03-08 13:46:54.976266
- Title: Machine learning and information theory concepts towards an AI
Mathematician
- Title(参考訳): AI数学へ向けた機械学習と情報理論の概念
- Authors: Yoshua Bengio, Nikolay Malkin
- Abstract要約: 人工知能の現在の最先端技術は、特に言語習得の点で印象的だが、数学的推論の点ではあまり重要ではない。
このエッセイは、現在のディープラーニングが主にシステム1の能力で成功するという考えに基づいている。
興味深い数学的ステートメントを構成するものについて質問するために、情報理論的な姿勢を取る。
- 参考スコア(独自算出の注目度): 77.63761356203105
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: The current state-of-the-art in artificial intelligence is impressive,
especially in terms of mastery of language, but not so much in terms of
mathematical reasoning. What could be missing? Can we learn something useful
about that gap from how the brains of mathematicians go about their craft? This
essay builds on the idea that current deep learning mostly succeeds at system 1
abilities -- which correspond to our intuition and habitual behaviors -- but
still lacks something important regarding system 2 abilities -- which include
reasoning and robust uncertainty estimation. It takes an
information-theoretical posture to ask questions about what constitutes an
interesting mathematical statement, which could guide future work in crafting
an AI mathematician. The focus is not on proving a given theorem but on
discovering new and interesting conjectures. The central hypothesis is that a
desirable body of theorems better summarizes the set of all provable
statements, for example by having a small description length while at the same
time being close (in terms of number of derivation steps) to many provable
statements.
- Abstract(参考訳): 人工知能の現在の最先端技術は、特に言語習得の点で印象的だが、数学的推論の点ではあまり重要ではない。
何が足りないの?
そのギャップについて、数学者の脳が自分の工芸をどう扱うかから、何か役に立つものを学ぶことができるだろうか?
このエッセイは,現在のディープラーニングがシステム1の能力 – 直感と習慣的行動 – で大半を成功させるが,推論や堅牢な不確実性評価など,システム2の能力に関して重要なものはない,という考えに基づいています。
それは情報理論的な姿勢で、興味深い数学的ステートメントを構成するものについて質問する。
その焦点は与えられた定理の証明ではなく、新しく興味深い予想の発見である。
中心的な仮説は、定理の望ましい体は、例えば、小さな記述長を持ちながら(導出ステップの数の観点から)多くの証明可能なステートメントに近づくことによって、証明可能なステートメントの集合をよりよく要約するということである。
関連論文リスト
- MathScale: Scaling Instruction Tuning for Mathematical Reasoning [70.89605383298331]
大規模言語モデル(LLM)は問題解決において顕著な能力を示した。
しかし、数学的な問題を解く能力は依然として不十分である。
高品質な数学的推論データを作成するためのシンプルでスケーラブルな方法であるMathScaleを提案する。
論文 参考訳(メタデータ) (2024-03-05T11:42:59Z) - AI for Mathematics: A Cognitive Science Perspective [86.02346372284292]
数学は人間によって開発された最も強力な概念体系の1つである。
AIの急速な進歩、特に大規模言語モデル(LLM)の進歩による推進により、そのようなシステム構築に対する新たな、広範な関心が生まれている。
論文 参考訳(メタデータ) (2023-10-19T02:00:31Z) - Towards a Holistic Understanding of Mathematical Questions with
Contrastive Pre-training [65.10741459705739]
本稿では,数学的問題表現,すなわち QuesCo に対する対照的な事前学習手法を提案する。
まず、コンテンツレベルと構造レベルを含む2段階の質問強化を設計し、類似した目的で文字通り多様な質問ペアを生成する。
そこで我々は,知識概念の階層的情報を完全に活用するために,知識階層を意識したランク戦略を提案する。
論文 参考訳(メタデータ) (2023-01-18T14:23:29Z) - A Survey of Deep Learning for Mathematical Reasoning [71.88150173381153]
我々は過去10年間の数学的推論とディープラーニングの交差点における重要なタスク、データセット、方法についてレビューする。
大規模ニューラルネットワークモデルの最近の進歩は、新しいベンチマークと、数学的推論にディープラーニングを使用する機会を開放している。
論文 参考訳(メタデータ) (2022-12-20T18:46:16Z) - Peano: Learning Formal Mathematical Reasoning [35.086032962873226]
一般的な数学的推論は計算不可能であるが、人間は新しい問題を常に解決している。
両パズルの中心は、数学の基礎となる手続き的抽象の構造であると仮定する。
カーン・アカデミー・プラットフォーム上の始点代数の5つの部分に関するケーススタディにおいて、このアイデアを探求する。
論文 参考訳(メタデータ) (2022-11-29T01:42:26Z) - The Role of General Intelligence in Mathematical Reasoning [0.0]
オブジェクトは数学の領域の中心であり、それに対する私たちの相互作用と推論です。
現代認知科学とA.I.では、物理領域と数学領域は別々に探索される。
数学的な対象が非数学的対象と同等の空間を持つ,オブジェクト表現の学習のための抽象的理論的枠組みについて述べる。
論文 参考訳(メタデータ) (2021-04-27T20:43:25Z) - Inductive Biases for Deep Learning of Higher-Level Cognition [108.89281493851358]
興味深い仮説は、人間と動物の知性はいくつかの原則によって説明できるということである。
この研究は、主に高いレベルとシーケンシャルな意識的処理に関心のある人を中心に、より大きなリストを考察する。
これらの特定の原則を明確にする目的は、人間の能力から恩恵を受けるAIシステムを構築するのに役立つ可能性があることである。
論文 参考訳(メタデータ) (2020-11-30T18:29:25Z) - Discrete Math with Programming: A Principled Approach [0.0]
離散数学はプログラミングでよりよく教えられると長年主張されてきた。
本稿では、離散数学のすべての中心的な概念をサポートするアプローチを紹介する。
数学や論理文は高いレベルで正確に表現され、コンピュータ上で実行される。
論文 参考訳(メタデータ) (2020-11-28T03:41:27Z) - Noisy Deductive Reasoning: How Humans Construct Math, and How Math
Constructs Universes [0.5874142059884521]
本稿では,数学が基本的な過程である数学的推論の計算モデルを提案する。
この枠組みが数学的実践のいくつかの側面について説得力のある説明を与えることを示す。
論文 参考訳(メタデータ) (2020-10-28T19:43:14Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。