論文の概要: Adventures in Mathematical Reasoning
- arxiv url: http://arxiv.org/abs/2008.09067v1
- Date: Thu, 20 Aug 2020 16:41:18 GMT
- ステータス: 処理完了
- システム内更新日: 2022-10-27 03:43:00.631049
- Title: Adventures in Mathematical Reasoning
- Title(参考訳): 数学的推論の冒険
- Authors: Toby Walsh
- Abstract要約: リグールは、地図が作られたことを歴史家に知らせるべきであり、真の探検家は別の場所へ行った。
1982年、Anglin, W.S.。
- 参考スコア(独自算出の注目度): 17.68987003293372
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: "Mathematics is not a careful march down a well-cleared highway, but a
journey into a strange wilderness, where the explorers often get lost. Rigour
should be a signal to the historian that the maps have been made, and the real
explorers have gone elsewhere." W.S. Anglin, the Mathematical Intelligencer, 4
(4), 1982.
- Abstract(参考訳): 「数学は精巧な高速道路を慎重に下るものではなく、探検家がよく迷う奇妙な荒野への旅である。リグーアは地図が作られたという歴史学者の合図であり、真の探検家はどこかへ行ったであろう。」
w.s. anglin, the mathematical intelligencer, 4 (4), 1982年。
関連論文リスト
- FrontierMath: A Benchmark for Evaluating Advanced Mathematical Reasoning in AI [2.0608396919601493]
FrontierMath(フロンティアマス、フロンティアマス、FrontierMath)は、数学者が考案し検証した何百もの数学問題のベンチマークである。
現在の最先端のAIモデルは、問題の2%未満を解決し、AI能力と数学的コミュニティの長所との間に大きなギャップが浮かび上がっている。
AIシステムが専門家レベルの数学的能力に向かって進むにつれ、FrontierMathは彼らの進歩を定量化する厳格なテストベッドを提供する。
論文 参考訳(メタデータ) (2024-11-07T17:07:35Z) - MathHay: An Automated Benchmark for Long-Context Mathematical Reasoning in LLMs [61.74749961334557]
MathHayは、LLMの長文数学的推論能力を評価するために設計された自動ベンチマークである。
我々は,8つのトップパフォーマンスモデルの長文数学的推論能力を評価するために,MathHayの広範な実験を行った。
論文 参考訳(メタデータ) (2024-10-07T02:30:07Z) - A Semantic Search Engine for Mathlib4 [3.4826238218770813]
本稿では,非公式な問合せを受け付け,関連する定理を求めるMathlib4のセマンティック検索エンジンを提案する。
また,各種検索エンジンの性能評価のためのベンチマークを構築した。
論文 参考訳(メタデータ) (2024-03-20T05:23:09Z) - Machine learning and information theory concepts towards an AI
Mathematician [77.63761356203105]
人工知能の現在の最先端技術は、特に言語習得の点で印象的だが、数学的推論の点ではあまり重要ではない。
このエッセイは、現在のディープラーニングが主にシステム1の能力で成功するという考えに基づいている。
興味深い数学的ステートメントを構成するものについて質問するために、情報理論的な姿勢を取る。
論文 参考訳(メタデータ) (2024-03-07T15:12:06Z) - MathScale: Scaling Instruction Tuning for Mathematical Reasoning [70.89605383298331]
大規模言語モデル(LLM)は問題解決において顕著な能力を示した。
しかし、数学的な問題を解く能力は依然として不十分である。
高品質な数学的推論データを作成するためのシンプルでスケーラブルな方法であるMathScaleを提案する。
論文 参考訳(メタデータ) (2024-03-05T11:42:59Z) - The legacy of Bletchley Park on UK mathematics [0.0]
第2次世界大戦では、暗号解析と暗号の分野に数学の才能が流入した。
本稿では、ブレッチリー・パークにおけるこれらの数学者と他の数学者の経験が、戦後のキャリアで生み出された数学にどのように影響したかを考察する。
論文 参考訳(メタデータ) (2024-03-02T22:32:49Z) - GSM-Plus: A Comprehensive Benchmark for Evaluating the Robustness of LLMs as Mathematical Problem Solvers [68.77382332826167]
大規模言語モデル (LLM) は、様々な数学的推論ベンチマークで顕著な性能を達成している。
1つの必須かつ頻繁な証拠は、数学の質問がわずかに変更されたとき、LLMは誤って振る舞うことができることである。
このことは, LLMの数学推論能力の頑健性を評価するために, 幅広い質問のバリエーションを試すことによるものである。
論文 参考訳(メタデータ) (2024-02-29T15:26:14Z) - MetaMath: Bootstrap Your Own Mathematical Questions for Large Language Models [91.66694225955872]
数学的推論を専門とする微調整言語モデルであるMetaMathを提案する。
具体的には、余分な知識を伴わずに複数の視点から質問を書き換えることで、数学的質問をブートストラップすることから始める。
私たちは、すべてのMetaMathQAデータセット、異なるモデルサイズを持つMetaMathモデル、パブリック使用のためのトレーニングコードをリリースします。
論文 参考訳(メタデータ) (2023-09-21T17:45:42Z) - Mathematical Artifacts Have Politics: The Journey from Examples to
Embedded Ethics [0.0]
数学的アーティファクトが政治を持っていることを認めることが、数学者が学生のためにより良いエクササイズを設計するのにどう役立つかを示す。
我々は、倫理を数学的カリキュラムに組み込むことの意味を示す。
論文 参考訳(メタデータ) (2023-08-09T11:09:53Z) - Transformers discover an elementary calculation system exploiting local
attention and grid-like problem representation [0.424243593213882]
局所的な注意と適応的な停止機構を備えたユニバーサルトランスフォーマーは、外部のグリッドライクなメモリを利用してマルチ桁加算を行うことができることを示す。
提案モデルでは, トレーニング分布外の補間を必要とする問題に対して, 実験を行った場合においても, 顕著な精度が得られた。
論文 参考訳(メタデータ) (2022-07-06T09:29:56Z) - Inter-GPS: Interpretable Geometry Problem Solving with Formal Language
and Symbolic Reasoning [123.06420835072225]
3,002の幾何学的問題と密接なアノテーションを形式言語に含む新しい大規模ベンチマークGeometry3Kを構築します。
我々は、Interpretable Geometry Problemsolvr (Inter-GPS)と呼ばれる形式言語と記号推論を用いた新しい幾何学的解法を提案する。
イントラGPSは定理の知識を条件付き規則として取り入れ、記号的推論を段階的に行う。
論文 参考訳(メタデータ) (2021-05-10T07:46:55Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。