論文の概要: Towards a Mathematics Formalisation Assistant using Large Language
Models
- arxiv url: http://arxiv.org/abs/2211.07524v1
- Date: Mon, 14 Nov 2022 16:52:32 GMT
- ステータス: 処理完了
- システム内更新日: 2022-11-15 16:01:21.433235
- Title: Towards a Mathematics Formalisation Assistant using Large Language
Models
- Title(参考訳): 大規模言語モデルを用いた数学形式化支援の試み
- Authors: Ayush Agrawal, Siddhartha Gadgil, Navin Goyal, Ashvni Narayanan, Anand
Tadipatri
- Abstract要約: リーン定理証明器の形式化を支援するために,大規模な言語モデル(Codex)の能力について検討する。
コーデックスは、短い数学的ステートメントを120ドルの定理ステートメントに対して75%近い精度でアンダーグレードレベルで定式化することができる。
新たなプロンプト戦略により、コーデックスはこれらの証明を自然言語で定式化することができ、12のコーデックスのうち少なくとも1つの完備化は、完全な証明に容易に修正できることが示される。
- 参考スコア(独自算出の注目度): 5.485439959027125
- License: http://creativecommons.org/licenses/by-sa/4.0/
- Abstract: Mathematics formalisation is the task of writing mathematics (i.e.,
definitions, theorem statements, proofs) in natural language, as found in books
and papers, into a formal language that can then be checked for correctness by
a program. It is a thriving activity today, however formalisation remains
cumbersome. In this paper, we explore the abilities of a large language model
(Codex) to help with formalisation in the Lean theorem prover. We find that
with careful input-dependent prompt selection and postprocessing, Codex is able
to formalise short mathematical statements at undergrad level with nearly 75\%
accuracy for $120$ theorem statements. For proofs quantitative analysis is
infeasible and we undertake a detailed case study. We choose a diverse set of
$13$ theorems at undergrad level with proofs that fit in two-three paragraphs.
We show that with a new prompting strategy Codex can formalise these proofs in
natural language with at least one out of twelve Codex completion being easy to
repair into a complete proof. This is surprising as essentially no aligned data
exists for formalised mathematics, particularly for proofs. These results
suggest that large language models are a promising avenue towards fully or
partially automating formalisation.
- Abstract(参考訳): 数学の形式化(英: mathematics formalization)とは、自然言語で数学(すなわち、定義、定理ステートメント、証明)を、書籍や論文に見られるように、プログラムによって正しさを確認する形式言語に記述する作業である。
現在では活発な活動であるが、形式化は難しいままである。
本稿では,大規模言語モデル(codex)のリーン定理証明器における形式化を支援する能力について検討する。
入力依存のプロンプト選択と後処理により、コーデックスは120ドルの定理文に対して75倍近い精度で短い数学的ステートメントを下級レベルで定式化できることがわかった。
実証のためには定量的分析は不可能であり, 詳細な事例研究を行っている。
私たちは下級のレベルで13ドルの定理の多種多様な集合を選び、その証明は2~3段落に収まる。
新しいプロンプト戦略によって、codexはこれらの証明を自然言語で形式化でき、12つのcodex補完のうち少なくとも1つが完全な証明に簡単に修正できることを示した。
形式化された数学、特に証明のためのアライメントデータは存在しないので、これは驚くべきことである。
これらの結果は、大きな言語モデルが完全あるいは部分的に形式化を自動化するための有望な道筋であることを示唆している。
関連論文リスト
- Lean-STaR: Learning to Interleave Thinking and Proving [53.923617816215774]
証明の各ステップに先立って,非公式な思考を生成するために,言語モデルをトレーニングするフレームワークであるLean-STaRを紹介します。
Lean-STaRは、Lean定理証明環境内のminiF2F-testベンチマークで最先端の結果を達成する。
論文 参考訳(メタデータ) (2024-07-14T01:43:07Z) - Autoformalizing Euclidean Geometry [74.72212706513318]
ユークリッド幾何学の自己形式化のためのニューロシンボリックフレームワークを提案する。
1つの課題は、非公式な証明が図に頼り、形式化が難しいテキストのギャップを残すことである。
自己形式化定理文の自動意味評価を行う。
論文 参考訳(メタデータ) (2024-05-27T14:35:10Z) - MUSTARD: Mastering Uniform Synthesis of Theorem and Proof Data [85.50740598523818]
MUSTARDは、高品質で多様性のある定理と証明データの均一な合成をマスターするフレームワークである。
5,866個の有効なデータポイントを持つMUSTARDSAUCEベンチマークを示す。
我々は広範囲な解析を行い、MUSTARDが検証された高品質なステップバイステップデータを生成することを示す。
論文 参考訳(メタデータ) (2024-02-14T05:57:58Z) - A New Approach Towards Autoformalization [7.275550401145199]
オートフォーマル化(Autoformalization)は、自然言語をプログラムで検証可能な形式言語に変換するタスクである。
研究論文は大量の背景と文脈を必要とする。
本稿では,研究レベルの数学の自己形式化に取り組み,タスクをより容易に,より親しみやすいサブタスクに分割する手法を提案する。
論文 参考訳(メタデータ) (2023-10-12T00:50:24Z) - ProofNet: Autoformalizing and Formally Proving Undergraduate-Level
Mathematics [7.607254619341369]
本稿では,学部レベルの数学の自己形式化と形式証明のためのベンチマークであるProofNetを紹介する。
ProofNetベンチマークは371の例で構成され、それぞれがLean 3.0の正式な定理文で構成されている。
テキスト内学習による文の自動書式化のベースライン結果について報告する。
論文 参考訳(メタデータ) (2023-02-24T03:28:46Z) - Towards Autoformalization of Mathematics and Code Correctness:
Experiments with Elementary Proofs [5.045988012508899]
オートフォーマル化(Autoformalization)は、自然言語で書かれた証明を、対話的定理証明を通じてコンピュータで検証可能な形式表現に変換することによって、この問題に対処しようとする。
本稿では, 基本数学的証明を, Coq の対話的定理証明器の言語における等価な形式化に変換する, ユニバーサルトランスフォーマーアーキテクチャに基づく意味解析手法を提案する。
論文 参考訳(メタデータ) (2023-01-05T17:56:00Z) - Draft, Sketch, and Prove: Guiding Formal Theorem Provers with Informal
Proofs [30.57062828812679]
本稿では,形式的証明スケッチに非公式な証明をマッピングするDraft, Sketch, Prove(DSP)を紹介する。
大規模言語モデルでは,形式的証明と同じ推論手順を踏襲して,構造化された形式的スケッチを作成可能であることを示す。
論文 参考訳(メタデータ) (2022-10-21T22:37:22Z) - NaturalProver: Grounded Mathematical Proof Generation with Language
Models [84.2064569475095]
自然数理言語における定理証明は、数学の進歩と教育において中心的な役割を果たす。
本研究では,背景参照を条件づけて証明を生成する言語モデルであるNaturalProverを開発する。
NaturalProverは、短い(2-6ステップ)証明を必要とするいくつかの定理を証明でき、40%の時間で正しいと評価された次のステップの提案を提供することができる。
論文 参考訳(メタデータ) (2022-05-25T17:01:18Z) - Autoformalization with Large Language Models [22.86710743804944]
自動形式化システムの成功は、形式検証、プログラム合成、人工知能の分野を前進させる可能性がある。
大規模な言語モデルがこの目標に向けて新たな展望を提供することを示す。
我々の手法はMiniF2F定理証明ベンチマークで新たな最先端結果をもたらし、証明レートを29.6%から35.2%に改善した。
論文 参考訳(メタデータ) (2022-05-25T09:53:30Z) - NaturalProofs: Mathematical Theorem Proving in Natural Language [132.99913141409968]
数学的ステートメントの多領域コーパスであるNaturalProofsとその証明を開発した。
NaturalProofsは広範なカバレッジ、深いカバレッジ、低リソースの数学的ソースを統一する。
数式参照検索と生成タスクに関する強力なニューラルネットワーク手法をベンチマークする。
論文 参考訳(メタデータ) (2021-03-24T03:14:48Z) - Generative Language Modeling for Automated Theorem Proving [94.01137612934842]
この研究は、自動定理プロバーの人間に対する大きな制限が言語モデルから生成することで対処できる可能性によって動機づけられている。
本稿ではメタマス形式化言語のための自動証明と証明アシスタント GPT-f を提案し,その性能を解析する。
論文 参考訳(メタデータ) (2020-09-07T19:50:10Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。