論文の概要: A Semantic Search Engine for Mathlib4
- arxiv url: http://arxiv.org/abs/2403.13310v1
- Date: Wed, 20 Mar 2024 05:23:09 GMT
- ステータス: 処理完了
- システム内更新日: 2024-03-21 17:58:10.483453
- Title: A Semantic Search Engine for Mathlib4
- Title(参考訳): Mathlib4のセマンティック検索エンジン
- Authors: Guoxiong Gao, Haocheng Ju, Jiedong Jiang, Zihan Qin, Bin Dong,
- Abstract要約: 本稿では,非公式な問合せを受け付け,関連する定理を求めるMathlib4のセマンティック検索エンジンを提案する。
また,各種検索エンジンの性能評価のためのベンチマークを構築した。
- 参考スコア(独自算出の注目度): 3.4826238218770813
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: The interactive theorem prover, Lean, enables the verification of formal mathematical proofs and is backed by an expanding community. Central to this ecosystem is its mathematical library, mathlib4, which lays the groundwork for the formalization of an expanding range of mathematical theories. However, searching for theorems in mathlib4 can be challenging. To successfully search in mathlib4, users often need to be familiar with its naming conventions or documentation strings. Therefore, creating a semantic search engine that can be used easily by individuals with varying familiarity with mathlib4 is very important. In this paper, we present a semantic search engine for mathlib4 that accepts informal queries and finds the relevant theorems. We also establish a benchmark for assessing the performance of various search engines for mathlib4.
- Abstract(参考訳): インタラクティブな定理証明器であるLeanは、形式的な数学的証明の検証を可能にし、拡大するコミュニティによって支えられている。
このエコシステムの中心にあるのは数学ライブラリMathlib4であり、このライブラリは拡張された数学理論の形式化の基礎を成している。
しかし、Mathlib4における定理の探索は困難である。
Mathlib4で検索を成功させるためには、ユーザはその命名規則やドキュメント文字列に精通する必要があることが多い。
そのため,mathlib4に慣れ親しんだ個人が容易に利用できるセマンティック検索エンジンを作成することが重要である。
本稿では,非公式な問合せを受け付け,関連する定理を見出すための意味検索エンジンであるMathlib4を提案する。
また,各種検索エンジンの性能評価のためのベンチマークを構築した。
関連論文リスト
- FineMath: A Fine-Grained Mathematical Evaluation Benchmark for Chinese
Large Language Models [47.560637703675816]
FineMathは、中国語大言語モデル(LLM)を評価するための詳細な数学的評価ベンチマークデータセットである。
FineMathは、小学校数学で教えられる主要な数学的概念をカバーし、数学用語の問題の17のカテゴリに分けられる。
数学の単語問題のうち17のカテゴリは、これらの問題を解決するために必要な推論ステップの数に応じて、難易度を手動でアノテートする。
論文 参考訳(メタデータ) (2024-03-12T15:32:39Z) - Machine learning and information theory concepts towards an AI
Mathematician [77.63761356203105]
人工知能の現在の最先端技術は、特に言語習得の点で印象的だが、数学的推論の点ではあまり重要ではない。
このエッセイは、現在のディープラーニングが主にシステム1の能力で成功するという考えに基づいている。
興味深い数学的ステートメントを構成するものについて質問するために、情報理論的な姿勢を取る。
論文 参考訳(メタデータ) (2024-03-07T15:12:06Z) - MathScale: Scaling Instruction Tuning for Mathematical Reasoning [70.89605383298331]
大規模言語モデル(LLM)は問題解決において顕著な能力を示した。
しかし、数学的な問題を解く能力は依然として不十分である。
高品質な数学的推論データを作成するためのシンプルでスケーラブルな方法であるMathScaleを提案する。
論文 参考訳(メタデータ) (2024-03-05T11:42:59Z) - GSM-Plus: A Comprehensive Benchmark for Evaluating the Robustness of
LLMs as Mathematical Problem Solvers [73.78371810664319]
大規模言語モデル (LLM) は、様々な数学的推論ベンチマークで顕著な性能を達成している。
1つの必須かつ頻繁な証拠は、数学の質問がわずかに変更されたとき、LLMは誤って振る舞うことができることである。
このことは, LLMの数学推論能力の頑健性を評価するために, 幅広い質問のバリエーションを試すことによるものである。
論文 参考訳(メタデータ) (2024-02-29T15:26:14Z) - InternLM-Math: Open Math Large Language Models Toward Verifiable
Reasoning [99.8200914526817]
InternLM2から事前学習を継続するILMs InternLM-Mathをオープンソースとして公開する。
我々は、連鎖推論、報酬モデリング、形式推論、データ拡張、コードインタプリタを、統一されたSeq2seqフォーマットで統一する。
我々の事前学習モデルは、微調整なしでMiniF2Fテストセットで30.3を達成する。
論文 参考訳(メタデータ) (2024-02-09T11:22:08Z) - MathGloss: Building mathematical glossaries from text [0.620048328543366]
MathGlossは数学の学部概念のデータベースである。
最新の自然言語処理(NLP)ツールとWeb上で既に利用可能なリソースを使用している。
論文 参考訳(メタデータ) (2023-11-21T14:49:00Z) - math-PVS: A Large Language Model Framework to Map Scientific
Publications to PVS Theories [10.416375584563728]
本研究では,大規模言語モデル(LLM)の高度な数学的概念の定式化への適用性について検討する。
我々は、研究論文から数学的定理を抽出し、形式化する、Emphmath-PVSと呼ばれる自動過程を構想する。
論文 参考訳(メタデータ) (2023-10-25T23:54:04Z) - A New Approach Towards Autoformalization [8.176989532546632]
オートフォーマル化(Autoformalization)は、自然言語をプログラムで検証可能な形式言語に変換するタスクである。
研究論文は大量の背景と文脈を必要とする。
本稿では,研究レベルの数学の自己形式化に取り組み,タスクをより容易に,より親しみやすいサブタスクに分割する手法を提案する。
論文 参考訳(メタデータ) (2023-10-12T00:50:24Z) - MathCoder: Seamless Code Integration in LLMs for Enhanced Mathematical
Reasoning [52.97768001837269]
本稿では,オープンソース言語モデルを微調整する手法を提案する。
本稿では,問題のある新しい,高品質なデータセットを生成する手法とそのコードベースソリューションを提案する。
このアプローチは、問題の解決にコードベースのソリューションを生成することができるモデルのファミリーであるMathCoderモデルを生成する。
論文 参考訳(メタデータ) (2023-10-05T17:52:09Z) - Noisy Deductive Reasoning: How Humans Construct Math, and How Math
Constructs Universes [0.5874142059884521]
本稿では,数学が基本的な過程である数学的推論の計算モデルを提案する。
この枠組みが数学的実践のいくつかの側面について説得力のある説明を与えることを示す。
論文 参考訳(メタデータ) (2020-10-28T19:43:14Z) - A Finitist's Manifesto: Do we need to Reformulate the Foundations of
Mathematics? [1.384477926572109]
このエッセイは、無限の楽園で睡眠ウォーキングをしている数学者のヒードを練習するためのものです。
数学の多くの分野は、(i)無限個の要素を含む対象の「存在」、(ii)任意の精度で計算する能力、「理論」、または(iii)任意の数の時間ステップを計算する能力「理論」に依存している。
論文 参考訳(メタデータ) (2020-09-14T14:44:08Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。