論文の概要: Matlas: A Semantic Search Engine for Mathematics
- arxiv url: http://arxiv.org/abs/2604.17484v1
- Date: Sun, 19 Apr 2026 15:17:28 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-04-21 21:52:52.549205
- Title: Matlas: A Semantic Search Engine for Mathematics
- Title(参考訳): Matlas: 数学のセマンティック検索エンジン
- Authors: Haocheng Ju, Leheng Chen, Peihao Wu, Bryan Dai, Bin Dong,
- Abstract要約: Matlasは数学的ステートメントのセマンティック検索エンジンである。
マトラスは1826年から2025年にかけて435万件の査読論文から870万件の文書を抽出した大規模コーパス上に構築されている。
このコーパスの上に,自然言語クエリを用いた数学的結果の効率的な検索を可能にする意味検索システムを構築する。
- 参考スコア(独自算出の注目度): 2.8548596155460024
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Retrieving mathematical knowledge is a central task in both human-driven research, such as determining whether a result already exists, finding related results, and identifying historical origins, and in emerging AI systems for mathematics, where reliable grounding is essential. However, the scale and structure of the mathematical literature pose significant challenges: results are distributed across millions of documents, and individual statements are often difficult to interpret in isolation due to their dependence on prior definitions and theorems. In this paper, we introduce Matlas, a semantic search engine for mathematical statements. Matlas is built on a large-scale corpus of 8.07 million statements extracted from 435K peer-reviewed papers spanning 1826 to 2025, drawn from a curated set of 180 journals selected using an ICM citation-based criterion, together with 1.9K textbooks. From these sources, we extract mathematical statements together with their dependencies, construct document-level dependency graphs, and recursively unfold statements in topological order to produce more self-contained representations. On top of this corpus, we develop a semantic retrieval system that enables efficient search for mathematical results using natural language queries. We hope that Matlas can improve the efficiency of theorem retrieval for mathematicians and provide a structured source of grounding for AI systems tackling research-level mathematical problems, and serve as part of the infrastructure for mathematical knowledge retrieval.
- Abstract(参考訳): 数学知識の回収は、結果がすでに存在するかどうか、関連する結果の発見、歴史的起源の特定、信頼性の高い基底が不可欠である数学のための新しいAIシステムにおいて、双方の人間主導の研究において中心的な課題である。
しかし、数学文献のスケールと構造は、何百万もの文書に分散され、個々のステートメントは、以前の定義や定理に依存しているため、独立して解釈することがしばしば困難である。
本稿では,数学的ステートメントのセマンティックサーチエンジンであるMatlasを紹介する。
マトラスは1826年から2025年までの435Kの査読論文から抽出された8.07万文の大規模なコーパスの上に構築されており、ICMの引用に基づく基準で選択された180の論文と1.9Kの教科書から抽出された。
これらの資料から、それらの依存関係とともに数学的ステートメントを抽出し、文書レベルの依存性グラフを構築し、トポロジ的順序で再帰的に展開し、より自己完結した表現を生成する。
このコーパスの上に,自然言語クエリを用いた数学的結果の効率的な検索を可能にする意味検索システムを構築する。
マトラが数学者の定理検索の効率を改善し、研究レベルの数学的問題に取り組むAIシステムのための構造的基盤を提供し、数学的知識検索の基盤となることを願っている。
関連論文リスト
- HorizonMath: Measuring AI Progress Toward Mathematical Discovery with Automatic Verification [54.06301039725887]
計算および応用数学において8つの領域にまたがる100以上の未解決問題のベンチマークであるHorizonMathを紹介する。
我々のベンチマークは、発見が困難であり、意味のある数学的洞察を必要とする問題のクラスをターゲットにしているが、検証は計算的に効率的で簡単なものである。
論文 参考訳(メタデータ) (2026-03-16T17:59:53Z) - Semantic Search over 9 Million Mathematical Theorems [0.31229177276953496]
我々は、arXivと他の7つの情報源から抽出された9.2億ドルの定理文の統一コーパス上で、意味定理の検索を大規模に導入、研究する。
それぞれの定理を,検索表現として短い自然言語記述で表現し,表現コンテキスト,言語モデルの選択,埋め込みモデル,探索戦略が検索品質にどのように影響するかを体系的に分析する。
論文 参考訳(メタデータ) (2026-02-05T02:16:20Z) - AutoMathKG: The automated mathematical knowledge graph based on LLM and vector database [1.799933345199395]
数学知識グラフ(KG)は、数学の分野における知識を構造化された方法で提示する。
本稿では,自動更新が可能な高品質・広包・多次元数学KGであるAutoMathKGを提案する。
論文 参考訳(メタデータ) (2025-05-19T17:41:29Z) - Mathematical Entities: Corpora and Benchmarks [0.8766411351797883]
数学テキストに対する自然言語処理の研究は比較的少ない。
我々は、異なる文脈で数学の言語を研究するのに使用できる注釈付きコーパスを提供する。
論文 参考訳(メタデータ) (2024-06-17T14:11:00Z) - OntoMath${}^{\mathbf{PRO}}$ 2.0 Ontology: Updates of the Formal Model [68.8204255655161]
主な関心は、Open Linked Dataクラウドにおける数学的ステートメントを表現するための形式モデルの開発である。
提案モデルは、自然言語の数学的テキストから数学的事実を抽出し、これらの事実をLinked Open Dataとして表現するアプリケーションを対象としている。
このモデルは OntoMath$mathrmPRO$ ontology of professional mathematics の新バージョンの開発に使用される。
論文 参考訳(メタデータ) (2023-03-17T20:29:17Z) - How Do Transformers Learn Topic Structure: Towards a Mechanistic
Understanding [56.222097640468306]
我々は、トランスフォーマーが「意味構造」を学ぶ方法の機械的理解を提供する
数学的解析とウィキペディアデータの実験を組み合わせることで、埋め込み層と自己保持層がトピック構造をエンコードしていることを示す。
論文 参考訳(メタデータ) (2023-03-07T21:42:17Z) - A Survey of Deep Learning for Mathematical Reasoning [71.88150173381153]
我々は過去10年間の数学的推論とディープラーニングの交差点における重要なタスク、データセット、方法についてレビューする。
大規模ニューラルネットワークモデルの最近の進歩は、新しいベンチマークと、数学的推論にディープラーニングを使用する機会を開放している。
論文 参考訳(メタデータ) (2022-12-20T18:46:16Z) - Self-Supervised Pretraining of Graph Neural Network for the Retrieval of
Related Mathematical Expressions in Scientific Articles [8.942112181408156]
本稿では,機械学習に基づく数学的表現の検索手法を提案する。
埋め込み学習と自己教師型学習を組み合わせた教師なし表現学習タスクを設計する。
arXiv.orgで発行された90,000以上の出版物から、9900万以上の数学的表現を持つ巨大なデータセットを収集します。
論文 参考訳(メタデータ) (2022-08-22T12:11:30Z) - Learning to Match Mathematical Statements with Proofs [37.38969121408295]
このタスクは、研究レベルの数学的テキストの処理を改善するために設計されている。
我々は180k以上の文対からなるタスク用のデータセットをリリースする。
課題をグローバルに検討し,重み付き二部マッチングアルゴリズムを用いることで,課題に対処できることが示唆された。
論文 参考訳(メタデータ) (2021-02-03T15:38:54Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。