論文の概要: Learning to Match Mathematical Statements with Proofs
- arxiv url: http://arxiv.org/abs/2102.02110v1
- Date: Wed, 3 Feb 2021 15:38:54 GMT
- ステータス: 処理完了
- システム内更新日: 2021-02-04 17:31:43.900505
- Title: Learning to Match Mathematical Statements with Proofs
- Title(参考訳): 数学的ステートメントと証明をマッチングする学習
- Authors: Maximin Coavoux, Shay B. Cohen
- Abstract要約: このタスクは、研究レベルの数学的テキストの処理を改善するために設計されている。
我々は180k以上の文対からなるタスク用のデータセットをリリースする。
課題をグローバルに検討し,重み付き二部マッチングアルゴリズムを用いることで,課題に対処できることが示唆された。
- 参考スコア(独自算出の注目度): 37.38969121408295
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: We introduce a novel task consisting in assigning a proof to a given
mathematical statement. The task is designed to improve the processing of
research-level mathematical texts. Applying Natural Language Processing (NLP)
tools to research level mathematical articles is both challenging, since it is
a highly specialized domain which mixes natural language and mathematical
formulae. It is also an important requirement for developing tools for
mathematical information retrieval and computer-assisted theorem proving. We
release a dataset for the task, consisting of over 180k statement-proof pairs
extracted from mathematical research articles. We carry out preliminary
experiments to assess the difficulty of the task. We first experiment with two
bag-of-words baselines. We show that considering the assignment problem
globally and using weighted bipartite matching algorithms helps a lot in
tackling the task. Finally, we introduce a self-attention-based model that can
be trained either locally or globally and outperforms baselines by a wide
margin.
- Abstract(参考訳): 与えられた数学的ステートメントに証明を割り当てることからなる新しいタスクを導入する。
このタスクは、研究レベルの数学的テキストの処理を改善するために設計されている。
自然言語処理(NLP)ツールを研究レベルの数学的記事に適用することは、自然言語と数学的公式を混合する非常に専門性の高い領域であるため、どちらも困難です。
また、数学的情報検索とコンピュータ支援定理証明のためのツールを開発するための重要な要件である。
数学的研究論文から抽出した180k以上の文対からなるタスク用データセットを作成した。
我々は課題の難易度を評価する予備実験を行う。
まず2つの単語のベースラインを実験した。
課題をグローバルに検討し,重み付き二部マッチングアルゴリズムを用いることで,課題に対処できることが示唆された。
最後に,ローカルあるいはグローバルにトレーニング可能な自己追跡ベースのモデルを導入し,ベースラインを高いマージンで上回ります。
関連論文リスト
- Mathematical Entities: Corpora and Benchmarks [0.8766411351797883]
数学テキストに対する自然言語処理の研究は比較的少ない。
我々は、異なる文脈で数学の言語を研究するのに使用できる注釈付きコーパスを提供する。
論文 参考訳(メタデータ) (2024-06-17T14:11:00Z) - BERT is not The Count: Learning to Match Mathematical Statements with
Proofs [34.61792250254876]
この課題は、数学的情報検索に関する現在の研究や、より一般的には、数学的記事分析に当てはまる。
現代数学研究論文から抽出した180k以上の文対からなるデータセットについて述べる。
本稿では,文と証明を効果的にマッチングする双線形類似モデルと2つの復号法を提案する。
論文 参考訳(メタデータ) (2023-02-18T14:48:20Z) - Towards a Holistic Understanding of Mathematical Questions with
Contrastive Pre-training [65.10741459705739]
本稿では,数学的問題表現,すなわち QuesCo に対する対照的な事前学習手法を提案する。
まず、コンテンツレベルと構造レベルを含む2段階の質問強化を設計し、類似した目的で文字通り多様な質問ペアを生成する。
そこで我々は,知識概念の階層的情報を完全に活用するために,知識階層を意識したランク戦略を提案する。
論文 参考訳(メタデータ) (2023-01-18T14:23:29Z) - A Survey of Deep Learning for Mathematical Reasoning [71.88150173381153]
我々は過去10年間の数学的推論とディープラーニングの交差点における重要なタスク、データセット、方法についてレビューする。
大規模ニューラルネットワークモデルの最近の進歩は、新しいベンチマークと、数学的推論にディープラーニングを使用する機会を開放している。
論文 参考訳(メタデータ) (2022-12-20T18:46:16Z) - Lila: A Unified Benchmark for Mathematical Reasoning [59.97570380432861]
LILAは、23の多様なタスクと4次元からなる統一的な数学的推論ベンチマークである。
我々は,Pythonプログラムの形式でタスク命令とソリューションを収集することにより,20のデータセットベンチマークを拡張してベンチマークを構築した。
LILAで訓練された汎用数学的推論モデルであるBHASKARAを紹介する。
論文 参考訳(メタデータ) (2022-10-31T17:41:26Z) - ConvFinQA: Exploring the Chain of Numerical Reasoning in Conversational
Finance Question Answering [70.6359636116848]
本稿では,対話型質問応答における数値推論の連鎖を研究するために,新しい大規模データセットConvFinQAを提案する。
我々のデータセットは、現実世界の会話において、長距離で複雑な数値推論パスをモデル化する上で大きな課題となる。
論文 参考訳(メタデータ) (2022-10-07T23:48:50Z) - JiuZhang: A Chinese Pre-trained Language Model for Mathematical Problem
Understanding [74.12405417718054]
本稿では,中国初の数学的事前学習言語モデル(PLM)を提示することにより,機械の数学的知性向上を目指す。
他の標準のNLPタスクとは異なり、数学的テキストは問題文に数学的用語、記号、公式を含むため理解が難しい。
基礎課程と上級課程の両方からなる数学PLMの学習を改善するための新しいカリキュラム事前学習手法を設計する。
論文 参考訳(メタデータ) (2022-06-13T17:03:52Z) - Tackling Math Word Problems with Fine-to-Coarse Abstracting and
Reasoning [22.127301797950572]
本稿では,局所的なきめ細かい情報と,その大域的な論理構造の両方を捉えるために,微粒な方法で数学語問題をモデル化することを提案する。
我々のモデルは局所的な変動に自然に敏感であり、目に見えない問題タイプにより良い一般化が可能である。
論文 参考訳(メタデータ) (2022-05-17T12:14:44Z) - Natural Language Premise Selection: Finding Supporting Statements for
Mathematical Text [3.42658286826597]
提案するNLPタスクは,サポート定義の検索や提案の支持に使用される自然前提選択である。
また、NL-PSというデータセットを利用可能にすることで、自然環境選択タスクに対する様々なアプローチを評価することができる。
論文 参考訳(メタデータ) (2020-04-30T17:08:03Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。