論文の概要: Tree-Based Representation and Generation of Natural and Mathematical
Language
- arxiv url: http://arxiv.org/abs/2302.07974v1
- Date: Wed, 15 Feb 2023 22:38:34 GMT
- ステータス: 処理完了
- システム内更新日: 2023-02-17 15:37:42.872749
- Title: Tree-Based Representation and Generation of Natural and Mathematical
Language
- Title(参考訳): 自然言語と数学的言語のツリーベース表現と生成
- Authors: Alexander Scarlatos and Andrew Lan
- Abstract要約: 科学コミュニケーションと教育シナリオにおける数学的言語は重要であるが、比較的研究されている。
数学言語に関する最近の研究は、スタンドアローンな数学的表現や、事前訓練された自然言語モデルにおける数学的推論に焦点をあてている。
テキストと数学を共同で表現・生成するために,既存の言語モデルに対する一連の修正を提案する。
- 参考スコア(独自算出の注目度): 77.34726150561087
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Mathematical language in scientific communications and educational scenarios
is important yet relatively understudied compared to natural languages. Recent
works on mathematical language focus either on representing stand-alone
mathematical expressions, especially in their natural tree format, or
mathematical reasoning in pre-trained natural language models. Existing works
on jointly modeling and generating natural and mathematical languages simply
treat mathematical expressions as text, without accounting for the rigid
structural properties of mathematical expressions. In this paper, we propose a
series of modifications to existing language models to jointly represent and
generate text and math: representing mathematical expressions as sequences of
node tokens in their operator tree format, using math symbol and tree position
embeddings to preserve the semantic and structural properties of mathematical
expressions, and using a constrained decoding method to generate mathematically
valid expressions. We ground our modifications in GPT-2, resulting in a model
MathGPT, and demonstrate that it outperforms baselines on mathematical
expression generation tasks.
- Abstract(参考訳): 科学コミュニケーションや教育シナリオにおける数理言語は、自然言語と比較して比較的未熟である。
数学的言語に関する最近の研究は、単独の数学的表現、特に自然木形式における表現、あるいは事前訓練された自然言語モデルにおける数学的推論に焦点をあてている。
自然および数学の言語を共同でモデル化し、生成する研究は、数学的表現の構造的特性を考慮せずに、単に数学的表現をテキストとして扱う。
本稿では, 数式を演算木形式におけるノードトークンのシーケンスとして表現し, 数式の意味的および構造的性質を保存するために数学記号と木の位置埋め込みを使用し, 制約付き復号法を用いて数学的に有効な表現を生成する, 既存の言語モデルに対する一連の修正を提案する。
我々はGPT-2で修正を行い、その結果、モデルMathGPTとなり、数学的表現生成タスクのベースラインよりも優れていることを示す。
関連論文リスト
- Large Language Models for Mathematicians [53.27302720305432]
大規模言語モデル(LLM)は、汎用言語理解、特に高品質なテキストやコンピュータコードを生成する能力に多大な関心を集めている。
本稿では,プロの数学者をどの程度支援できるかについて論じる。
論文 参考訳(メタデータ) (2023-12-07T18:59:29Z) - Natural Language Embedded Programs for Hybrid Language Symbolic Reasoning [84.12154024070024]
本研究では,数学・記号的推論,自然言語理解,後続の課題に対処するための統合フレームワークとして,自然言語組み込みプログラム(NLEP)を提案する。
我々のアプローチは,構造化知識の自然言語表現を含むデータ構造上の関数を定義する完全なPythonプログラムを生成するよう,言語モデルに促す。
Pythonインタープリタが生成されたコードを実行し、出力をプリントする。
論文 参考訳(メタデータ) (2023-09-19T17:54:21Z) - OntoMath${}^{\mathbf{PRO}}$ 2.0 Ontology: Updates of the Formal Model [68.8204255655161]
主な関心は、Open Linked Dataクラウドにおける数学的ステートメントを表現するための形式モデルの開発である。
提案モデルは、自然言語の数学的テキストから数学的事実を抽出し、これらの事実をLinked Open Dataとして表現するアプリケーションを対象としている。
このモデルは OntoMath$mathrmPRO$ ontology of professional mathematics の新バージョンの開発に使用される。
論文 参考訳(メタデータ) (2023-03-17T20:29:17Z) - Semantic Representations of Mathematical Expressions in a Continuous
Vector Space [0.0]
この研究は連続ベクトル空間における数学的表現を表現するためのアプローチを記述する。
我々は、視覚的に異なるが数学的に等価な表現に基づいて訓練されたシーケンス・ツー・シーケンス・アーキテクチャのエンコーダを用いて、ベクトル表現を生成する。
論文 参考訳(メタデータ) (2022-10-08T22:33:39Z) - NaturalProver: Grounded Mathematical Proof Generation with Language
Models [84.2064569475095]
自然数理言語における定理証明は、数学の進歩と教育において中心的な役割を果たす。
本研究では,背景参照を条件づけて証明を生成する言語モデルであるNaturalProverを開発する。
NaturalProverは、短い(2-6ステップ)証明を必要とするいくつかの定理を証明でき、40%の時間で正しいと評価された次のステップの提案を提供することができる。
論文 参考訳(メタデータ) (2022-05-25T17:01:18Z) - Polynomial Graph Parsing with Non-Structural Reentrancies [0.2867517731896504]
グラフベースの意味表現は自然言語処理に有用である。
非構造的再帰性を持つグラフを生成するグラフ拡張文法を導入する。
本論文では,グラフ拡張文法の構文解析アルゴリズムを提案する。
論文 参考訳(メタデータ) (2021-05-05T13:05:01Z) - NaturalProofs: Mathematical Theorem Proving in Natural Language [132.99913141409968]
数学的ステートメントの多領域コーパスであるNaturalProofsとその証明を開発した。
NaturalProofsは広範なカバレッジ、深いカバレッジ、低リソースの数学的ソースを統一する。
数式参照検索と生成タスクに関する強力なニューラルネットワーク手法をベンチマークする。
論文 参考訳(メタデータ) (2021-03-24T03:14:48Z) - Natural Language Premise Selection: Finding Supporting Statements for
Mathematical Text [3.42658286826597]
提案するNLPタスクは,サポート定義の検索や提案の支持に使用される自然前提選択である。
また、NL-PSというデータセットを利用可能にすることで、自然環境選択タスクに対する様々なアプローチを評価することができる。
論文 参考訳(メタデータ) (2020-04-30T17:08:03Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。