論文の概要: Extracting Mathematical Concepts from Text
- arxiv url: http://arxiv.org/abs/2208.13830v1
- Date: Mon, 29 Aug 2022 18:45:05 GMT
- ステータス: 処理完了
- システム内更新日: 2022-08-31 12:57:30.747652
- Title: Extracting Mathematical Concepts from Text
- Title(参考訳): テキストから数学的概念を抽出する
- Authors: Jacob Collard and Valeria de Paiva and Brendan Fong and Eswaran
Subrahmanian
- Abstract要約: 4つの用語抽出器について検討し,その結果を比較した。
この小さな実験は、ノイズの多いドメインテキストから抽出された用語の構成と評価に関するいくつかの問題を示す。
- 参考スコア(独自算出の注目度): 0.49115431920688846
- License: http://creativecommons.org/licenses/by-sa/4.0/
- Abstract: We investigate different systems for extracting mathematical entities from
English texts in the mathematical field of category theory as a first step for
constructing a mathematical knowledge graph. We consider four different term
extractors and compare their results. This small experiment showcases some of
the issues with the construction and evaluation of terms extracted from noisy
domain text. We also make available two open corpora in research mathematics,
in particular in category theory: a small corpus of 755 abstracts from the
journal TAC (3188 sentences), and a larger corpus from the nLab community wiki
(15,000 sentences).
- Abstract(参考訳): 数学知識グラフ構築のための第1ステップとして,カテゴリ理論の数学的分野における英語テキストから数学的実体を抽出するシステムについて検討する。
4つの用語抽出器について検討し,その結果を比較した。
この小さな実験は、ノイズの多いドメインテキストから抽出された用語の構成と評価に関するいくつかの問題を示す。
また,研究数学,特にカテゴリ理論において,学術誌 tac (3188文) の755の抽象の小さなコーパスと,nlab community wiki (15,000文) のより大きなコーパスの2つのオープンコーパスを利用可能にする。
関連論文リスト
- Mathematical Entities: Corpora and Benchmarks [0.8766411351797883]
数学テキストに対する自然言語処理の研究は比較的少ない。
我々は、異なる文脈で数学の言語を研究するのに使用できる注釈付きコーパスを提供する。
論文 参考訳(メタデータ) (2024-06-17T14:11:00Z) - Extracting Mathematical Concepts with Large Language Models [6.371906893858652]
我々は,2020年ごろのオンライン雑誌『カテゴリの理論と応用』のスナップショットから,755の抽象概念をコーパスとして,ある数学分野における用語の自動抽出を目指す。
数学用語の抽出がそもそも難しい問題となる理由を、より徹底的に分析する。
我々は、数学以外のあらゆる分野に適用可能な、人間がATEを扱うのを助ける新しいアノテーションツールを導入する。
論文 参考訳(メタデータ) (2023-08-29T20:54:50Z) - Parmesan: mathematical concept extraction for education [0.5520082338220947]
本研究では,カテゴリー論の分野に焦点をあて,文脈における数学的概念の探索と定義を行うプロトタイプシステムの開発を行う。
このシステムは、概念抽出、関係抽出、定義抽出、エンティティリンクを含む自然言語処理コンポーネントに依存している。
また,ジャーナル記事やウィキページをベースとしたプロトタイプシステムを利用した2つのクリーンな数学的コーパスも提供する。
論文 参考訳(メタデータ) (2023-07-13T11:55:03Z) - OntoMath${}^{\mathbf{PRO}}$ 2.0 Ontology: Updates of the Formal Model [68.8204255655161]
主な関心は、Open Linked Dataクラウドにおける数学的ステートメントを表現するための形式モデルの開発である。
提案モデルは、自然言語の数学的テキストから数学的事実を抽出し、これらの事実をLinked Open Dataとして表現するアプリケーションを対象としている。
このモデルは OntoMath$mathrmPRO$ ontology of professional mathematics の新バージョンの開発に使用される。
論文 参考訳(メタデータ) (2023-03-17T20:29:17Z) - Tree-Based Representation and Generation of Natural and Mathematical
Language [77.34726150561087]
科学コミュニケーションと教育シナリオにおける数学的言語は重要であるが、比較的研究されている。
数学言語に関する最近の研究は、スタンドアローンな数学的表現や、事前訓練された自然言語モデルにおける数学的推論に焦点をあてている。
テキストと数学を共同で表現・生成するために,既存の言語モデルに対する一連の修正を提案する。
論文 参考訳(メタデータ) (2023-02-15T22:38:34Z) - Self-Supervised Pretraining of Graph Neural Network for the Retrieval of
Related Mathematical Expressions in Scientific Articles [8.942112181408156]
本稿では,機械学習に基づく数学的表現の検索手法を提案する。
埋め込み学習と自己教師型学習を組み合わせた教師なし表現学習タスクを設計する。
arXiv.orgで発行された90,000以上の出版物から、9900万以上の数学的表現を持つ巨大なデータセットを収集します。
論文 参考訳(メタデータ) (2022-08-22T12:11:30Z) - An Informational Space Based Semantic Analysis for Scientific Texts [62.997667081978825]
本稿では、意味分析のための計算手法と、短い科学的テキストの意味の定量化について紹介する。
科学的意味の表現は、心理的特性ではなく、状況表現を置き換えることで標準化される。
本研究は,テキストの意味の幾何学的表現の基礎となる研究である。
論文 参考訳(メタデータ) (2022-05-31T11:19:32Z) - Syllabic Quantity Patterns as Rhythmic Features for Latin Authorship
Attribution [74.27826764855911]
我々は、ラテン散文の計算的オーサシップ属性のタスクにおいて、リズミカルな特徴を導出する基盤として、音節量を用いる。
2つの異なる機械学習手法を用いて3つの異なるデータセットを用いて実験を行い、音節量に基づくリズム特徴がラテン散文の著者の識別に有用であることを示した。
論文 参考訳(メタデータ) (2021-10-27T06:25:31Z) - Machine-Learning Mathematical Structures [0.0]
本稿では,様々な問題に対するアキュラティシーの比較研究を行う。
このパラダイムは、予想の定式化、より効率的な計算方法の発見、数学における特定の構造階層の探索に有用である。
論文 参考訳(メタデータ) (2021-01-15T22:48:19Z) - A Comparative Study on Structural and Semantic Properties of Sentence
Embeddings [77.34726150561087]
本稿では,関係抽出に広く利用されている大規模データセットを用いた実験セットを提案する。
異なる埋め込み空間は、構造的および意味的特性に対して異なる強度を持つことを示す。
これらの結果は,埋め込み型関係抽出法の開発に有用な情報を提供する。
論文 参考訳(メタデータ) (2020-09-23T15:45:32Z) - Extractive Summarization as Text Matching [123.09816729675838]
本稿では,ニューラル抽出要約システムの構築方法に関するパラダイムシフトを作成する。
抽出した要約タスクを意味テキストマッチング問題として定式化する。
我々はCNN/DailyMailの最先端抽出結果を新しいレベル(ROUGE-1の44.41)に推し進めた。
論文 参考訳(メタデータ) (2020-04-19T08:27:57Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。