論文の概要: SSEmb: A Joint Structural and Semantic Embedding Framework for Mathematical Formula Retrieval
- arxiv url: http://arxiv.org/abs/2508.04162v1
- Date: Wed, 06 Aug 2025 07:39:17 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-08-07 20:09:22.596502
- Title: SSEmb: A Joint Structural and Semantic Embedding Framework for Mathematical Formula Retrieval
- Title(参考訳): SSEmb: 数学的フォーミュラ検索のための複合構造とセマンティックな埋め込みフレームワーク
- Authors: Ruyin Li, Xiaoyu Chen,
- Abstract要約: 数式の構造的特徴と意味的特徴の両方を捉えることができる新しい埋め込みフレームワークであるSSEmbを提案する。
ARQMath-3 式検索タスクでは,SSEmb は P'@10 および nDCG'@10 において,既存の埋め込み方式よりも5 ポイント以上優れている。
- 参考スコア(独自算出の注目度): 5.2320792273454595
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Formula retrieval is an important topic in Mathematical Information Retrieval. We propose SSEmb, a novel embedding framework capable of capturing both structural and semantic features of mathematical formulas. Structurally, we employ Graph Contrastive Learning to encode formulas represented as Operator Graphs. To enhance structural diversity while preserving mathematical validity of these formula graphs, we introduce a novel graph data augmentation approach through a substitution strategy. Semantically, we utilize Sentence-BERT to encode the surrounding text of formulas. Finally, for each query and its candidates, structural and semantic similarities are calculated separately and then fused through a weighted scheme. In the ARQMath-3 formula retrieval task, SSEmb outperforms existing embedding-based methods by over 5 percentage points on P'@10 and nDCG'@10. Furthermore, SSEmb enhances the performance of all runs of other methods and achieves state-of-the-art results when combined with Approach0.
- Abstract(参考訳): フォーミュラ検索は数学的情報検索において重要なトピックである。
数式の構造的特徴と意味的特徴の両方を捉えることができる新しい埋め込みフレームワークであるSSEmbを提案する。
構造的には,演算子グラフを表す公式を符号化するために,グラフコントラスト学習を用いる。
これらの式グラフの数学的妥当性を維持しつつ構造的多様性を高めるために,置換戦略による新しいグラフデータ拡張手法を提案する。
セマンティックに、センテンス-BERTを用いて、周辺式をエンコードする。
最後に、各クエリとその候補について、構造的および意味的類似性を別々に計算し、重み付けされたスキームで融合する。
ARQMath-3 式検索タスクでは,SSEmb は P'@10 および nDCG'@10 において,既存の埋め込み方式よりも5 ポイント以上優れている。
さらに、SSEmbは、他のメソッドの全ての実行性能を高め、Amps0と組み合わせることで、最先端の結果を得る。
関連論文リスト
- MAMUT: A Novel Framework for Modifying Mathematical Formulas for the Generation of Specialized Datasets for Language Model Training [7.164697875838552]
本研究は,数学的内容のエンコーディングを強化するための専門訓練データセットの開発に焦点をあてる。
そこで我々は,与えられた数学的公式の等価かつファルシフィケートなバージョンを生成可能なフレームワークであるMath Mutator (MAMUT)を紹介した。
実験により、これらのデータセットでトレーニングされたモデルは、数学的検索タスクにおいて新しいSoTA性能を示すことが示された。
論文 参考訳(メタデータ) (2025-02-28T08:53:42Z) - E-Gen: Leveraging E-Graphs to Improve Continuous Representations of Symbolic Expressions [0.33748750222488655]
大規模かつ多様な数学的表現データセットを合成する新しい電子グラフベースのデータセット生成スキームであるE-Genを紹介する。
数学的に等価な表現を生成するための2つの戦略と、等価な表現を明示的にグループ化するための対照的な学習を用いて埋め込みモデルを訓練する。
組込み型アプローチは、いくつかのタスクにおいて最先端の大規模言語モデルよりも優れていることを実証する。
論文 参考訳(メタデータ) (2025-01-24T22:39:08Z) - A Top-down Graph-based Tool for Modeling Classical Semantic Maps: A Crosslinguistic Case Study of Supplementary Adverbs [50.982315553104975]
セマンティックマップモデル(SMM)は、言語横断的なインスタンスや形式からネットワークのような概念空間を構築する。
ほとんどのSMMは、ボトムアップ手順を使用して、人間の専門家によって手動で構築される。
本稿では,概念空間とSMMをトップダウンで自動生成するグラフベースの新しいアルゴリズムを提案する。
論文 参考訳(メタデータ) (2024-12-02T12:06:41Z) - From Exponential to Polynomial Complexity: Efficient Permutation Counting with Subword Constraints [0.0]
置換による異なる置換を数えることは、特に複数のサブワードを含む場合、分析における長年の課題である。
本稿では,置換による異なる置換を計算するための閉形式式を示す新しいフレームワークを提案する。
次に、新たな式を開発することにより、基本公式を複数のサブワードを扱うように拡張する。
論文 参考訳(メタデータ) (2024-11-23T19:52:11Z) - Local and Global Graph Modeling with Edge-weighted Graph Attention Network for Handwritten Mathematical Expression Recognition [3.419173524128023]
エッジ重み付きグラフ注意機構(EGAT)を用いたエンドツーエンドモデルを導入し,ノードとエッジの同時分類を行う。
また,局所(LGM)情報とグローバル(GGM)情報の両方に対して,ストロークレベルのグラフモデリング手法を提案する。
本システムは,記号検出,関係分類,表現レベルの認識において優れた性能を示す。
論文 参考訳(メタデータ) (2024-10-24T08:59:27Z) - A Neural Rewriting System to Solve Algorithmic Problems [47.129504708849446]
ネストされた数学的公式を解くための一般的な手順を学習するために設計されたモジュラーアーキテクチャを提案する。
シンボリック人工知能の古典的なフレームワークである書き換えシステムに触発され、アーキテクチャには3つの専門的で対話的なモジュールが含まれます。
我々は、系統的な一般化に特化した最近のモデルであるNeural Data Routerと、先進的なプロンプト戦略で探索された最先端の大規模言語モデル(GPT-4)とを比較した。
論文 参考訳(メタデータ) (2024-02-27T10:57:07Z) - Bures-Wasserstein Means of Graphs [60.42414991820453]
本研究では,スムーズなグラフ信号分布の空間への埋め込みを通じて,グラフ平均を定義する新しいフレームワークを提案する。
この埋め込み空間において平均を求めることにより、構造情報を保存する平均グラフを復元することができる。
我々は,新しいグラフの意味の存在と特異性を確立し,それを計算するための反復アルゴリズムを提供する。
論文 参考訳(メタデータ) (2023-05-31T11:04:53Z) - Calc-X and Calcformers: Empowering Arithmetical Chain-of-Thought through
Interaction with Symbolic Systems [2.867517731896504]
Calc-Xは、連鎖推論における計算機の適切な使用を示すデータセットの集合である。
Calc-Xは、シンボルシステムに計算をオフロードする言語モデルを教えるのに適している。
新しいCalc-Xコレクションを使用して、Calcformersと呼ばれるオープンソースの電卓使用モデルをトレーニングしています。
論文 参考訳(メタデータ) (2023-05-24T10:58:20Z) - Syntax-Aware Network for Handwritten Mathematical Expression Recognition [53.130826547287626]
手書き数式認識(HMER)は、多くの潜在的な応用が可能な課題である。
HMERの最近の手法はエンコーダ・デコーダアーキテクチャで優れた性能を実現している。
本稿では,構文情報をエンコーダ・デコーダネットワークに組み込んだHMERの簡易かつ効率的な手法を提案する。
論文 参考訳(メタデータ) (2022-03-03T09:57:19Z) - Symmetric Spaces for Graph Embeddings: A Finsler-Riemannian Approach [7.752212921476838]
表現学習における対称空間の体系的利用を提案する。
本研究では,組込み解析ツールを開発し,データセットの構造的特性を推定する。
提案手法は, 各種合成および実世界のデータセット上でのグラフ再構成タスクにおいて, 競合的ベースラインよりも優れる。
論文 参考訳(メタデータ) (2021-06-09T09:33:33Z) - BASS: Boosting Abstractive Summarization with Unified Semantic Graph [49.48925904426591]
BASSは、統合されたセマンティックグラフに基づく抽象的な要約を促進するためのフレームワークである。
文書表現と要約生成の両方を改善するために,グラフベースのエンコーダデコーダモデルを提案する。
実験結果から,提案アーキテクチャは長期文書および複数文書要約タスクに大幅な改善をもたらすことが示された。
論文 参考訳(メタデータ) (2021-05-25T16:20:48Z) - MathBERT: A Pre-Trained Model for Mathematical Formula Understanding [12.721947240253977]
本稿では,数学的公式とそれに対応する文脈を併用した新しい事前学習モデル,textbfMathBERTを提案する。
我々は,数学情報検索,公式トピック分類,公式見出し生成など,3つの下流タスクについて様々な実験を行い,MathBERTの性能評価を行った。
我々は,この事前学習モデルが式の意味レベル構造情報を効果的にキャプチャできることを定性的に示す。
論文 参考訳(メタデータ) (2021-05-02T02:10:31Z) - Structural Adapters in Pretrained Language Models for AMR-to-text
Generation [59.50420985074769]
グラフ構造データからのテキスト生成に関するこれまでの研究は、事前学習言語モデル(plm)に依存している。
グラフ構造をPLMにエンコードするアダプタ法であるStructAdaptを提案する。
論文 参考訳(メタデータ) (2021-03-16T15:06:50Z) - Automated Concatenation of Embeddings for Structured Prediction [75.44925576268052]
本稿では, 埋め込みの自動結合(ACE)を提案し, 構造予測タスクにおける埋め込みのより優れた結合を見つけるプロセスを自動化する。
我々は、強化学習の戦略に従い、制御器のパラメータを最適化し、タスクモデルの精度に基づいて報酬を計算する。
論文 参考訳(メタデータ) (2020-10-10T14:03:20Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。