Fugu-MT 論文翻訳(概要): E-Gen: Leveraging E-Graphs to Improve Continuous Representations of Symbolic Expressions

論文の概要: E-Gen: Leveraging E-Graphs to Improve Continuous Representations of Symbolic Expressions

arxiv url: http://arxiv.org/abs/2501.14951v2
Date: Sun, 09 Mar 2025 20:31:19 GMT
ステータス: 翻訳完了
システム内更新日: 2025-03-11 20:09:43.918565
Title: E-Gen: Leveraging E-Graphs to Improve Continuous Representations of Symbolic Expressions
Title（参考訳）: E-Gen: 記号表現の連続表現を改善するためにE-Graphを活用する
Authors: Hongbo Zheng, Suyuan Wang, Neeraj Gangwar, Nickvash Kani,
Abstract要約: 大規模かつ多様な数学的表現データセットを合成する新しい電子グラフベースのデータセット生成スキームであるE-Genを紹介する。数学的に等価な表現を生成するための2つの戦略と、等価な表現を明示的にグループ化するための対照的な学習を用いて埋め込みモデルを訓練する。組込み型アプローチは、いくつかのタスクにおいて最先端の大規模言語モデルよりも優れていることを実証する。
参考スコア（独自算出の注目度）: 0.33748750222488655
License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
Abstract: Vector representations have been pivotal in advancing natural language processing (NLP), with prior research focusing on embedding techniques for mathematical expressions using mathematically equivalent formulations. While effective, these approaches are constrained by the size and diversity of training data. In this work, we address these limitations by introducing E-Gen, a novel e-graph-based dataset generation scheme that synthesizes large and diverse mathematical expression datasets, surpassing prior methods in size and operator variety. Leveraging this dataset, we train embedding models using two strategies: (1) generating mathematically equivalent expressions, and (2) contrastive learning to explicitly group equivalent expressions. We evaluate these embeddings on both in-distribution and out-of-distribution mathematical language processing tasks, comparing them against prior methods. Finally, we demonstrate that our embedding-based approach outperforms state-of-the-art large language models (LLMs) on several tasks, underscoring the necessity of optimizing embedding methods for the mathematical data modality. The source code and datasets are available at https://github.com/MLPgroup/E-Gen.
Abstract（参考訳）: ベクトル表現は、数学的に等価な定式化を用いた数学的表現の埋め込み技術に焦点を当てた、自然言語処理(NLP)の進歩において重要な役割を担っている。効果はあるものの、これらのアプローチはトレーニングデータのサイズと多様性によって制約される。本研究では,電子グラフに基づく新しいデータセット生成手法であるE-Genを導入することにより,これらの制約に対処する。このデータセットを利用することで,(1)数学的に等価な表現を生成すること,(2)表現を明示的にグループ化するために対照的な学習を行うこと,の2つの戦略を用いて埋め込みモデルを訓練する。本研究では,これらの埋め込みを,従来の手法と比較し,分布内および分布外両方の数学的言語処理タスクに対して評価する。最後に, 組込みに基づく手法は, 数学データモダリティに対する組込み手法の最適化の必要性を浮き彫りにして, いくつかのタスクにおいて, 最先端の大規模言語モデル(LLM)よりも優れていることを示す。ソースコードとデータセットはhttps://github.com/MLPgroup/E-Gen.comで公開されている。

関連論文リスト

Bridging the Domain Gap in Equation Distillation with Reinforcement Feedback [37.06543502352577]
データ2Eqnタスクの基本モデルのドメイン適応性を高めるための強化学習に基づく微調整フレームワークを提案する。提案手法により,モデルが特定の複雑なデータ分布に適応し,数学的に意味のある方程式を生成することができる。
論文参考訳（メタデータ） (2025-05-21T14:25:41Z)
Relation-Aware Graph Foundation Model [21.86954503656643]
グラフ基礎モデル (GFMs) がグラフ学習において有望な方向として登場した。明示的なトークン表現に依存する言語モデルとは異なり、グラフは一般化のための明確に定義された単位を持たない。 GFMの基本単位として関係トークンを利用する新しいフレームワークREEFを提案する。
論文参考訳（メタデータ） (2025-05-17T14:34:41Z)
MathFimer: Enhancing Mathematical Reasoning by Expanding Reasoning Steps through Fill-in-the-Middle Task [49.355810887265925]
数学的推論ステップ拡張のための新しいフレームワークであるMathFimerを紹介する。我々は、慎重にキュレートしたNuminaMath-FIMデータセットに基づいて、特殊モデルMathFimer-7Bを開発した。次に、これらのモデルを適用して、解鎖に詳細な中間ステップを挿入することで、既存の数学的推論データセットを強化する。
論文参考訳（メタデータ） (2025-02-17T11:22:24Z)
Tensor Network Estimation of Distribution Algorithms [0.0]
近年の論文では、テンソルネットワークを進化最適化アルゴリズムに統合する手法が登場している。これらの手法の最適化性能は, 生成モデルのパワーと直接的に関係しないことがわかった。これを踏まえると、生成モデルの出力に明示的な突然変異演算子を加えることで、最適化性能が向上することがしばしばある。
論文参考訳（メタデータ） (2024-12-27T18:22:47Z)
Interpetable Target-Feature Aggregation for Multi-Task Learning based on Bias-Variance Analysis [53.38518232934096]
マルチタスク学習(MTL)は、タスク間の共有知識を活用し、一般化とパフォーマンスを改善するために設計された強力な機械学習パラダイムである。本稿では,タスククラスタリングと特徴変換の交点におけるMTL手法を提案する。両段階において、鍵となる側面は減った目標と特徴の解釈可能性を維持することである。
論文参考訳（メタデータ） (2024-06-12T08:30:16Z)
Sample Complexity Characterization for Linear Contextual MDPs [67.79455646673762]
文脈決定プロセス(CMDP)は、遷移カーネルと報酬関数がコンテキスト変数によってインデックス付けされた異なるMDPで時間とともに変化できる強化学習のクラスを記述する。 CMDPは、時間とともに変化する環境で多くの現実世界のアプリケーションをモデル化するための重要なフレームワークとして機能する。 CMDPを2つの線形関数近似モデルで検討する: 文脈変化表現とすべての文脈に対する共通線形重み付きモデルIと、すべての文脈に対する共通表現と文脈変化線形重み付きモデルIIである。
論文参考訳（メタデータ） (2024-02-05T03:25:04Z)
Mathematical Language Models: A Survey [29.419915295762692]
本稿では,2つの異なる視点 – タスクと方法論 – から重要な研究成果を体系的に分類する,数学的 LM の総合的な調査を行う。この調査では、トレーニングデータセット、ベンチマークデータセット、拡張データセットなど、60以上の数学的データセットのコンパイルがカバーされている。
論文参考訳（メタデータ） (2023-12-12T01:39:16Z)
Investigating Masking-based Data Generation in Language Models [0.0]
BERTと類似したアーキテクチャを持つモデルの特徴は、マスキング言語モデリングの目的である。データ拡張は、機械学習で広く使われているデータ駆動技術である。最近の研究は、NLP下流タスクのための人工的な拡張データを生成するためにマスク付き言語モデルを利用している。
論文参考訳（メタデータ） (2023-06-16T16:48:27Z)
BERT is not The Count: Learning to Match Mathematical Statements with Proofs [34.61792250254876]
この課題は、数学的情報検索に関する現在の研究や、より一般的には、数学的記事分析に当てはまる。現代数学研究論文から抽出した180k以上の文対からなるデータセットについて述べる。本稿では,文と証明を効果的にマッチングする双線形類似モデルと2つの復号法を提案する。
論文参考訳（メタデータ） (2023-02-18T14:48:20Z)
ProjB: An Improved Bilinear Biased ProjE model for Knowledge Graph Completion [1.5576879053213302]
この研究は、計算の複雑さが低く、モデル改善の可能性が高いため、ProjE KGEを改善する。 FB15KやWN18のようなベンチマーク知識グラフ(KG)の実験結果から、提案手法はエンティティ予測タスクにおける最先端モデルよりも優れていることが示された。
論文参考訳（メタデータ） (2022-08-15T18:18:05Z)
Understanding High Dimensional Spaces through Visual Means Employing Multidimensional Projections [0.0]
データ視覚化分野における関連する2つのアルゴリズムは、t分散近傍埋め込み(t-SNE)とLSP(Last-Square Projection)である。これらのアルゴリズムは、データセットへの影響を含む、いくつかの数学的機能を理解するために使用することができる。本稿では,多次元投影アルゴリズムの視覚的結果を用いて,それらの数学的枠組みのパラメータを理解・微調整する方法について述べる。
論文参考訳（メタデータ） (2022-07-12T20:30:33Z)
Improving Pre-trained Language Model Fine-tuning with Noise Stability Regularization [94.4409074435894]
本稿では,LNSR(Layerwise Noise Stability Regularization)という,新規かつ効果的な微調整フレームワークを提案する。具体的には、標準ガウス雑音を注入し、微調整モデルの隠れ表現を正規化することを提案する。提案手法は,L2-SP,Mixout,SMARTなど他の最先端アルゴリズムよりも優れていることを示す。
論文参考訳（メタデータ） (2022-06-12T04:42:49Z)
Syntax-Aware Network for Handwritten Mathematical Expression Recognition [53.130826547287626]
手書き数式認識(HMER)は、多くの潜在的な応用が可能な課題である。 HMERの最近の手法はエンコーダ・デコーダアーキテクチャで優れた性能を実現している。本稿では,構文情報をエンコーダ・デコーダネットワークに組み込んだHMERの簡易かつ効率的な手法を提案する。
論文参考訳（メタデータ） (2022-03-03T09:57:19Z)
Improving Non-autoregressive Generation with Mixup Training [51.61038444990301]
本稿では,事前学習したトランスモデルに基づく非自己回帰生成モデルを提案する。我々はMIxソースと擬似ターゲットという,シンプルで効果的な反復訓練手法を提案する。質問生成,要約,パラフレーズ生成を含む3つの世代ベンチマーク実験により,提案手法が新たな最先端結果を実現することを示す。
論文参考訳（メタデータ） (2021-10-21T13:04:21Z)
Improving Compositional Generalization with Self-Training for Data-to-Text Generation [36.973617793800315]
データ・テキスト・タスクにおける現在の生成モデルの合成一般化について検討する。構成的気象データセットの構造変化をシミュレートすることにより、T5モデルは目に見えない構造に一般化できないことを示す。擬似応答選択のための細調整BLEURTを用いた自己学習に基づく手法を提案する。
論文参考訳（メタデータ） (2021-10-16T04:26:56Z)
Dual Optimization for Kolmogorov Model Learning Using Enhanced Gradient Descent [8.714458129632158]
コルモゴロフモデル(コルモゴロフモデル、英: Kolmogorov model、KM)は、確率変数の集合の基本的な確率構造を学ぶための解釈可能で予測可能な表現手法である。正規化双対最適化と拡張勾配降下法(GD)を併用した計算スケーラブルなKM学習アルゴリズムを提案する。提案したKM学習アルゴリズムを用いた論理的関係マイニングの精度は80%以上である。
論文参考訳（メタデータ） (2021-07-11T10:33:02Z)
Learning to Synthesize Data for Semantic Parsing [57.190817162674875]
本稿では,プログラムの構成をモデル化し,プログラムを発話にマップする生成モデルを提案する。 PCFGと事前学習されたBARTの簡易性により,既存のデータから効率的に生成モデルを学習することができる。 GeoQuery と Spider の標準ベンチマークで解析する text-to-Query の in-domain と out-of-domain の両方で、この手法を評価します。
論文参考訳（メタデータ） (2021-04-12T21:24:02Z)
SDA: Improving Text Generation with Self Data Augmentation [88.24594090105899]
自動データ拡張のための自己模倣学習フェーズを組み込むことにより,標準最大確率推定(MLE)パラダイムを改善することを提案する。既存の文レベルの拡張戦略とは異なり,本手法はより汎用的で,任意のMLEベースの訓練手順に容易に適応できる。
論文参考訳（メタデータ） (2021-01-02T01:15:57Z)
Multiple Word Embeddings for Increased Diversity of Representation [15.279850826041066]
本稿では,実行時間の増加を無視できるような,強いベースライン上での性能を実質的に一貫的に向上させる手法を示す。我々は、事前学習した埋め込み類似性と語彙被覆の側面を分析し、表現多様性がなぜこの技術が機能するかの原動力であることを見出した。
論文参考訳（メタデータ） (2020-09-30T02:33:09Z)
Stochastic Flows and Geometric Optimization on the Orthogonal Group [52.50121190744979]
直交群 $O(d)$ 上の幾何駆動最適化アルゴリズムの新しいクラスを示す。提案手法は,深層,畳み込み,反復的なニューラルネットワーク,強化学習,フロー,メトリック学習など,機械学習のさまざまな分野に適用可能であることを示す。
論文参考訳（メタデータ） (2020-03-30T15:37:50Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。