論文の概要: MathAgent: Adversarial Evolution of Constraint Graphs for Mathematical Reasoning Data Synthesis
- arxiv url: http://arxiv.org/abs/2604.11188v1
- Date: Mon, 13 Apr 2026 08:48:12 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-04-14 20:13:16.437185
- Title: MathAgent: Adversarial Evolution of Constraint Graphs for Mathematical Reasoning Data Synthesis
- Title(参考訳): MathAgent: 数学的推論データ合成のための制約グラフの逆進化
- Authors: Zixiong Yu, Jun Rao, Guhan Chen, Songtao Tian, Bohan Li, Jiansheng Wei, Min Zhang, Xiaojun Meng,
- Abstract要約: 本稿では、教師なし最適化問題としてデータ合成を定式化する階層型フレームワークを提案する。
立法者は、問題の制約をコードする構造化された世代図を逆向きに進化させ、執行者はこれらの仕様をさまざまな自然言語シナリオにインスタンス化する。
Qwen, Llama, Mistral, Gemmaの各シリーズの合計10モデルを用いて行った実験により, 本手法が顕著な結果が得られることを示した。
- 参考スコア(独自算出の注目度): 26.328617109421327
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Synthesizing high-quality mathematical reasoning data without human priors remains a significant challenge. Current approaches typically rely on seed data mutation or simple prompt engineering, often suffering from mode collapse and limited logical complexity. This paper proposes a hierarchical synthesis framework that formulates data synthesis as an unsupervised optimization problem over a constraint graph followed by semantic instantiation, rather than treating it as a direct text generation task. We introduce a Legislator-Executor paradigm: The Legislator adversarially evolves structured generation blueprints encoding the constraints of the problem, while the Executor instantiates these specifications into diverse natural language scenarios. This decoupling of skeleton design from linguistic realization enables a prioritized focus on constructing complex and diverse logical structures, thereby guiding high-quality data synthesis. Experiments conducted on a total of 10 models across the Qwen, Llama, Mistral, and Gemma series demonstrate that our method achieves notable results: models fine-tuned on 1K synthesized samples outperform widely-used datasets of comparable scale (LIMO, s1K) across eight mathematical benchmarks, exhibiting superior out-of-distribution generalization.
- Abstract(参考訳): 人間の先入観のない高品質な数学的推論データを合成することは、依然として大きな課題である。
現在のアプローチは通常、シードデータ変異や単純なプロンプトエンジニアリングに依存しており、しばしばモード崩壊と限定的な論理的複雑さに悩まされている。
本稿では,データ合成を直接テキスト生成タスクとして扱うのではなく,制約グラフに続きセマンティックインスタンス化による教師なし最適化問題として定式化する階層型合成フレームワークを提案する。
立法者は、問題の制約をコードする構造化された世代図を逆向きに進化させ、執行者はこれらの仕様をさまざまな自然言語シナリオにインスタンス化する。
この言語的実現からスケルトン設計を分離することで、複雑で多様な論理構造の構築に重点を置き、高品質なデータ合成を導くことができる。
Qwen, Llama, Mistral, Gemma シリーズの合計10モデルを用いて行った実験により,本手法は顕著な結果が得られた。
関連論文リスト
- Agentic Proposing: Enhancing Large Language Model Reasoning via Compositional Skill Synthesis [10.951981109673119]
Agentic Proposingは、問題合成をゴール駆動シーケンシャルな意思決定プロセスとしてモデル化するフレームワークである。
数学、コーディング、科学にまたがる高精度で検証可能な訓練軌道を生成する。
11,000個の合成軌道で訓練された30Bソルバは、AIME25で91.6%の精度を達成する。
論文 参考訳(メタデータ) (2026-02-03T09:02:53Z) - RV-Syn: Rational and Verifiable Mathematical Reasoning Data Synthesis based on Structured Function Library [58.404895570822184]
RV-Synは、新しい数学的合成手法である。
このライブラリからPython形式の関数を組み合わせることで、グラフをソリューションとして生成する。
構築したグラフに基づいて,解誘導論理認識問題生成を実現する。
論文 参考訳(メタデータ) (2025-04-29T04:42:02Z) - GraphMaster: Automated Graph Synthesis via LLM Agents in Data-Limited Environments [32.916371346197835]
GraphMasterは、データ制限された環境でグラフデータ合成用に特別に設計された最初のマルチエージェントフレームワークである。
我々は6つの標準グラフベンチマークの「サブ」変種を新たに開発し、現実的な制約下での合成能力を試験するために特別に設計した。
また,人間の評価とグラスマン多様体に基づく解析を併用した新しい解釈可能性評価フレームワークを開発した。
論文 参考訳(メタデータ) (2025-04-01T12:21:50Z) - Scaling Laws of Synthetic Data for Language Models [125.41600201811417]
プレトレーニングコーパスを多種多様な高品質な合成データセットに変換するスケーラブルなフレームワークであるSynthLLMを紹介した。
提案手法は,グラフアルゴリズムを用いて複数の文書にまたがるハイレベルな概念を自動的に抽出し,再結合することで実現している。
論文 参考訳(メタデータ) (2025-03-25T11:07:12Z) - GRIP: A Graph-Based Reasoning Instruction Producer [47.80560026838563]
textbfGraphベースのtextbfReasoning textbfInstruction textbfProducer について述べる。
論文 参考訳(メタデータ) (2024-12-12T01:52:25Z) - ExeDec: Execution Decomposition for Compositional Generalization in Neural Program Synthesis [54.18659323181771]
プログラム合成において望ましいいくつかの異なる構成一般化形式を特徴付ける。
本稿では,ExeDecを提案する。ExeDecは,実行サブゴールを予測し,各ステップでプログラム実行によって段階的に通知される問題を解くための,新しい分解ベースの戦略である。
論文 参考訳(メタデータ) (2023-07-26T01:07:52Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。