論文の概要: Steerable Instruction Following Coding Data Synthesis with Actor-Parametric Schema Co-Evolution
- arxiv url: http://arxiv.org/abs/2604.16322v1
- Date: Fri, 27 Feb 2026 21:31:41 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-05-04 02:32:13.884557
- Title: Steerable Instruction Following Coding Data Synthesis with Actor-Parametric Schema Co-Evolution
- Title(参考訳): Actor-Parametric Schema共進化による符号化データ合成の安定的指導
- Authors: Tinglin Huang, Bo Chen, Xiao Zhang, Kai Shen, Rex Ying,
- Abstract要約: IFCodeEvolveは,大規模命令ペアプログラミングデータを合成するフレームワークである。
IFCodeEvolveはベースモデルの性能を大幅に向上させ,我々の32BモデルはプロプライエタリなSOTAモデルと同等であることを示す。
我々はまた、ソリューションと堅牢なASTベースの検証を備えた総合的人間認証ベンチマークIFCodeBenchにも貢献する。
- 参考スコア(独自算出の注目度): 30.919665619254
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Interpreting and following human instructions is a critical capability of large language models (LLMs) in automatic programming. However, synthesizing large-scale instruction-paired coding data remains largely unexplored and is particularly challenging when ensuring logical compatibility among multiple constraints. In this study, we propose IFCodeEvolve, an actor-schema co-evolution framework for instruction following coding data generation. By representing instructions as parametric function schema, we construct a library that covers the vast instruction space via dynamic constraint instantiation. Building upon this, Monte Carlo Tree Search (MCTS) sampler is applied to efficiently navigate this space, utilizing actor model feedback as a dynamic termination signal. Furthermore, to progressively explore challenging problems, we introduce a co-evolving paradigm that iteratively advances both the actor model and the schema library, via schema composition and mutation, based on sampler statistics. Empirical results demonstrate that IFCodeEvolve significantly boosts base model performance, with our 32B model achieving parity with proprietary SOTA models. Additionally, we contribute IFCodeBench, a comprehensive human-verified benchmark equipped with solutions and robust AST-based verification.
- Abstract(参考訳): 人間の指示を解釈し従うことは、自動プログラミングにおける大規模言語モデル(LLM)の重要な能力である。
しかし、大規模命令対ペア符号化データの合成は未解決のままであり、複数の制約間の論理的整合性を確保することは特に困難である。
本研究では,アクタ-スキーマ共進化フレームワークIFCodeEvolveを提案する。
命令をパラメトリック関数スキーマとして表現することにより、動的制約インスタンス化によって広大な命令空間をカバーするライブラリを構築する。
これに基づいて、モンテカルロ木探索(MCTS)サンプリング装置を用いて、アクターモデルフィードバックを動的終端信号として利用して、この空間を効率的にナビゲートする。
さらに,課題を段階的に探求するために,サンプル統計に基づくスキーマ構成と突然変異を用いてアクターモデルとスキーマライブラリの両方を反復的に進化させる共進化パラダイムを導入する。
その結果、IFCodeEvolveはベースモデルの性能を大幅に向上させ、我々の32BモデルはプロプライエタリなSOTAモデルと同等であることがわかった。
さらに、ソリューションと堅牢なASTベースの検証を備えた総合的人間検証ベンチマークIFCodeBenchを寄贈する。
関連論文リスト
- Every Step Counts: Decoding Trajectories as Authorship Fingerprints of dLLMs [63.82840470917859]
本稿では,dLLMの復号化機構をモデル属性の強力なツールとして利用できることを示す。
本稿では、デコードステップ間の構造的関係を捉え、モデル固有の振る舞いをよりよく明らかにする、DDM(Directed Decoding Map)と呼ばれる新しい情報抽出手法を提案する。
論文 参考訳(メタデータ) (2025-10-02T06:25:10Z) - Negative Matters: Multi-Granularity Hard-Negative Synthesis and Anchor-Token-Aware Pooling for Enhanced Text Embeddings [25.565372681837697]
クエリに類似するレベルが異なる多様な負のサンプルを生成するために,マルチグラニュラリティ・ハード負(MGH)合成フレームワークを導入する。
また,Anchor Token Aware(ATA)プーリング手法を提案する。
論文 参考訳(メタデータ) (2025-08-31T13:24:48Z) - Structural Similarity-Inspired Unfolding for Lightweight Image Super-Resolution [88.20464308588889]
効率的な画像SRのための構造類似インスパイアド・アンフォールディング(SSIU)法を提案する。
この方法は、構造的類似性に制約されたSR最適化関数の展開によって設計される。
我々のモデルは現在の最先端モデルより優れており、パラメータ数が低く、メモリ消費が減少している。
論文 参考訳(メタデータ) (2025-06-13T14:29:40Z) - EpiCoder: Encompassing Diversity and Complexity in Code Generation [66.43738008739555]
既存のコード生成方法はシードデータとしてコードスニペットを使用する。
階層的なコード機能を中心に展開する,新しい機能ツリーベースの合成フレームワークを提案する。
我々のフレームワークは、生成されたコードの複雑さを正確に制御し、関数レベルの操作からマルチファイルのシナリオまで幅広い機能を実現する。
論文 参考訳(メタデータ) (2025-01-08T18:58:15Z) - LLM as a code generator in Agile Model Driven Development [0.032771631221674334]
この研究は、これらの課題を克服するための実行可能な戦略としてモデル駆動開発(MDD)を擁護します。
我々は GPT4 をコードジェネレータとして利用する Agile Model Driven Development (AMDD) アプローチを提案する。
GPT4自動生成機能を適用すると、JADEおよびPADEフレームワークと互換性のあるJavaとPythonコードが生成される。
論文 参考訳(メタデータ) (2024-10-24T07:24:11Z) - Disentanglement via Latent Quantization [60.37109712033694]
本研究では,組織化された潜在空間からの符号化と復号化に向けた帰納的バイアスを構築する。
本稿では,基本データレコーダ (vanilla autoencoder) と潜時再構成 (InfoGAN) 生成モデルの両方に追加することで,このアプローチの広範な適用性を実証する。
論文 参考訳(メタデータ) (2023-05-28T06:30:29Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。