Fugu-MT 論文翻訳(概要): Evo: Autoregressive-Diffusion Large Language Models with Evolving Balance

論文の概要: Evo: Autoregressive-Diffusion Large Language Models with Evolving Balance

arxiv url: http://arxiv.org/abs/2603.06617v1
Date: Fri, 20 Feb 2026 15:26:52 GMT
ステータス: 翻訳完了
システム内更新日: 2026-03-15 16:38:22.442218
Title: Evo: Autoregressive-Diffusion Large Language Models with Evolving Balance
Title（参考訳）: Evo: バランスの進化を伴う自己回帰拡散型大規模言語モデル
Authors: Junde Wu, Minhao Hu, Jiayuan Zhu, Yuyuan Liu, Tianyi Zhang, Kang Li, Jingkun Chen, Jiazhen Pan, Min Xu, Yueming Jin,
Abstract要約: 自己回帰(AR)と拡散に基づく言語生成を橋渡しする二元性潜在軌道モデルである textbfEvo を導入する。各トークンはベクトル値の埋め込みと関連付けられ、[0, 1]$の進行変数$t_iで進化し、その意味的な成熟度を示す。 Evo 8Bは15種類のベンチマークで最先端または高度に競合する結果を得る。
参考スコア（独自算出の注目度）: 29.902058862315915
License: http://creativecommons.org/licenses/by/4.0/
Abstract: We introduce \textbf{Evo}, a duality latent trajectory model that bridges autoregressive (AR) and diffusion-based language generation within a continuous evolutionary generative framework. Rather than treating AR decoding and diffusion generation as separate paradigms, Evo reconceptualizes text generation as a latent flow: each token is associated with a vector-valued embedding that evolves over a progression variable $t_i \in [0, 1]$, indicating its semantic maturity. Low $t_i$ values correspond to confident AR-like refinement, while high values invoke diffusion-style planning, allowing the model to adaptively balance AR and diffusion based on uncertainty. Theoretically, we show that both AR and diffusion models emerge as discretizations of a shared probability flow, and we derive Evo's training objective from a unified variational ELBO. The model is implemented as a time-conditioned Transformer governed by a shared vector field, trained end-to-end to jointly infer latent codes and their progression times. During decoding, Evo performs efficient, semantics-aware refinement, achieving high-quality outputs without sacrificing speed. Empirically, Evo 8B achieves state-of-the-art or highly competitive results on 15 diverse benchmarks, including reasoning (GSM8K, ARC-C), code generation (HumanEval, MBPP), and general language understanding, while maintaining fast inference speed. Our results demonstrate that Evo delivers a new paradigm for LLM design with strong generation quality, robust symbolic reasoning, and decoding efficiency.
Abstract（参考訳）: 本稿では,自己回帰(AR)と拡散に基づく言語生成を連続的進化生成フレームワーク内にブリッジする,双対性潜在軌道モデルである「textbf{Evo}」を紹介する。それぞれのトークンは、進行変数$t_i \in [0, 1]$上で進化するベクトル値の埋め込みと関連付けられ、その意味的な成熟度を示す。低い$t_i$値は自信あるARライクな改善に対応し、高い値は拡散スタイルの計画を呼び起こし、不確実性に基づいたARと拡散の適応的バランスを可能にする。理論的には、ARモデルと拡散モデルの両方が共有確率フローの離散化として出現し、Evoのトレーニング目標を統一変動型ELBOから導出する。このモデルは、共有ベクトルフィールドが支配する時間条件変換器として実装され、遅延コードとその進行時間を共同で推論するように訓練されたエンドツーエンドである。復号化中、Evoは効率よくセマンティクスを意識した改良を行い、速度を犠牲にすることなく高品質な出力を達成する。実証的には、Evo 8Bは推論(GSM8K, ARC-C)、コード生成(HumanEval, MBPP)、一般的な言語理解を含む15の様々なベンチマークにおいて、高速な推論速度を維持しながら、最先端または高い競争力を発揮する。以上の結果から,EvoはLLM設計のパラダイムとして,優れた生成品質,ロバストなシンボル推論,復号効率を実現している。

論文の概要: Evo: Autoregressive-Diffusion Large Language Models with Evolving Balance

関連論文リスト