論文の概要: Darwin Family: MRI-Trust-Weighted Evolutionary Merging for Training-Free Scaling of Language-Model Reasoning
- arxiv url: http://arxiv.org/abs/2605.14386v1
- Date: Thu, 14 May 2026 05:09:12 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-05-15 21:45:34.634561
- Title: Darwin Family: MRI-Trust-Weighted Evolutionary Merging for Training-Free Scaling of Language-Model Reasoning
- Title(参考訳): Darwin ファミリー: 言語モデル推論のトレーニング不要スケーリングのためのMRI-Trust-Weighted Evolutionary Merging
- Authors: Taebong Kim, Youngsik Hong, Minsik Kim, Sunyoung Choi, Jaewon Jang, Junghoon Shin, Minseo Kim,
- Abstract要約: 本稿では、勾配のない重み空間の組換えによる大規模言語モデルの学習自由な進化的融合の枠組みを提案する。
既存のチェックポイントにエンコードされた潜在能力を再編成することにより、追加のトレーニングなしにフロンティアレベルの推論性能を改善することができるかどうかを問う。
Darwin Family氏は、診断誘導型進化的マージは推論中心の言語モデルのためのコストのかかる後トレーニングパイプラインに代わる実用的で再現可能な代替手段である、と説明している。
- 参考スコア(独自算出の注目度): 2.0723828938300684
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: We present Darwin Family, a framework for training-free evolutionary merging of large language models via gradient-free weight-space recombination. We ask whether frontier-level reasoning performance can be improved without additional training, by reorganizing latent capabilities already encoded in existing checkpoints. Darwin introduces three key ideas: (i) a 14-dimensional adaptive merge genome enabling fine-grained component- and block-level recombination; (ii) MRI-Trust Fusion, which adaptively balances diagnostic layer-importance signals with evolutionary search through a learnable trust parameter; and (iii) an Architecture Mapper that enables cross-architecture breeding between heterogeneous model families. Empirically, the flagship Darwin-27B-Opus achieves 86.9% on GPQA Diamond, ranking #6 among 1,252 evaluated models, and outperforming its fully trained foundation model without any gradient-based training. Across scales from 4B to 35B parameters, Darwin models consistently improve over their parents, support recursive multi-generation evolution, and enable a training-free evolutionary merge that combines Transformer- and Mamba-based components. Together, the Darwin Family demonstrates that diagnostic-guided evolutionary merging is a practical and reproducible alternative to costly post-training pipelines for reasoning-centric language models.
- Abstract(参考訳): 我々はDarwin Familyを紹介した。Darwin Familyは、勾配のない重み空間の組換えを通じて、大規模言語モデルのトレーニング不要な進化的マージのためのフレームワークである。
既存のチェックポイントにエンコードされた潜在能力を再編成することにより、追加のトレーニングなしにフロンティアレベルの推論性能を改善することができるかどうかを問う。
Darwin氏は3つの重要なアイデアを紹介している。
(i)細粒度成分及びブロックレベルの組換えが可能な14次元適応マージゲノム
(II)診断層重要信号と学習可能な信頼パラメータによる進化的探索とを適応的にバランスさせるMRI-Trust Fusion
三 異種モデルファミリ間のクロスアーキテクチャの育種を可能にするアーキテクチャマッパー。
実験的に、旗艦ダーウィン-27B-OpusはGPQAダイアモンドで86.9%を達成し、評価モデル1,252のうち6位にランクインし、グラデーションベースの訓練を受けずに完全に訓練された基礎モデルを上回った。
4Bから35Bのパラメータにまたがって、ダーウィンモデルは両親よりも一貫して改善され、再帰的な多世代進化をサポートし、TransformerとMambaベースのコンポーネントを組み合わせた、トレーニングなしの進化的マージを可能にする。
共同でDarwin Familyは、診断誘導の進化的統合は推論中心の言語モデルのためのコストのかかる後処理パイプラインに代わる実用的で再現可能な代替手段であることを示した。
関連論文リスト
- Squeeze Evolve: Unified Multi-Model Orchestration for Verifier-Free Evolution [81.46210789228296]
検証不要な進化推論のための統合型マルチモデルオーケストレーションフレームワークであるSqueeze Evolveを紹介する。
われわれのアプローチは単純な原則で導かれており、最良効能を有するモデル能力を割り当てる。
論文 参考訳(メタデータ) (2026-04-09T02:14:45Z) - Guided Self-Evolving LLMs with Minimal Human Supervision [53.111086364268566]
無誘導の自己進化システムは、しばしば訓練として素早く、または劣化する。
R-Fewはガイド付きセルフプレイチャレンジャー(Self-Play Challenger)買収フレームワークで、コンテキスト内接地と混合トレーニングを通じて、軽量な人間の監視を取り入れている。
R-Fewは、数学と一般的な推論ベンチマークで一貫した反復的な改善を実現している。
論文 参考訳(メタデータ) (2025-12-02T07:06:11Z) - Multi-population GAN Training: Analyzing Co-Evolutionary Algorithms [0.3683202928838613]
GAN(Generative Adversarial Network)は強力な生成モデルであるが,モード崩壊や不安定性などの病態のため,トレーニングが困難である。
近年の研究では、ジェネレータと識別器の個体群が進化する進化的アプローチが研究されている。
本稿では,異なる共進化的GANトレーニング戦略の実証分析を行い,選択と代替メカニズムの影響に着目した。
論文 参考訳(メタデータ) (2025-07-17T14:19:17Z) - DarwinLM: Evolutionary Structured Pruning of Large Language Models [49.55509443720372]
大規模言語モデル(LLM)は様々なNLPタスクで大きな成功を収めた。
構造化プルーニングは、モデルを圧縮し、エンドツーエンドのスピード改善を直接提供する、効果的なソリューションを提供する。
本研究では,構造化プルーニングの訓練手法であるDarwinLMを提案する。
論文 参考訳(メタデータ) (2025-02-11T18:59:35Z) - Evolving Reservoirs for Meta Reinforcement Learning [1.6874375111244329]
本稿では,そのようなプロセスを実現する機構を研究するための計算モデルを提案する。
進化のスケールでは、リカレントニューラルネットワークの族である貯水池を進化させます。
我々は、強化学習(RL)を通じた行動政策の学習を容易にするために、これらの進化した貯水池を利用する。
以上の結果から,貯水池の進化は多様な課題の学習を改善することが示唆された。
論文 参考訳(メタデータ) (2023-12-09T16:11:48Z) - DARLEI: Deep Accelerated Reinforcement Learning with Evolutionary
Intelligence [77.78795329701367]
本稿では,進化アルゴリズムと並列化強化学習を組み合わせたフレームワークであるDARLEIを提案する。
我々はDARLEIの性能を様々な条件で特徴付け、進化形態の多様性に影響を与える要因を明らかにした。
今後DARLEIを拡張して、よりリッチな環境における多様な形態素間の相互作用を取り入れていきたいと考えています。
論文 参考訳(メタデータ) (2023-12-08T16:51:10Z) - eVAE: Evolutionary Variational Autoencoder [40.29009643819948]
変動情報ボトルネック(VIB)理論に基づく進化的変分オートエンコーダ(eVAE)の構築を提案する。
eVAEは変異遺伝的アルゴリズムを、変異突然変異、交叉、進化を含む変異進化演算子とVAEに統合する。
eVAEは、コンペティターよりもコンペティターのリコンストラクションロス、アンタングル、ジェネレーション-推論バランスが向上する。
論文 参考訳(メタデータ) (2023-01-01T23:54:35Z) - Epigenetic opportunities for Evolutionary Computation [0.0]
進化計算(Evolutionary Computation)は、複雑な最適化問題を解くために用いられる生物学的にインスパイアされたアルゴリズムのグループである。
遺伝的遺伝からインスピレーションを得る進化的アルゴリズムと、文化的遺伝からインスピレーションを得るSwarm Intelligenceアルゴリズムに分けることができる。
本稿では, 進化的拡張合成に基づく生物学的枠組みの下で, バイオインスパイアされたアルゴリズムを成功裏に分解する。
論文 参考訳(メタデータ) (2021-08-10T09:44:53Z) - Epigenetic evolution of deep convolutional models [81.21462458089142]
我々は、より深い畳み込みモデルを進化させるために、これまで提案されていた神経進化の枠組みを構築した。
異なる形状と大きさのカーネルを同一層内に共存させる畳み込み層配置を提案する。
提案したレイアウトにより、畳み込み層内の個々のカーネルのサイズと形状を、対応する新しい突然変異演算子で進化させることができる。
論文 参考訳(メタデータ) (2021-04-12T12:45:16Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。