論文の概要: The MiniMax-M2 Series: Mini Activations Unleashing Max Real-World Intelligence
- arxiv url: http://arxiv.org/abs/2605.26494v1
- Date: Tue, 26 May 2026 03:16:11 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-05-27 17:51:41.598257
- Title: The MiniMax-M2 Series: Mini Activations Unleashing Max Real-World Intelligence
- Title(参考訳): MiniMax-M2シリーズ:「ミニ・アクティベーション」で現実世界のインテリジェンスを最大化
- Authors: MiniMax, :, Aili Chen, Aonian Li, Baichuan Zhou, Bangwei Gong, Binyang Jiang, Boji Dan, Changqing Yu, Chao Wang, Cheng Ma, Cheng Zhong, Cheng Zhu, Chengjun Xiao, Chengyi Yang, Chengyu Du, Chenyang Zhang, Chi Zhang, Chuangyi Huang, Chunhao Zhang, Chunhui Du, Chunyu Zhao, Congchao Guo, Da Chen, Deming Ding, Dianjun Sun, Dongyu Zhang, Enhui Yang, Fei Yu, Guang Zheng, Guodong Zheng, Guohong Li, Haichao Zhu, Haigang Zhou, Haimo Zhang, Han Ding, Hao Zhang, Haohai Sun, Haolin Lyu, Haonan Lu, Haoyu Wang, Huajie Shi, Huiyang Li, Jiacheng Chen, Jian Zhang, Jiaqi Zhuang, Jiaren Cai, Jiaxin Pan, Jiayao Li, Jiayuan Song, Jichuan Zhang, Jie Wang, Jihao Gu, Jin Zhu, Jingwei Dong, Jingyang Li, Jingyu Zhang, Jingze Zhuang, Jinhao Tian, Jinli Liu, Jinyi Hu, Jun Tao, Jun Zhang, Junbin Ruan, Junhao Xu, Junjie Yan, Junteng Liu, Junxian He, Kang Xu, Ke Ji, Ke Yang, Kecheng Xiao, Keyu Duan, Keyu Li, Le Han, Letian Ruan, Li Yuan, Lianfei Yu, Liheng Feng, Lijie Mo, Lin Li, Lingye Bao, Lingyu Yang, Lingyuan Zhou, Loki, Lu Chen, Lunbin Ceng, Ming Li, Ming Zhong, Mingliang Tao, Mingyuan Chi, Mujie Lin, Nan Hu, Ningxin Chen, Peiyin Zhu, Peng Gao, Pengcheng Gao, Pengfei Li, Penglin Li, Pengyu Zhao, Qibin Ren, Qidi Xu, Qihan Ren, Qile Li, Qin Wang, Quanliang Chen, Qunhong Ceng, Rong Tian, Rui Dong, Ruitao Leng, Ruize Zhang, Shanqi Liu, Shaoyu Chen, Sheng Jia, Shun Yao, Shuoran Zhao, Shuqi Yu, Sichen Li, Sicheng Pan, Songquan Zhu, Tengfei Li, Tian Xie, Tiancheng Qin, Tianrun Liang, Wei Liu, Weiqi Xu, Weitao Li, Weixiang Chen, Weiyu Cheng, Weiyu Zhang, Wenhu Chen, Wenqian Zhao, Xiancai Chen, Xiangjun Song, Xiangyuan Wang, Xiao Luo, Xiao Su, Xiaobo Li, Xiaodong Han, Xiaojie Wu, Xihao Song, Xingyi Han, Xinyu Guan, Xuan Lu, Xun Zou, Xunhao Lai, Xutong Li, Yan Gong, Yang Wang, Yang Xu, Yangsen Wang, Ye Tang, Yicheng Chen, Yinran Qiu, Yiqi Shi, Yiting Guo, Yiwen Huang, Yixuan Wang, Yongyi Hu, Yu Gao, Yu Zhang, Yuanxiang Ying, Yuanzhen Zhang, Yubo Wang, Yuchen Song, Yufeng Yang, Yuhang Meng, Yuhang Miao, Yuhao Li, Yujie Liu, Yulin Hu, Yunan Huang, Yunji Li, Yunyi Huang, Yusen Zhang, Yusu Hong, Yutao Xie, Yutong Zhang, Yuwen Liao, Yuxuan Shi, Yuze Wenren, Zebin Li, Zehan Li, Zejian Luo, Zeyu Jin, Zeyuan Sun, Zhanpeng Zhou, Zhaochen Su, Zhendong Li, Zhengmao Zhu, Zhengyuan Peng, Zhenhua Fan, Zhi Zhang, Zhichao Xu, Zhiheng Lv, Zhikang Xu, Zhitao He, Zhiwei He, Zhongyuan Li, Zibo Gao, Zijia Wu, Zijian Song, Zijian Zhou, Zijun Sun, Zishan Huang, Ziying Chen, Ziyue Ge,
- Abstract要約: MiniMax-M2はMixture-of-Experts言語モデルのファミリーである。
旗艦M2は合計229.9Bのパラメータを持ち、トークン当たりのアクティベートは9.8Bのみである。
- 参考スコア(独自算出の注目度): 161.9185072343856
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: We introduce the MiniMax-M2 series, a family of Mixture-of-Experts language models built around the principle that mini activations can unleash maximum real-world intelligence. The flagship M2 contains 229.9B total parameters with only 9.8B activated per token. Designed end-to-end for agentic deployment, the M2 series rests on three components: (i) agent-driven data pipelines producing large-scale, verifiable trajectories across agentic coding and agentic cowork, each grounded in an executable workspace and an artifact-aligned reward; (ii) Forge, a scalable agent-native RL system that adapts to long-horizon agent trajectories, paired with windowed-FIFO scheduling, prefix-tree merging, inference optimization, and a clean training-inference-agent decoupling that supports both white-box and black-box agents; (iii) the latest M2.7 checkpoint takes an early step toward self-evolution -- autonomously debugging training runs and modifying its own scaffold. Across M2 through M2.7, this combination translates a mini-activation footprint into frontier-tier performance on agentic coding, deep search, office-task, and reasoning benchmarks.
- Abstract(参考訳): 我々は,ミニアクティベーションが現実世界のインテリジェンスを最大化できるという原則に基づいて構築された,Mixture-of-Experts言語モデルのファミリーであるMiniMax-M2シリーズを紹介する。
旗艦M2は合計229.9Bのパラメータを持ち、トークン当たりのアクティベートは9.8Bのみである。
エージェントデプロイメント用にデザインされたM2シリーズは、3つのコンポーネントに依存している。
一 エージェント駆動型データパイプラインで、エージェントコーディング及びエージェントコワーキングにまたがって、大規模かつ検証可能な軌道を生成し、それぞれが実行可能なワークスペースとアーティファクトに整合した報酬を基礎とする。
(ii)Forgeは、長期のエージェントトラジェクトリに対応するスケーラブルなエージェントネイティブなRLシステムで、ウィンドウ付きFIFOスケジューリング、プレフィックスツリーマージ、推論最適化、ホワイトボックスとブラックボックスの両方をサポートするクリーンなトレーニング推論エージェントデカップリングとの組み合わせがある。
(iii) 最新のM2.7チェックポイントは、自己進化に向けた初期段階にある。
M2からM2.7まで、この組み合わせはミニアクティベーションのフットプリントをエージェントコーディング、ディープ検索、オフィスタスク、推論ベンチマークのフロンティア階層のパフォーマンスに変換する。
関連論文リスト
- MCP-Cosmos: World Model-Augmented Agents for Complex Task Execution in MCP Environments [2.344185522187755]
我々は,生成的世界モデル(WM)をMCPエコシステムに注入し,予測タスク自動化を実現するフレームワークであるMPP-Cosmosを提案する。
我々は、BYOWM(Bring Your Own World Model)戦略により、エージェントが状態遷移をシミュレートし、実行前に潜在空間で洗練を計画できることを示した。
論文 参考訳(メタデータ) (2026-05-09T19:25:56Z) - Agent^2 RL-Bench: Can LLM Agents Engineer Agentic RL Post-Training? [23.212983812736343]
Agent2 RL-BenchはエージェントRLのポストトレーニングを評価するためのベンチマークである。
固定予算下では,教師付きパイプラインがエージェント駆動のポストトレーニングを支配していることがわかった。
論文 参考訳(メタデータ) (2026-04-12T09:35:27Z) - Youtu-LLM: Unlocking the Native Agentic Potential for Lightweight Large Language Models [78.73992315826035]
ネイティブエージェントインテリジェンスと高い計算効率を調和させる軽量言語モデルであるYoutu-LLMを紹介する。
Youtu-LLMは、スクラッチから体系的に推論と計画能力の育成まで事前訓練されている。
論文 参考訳(メタデータ) (2025-12-31T04:25:11Z) - MATRIX: Multimodal Agent Tuning for Robust Tool-Use Reasoning [65.200259961515]
マルチモーダル軌道を自動的に合成する視覚中心型エージェントチューニングフレームワークを開発した。
また、自動生成された11Kの選好ペアであるPref-Xについても紹介する。
Agent-X、GTA、GAIAの3つのベンチマークで、MATRIXはオープンソースとクローズドソースの両方のVLMを一貫して上回っている。
論文 参考訳(メタデータ) (2025-10-09T17:59:54Z) - MCP-Zero: Active Tool Discovery for Autonomous LLM Agents [13.005899769943442]
ツール発見の自律性を LLM 自体に復元する,アクティブエージェントフレームワークである MCP-Zero を紹介する。
すべての利用可能なツールで圧倒的なモデルを使用する代わりに、CP-Zeroはエージェントが能率ギャップを積極的に識別し、特定のツールをオンデマンドで要求することを可能にする。
公式の Model-Context-Protocol リポジトリから 308 の MCP サーバと 2,797 ツールの包括的なデータセットである MCP-tools を構築した。
論文 参考訳(メタデータ) (2025-06-01T15:48:53Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。