論文の概要: SAGE Celer 2.6 Technical Card
- arxiv url: http://arxiv.org/abs/2604.14168v1
- Date: Tue, 24 Mar 2026 09:03:16 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-04-19 19:09:11.693909
- Title: SAGE Celer 2.6 Technical Card
- Title(参考訳): SAGE Celer 2.6 テクニカルカード
- Authors: SAGEA Research Team, Basab Jha, Firoj Paudel, Ujjwal Puri, Adrian Liu, Ethan Henkel, Zhang Yuting, Mateusz Kowalczyk, Mei Huang, Choi Donghyuk, Wang Junhao,
- Abstract要約: Celer 2.6はSAGEAの汎用Celerモデルの最新版です。
Inverse Reasoning(IR)パイプラインを使用して、独自のロジックパスを検証する。
また、エンドツーエンドのビジョンエンコーダと統合マルチモーダル機能を備えている。
- 参考スコア(独自算出の注目度): 0.4096631525616281
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: We introduce SAGE Celer 2.6, the latest in our line of general-purpose Celer models from SAGEA. Celer 2.6 is available in 5B, 10B, and 27B parameter sizes and benefits from extensive architectural modifications and further pre-training on an undisclosed model. Using our Inverse Reasoning (IR) pipeline, SAGEA natively trains Celer 2.6 to validate its own logic paths, minimizing cascading error and hallucination in complex reasoning tasks. Celer 2.6 also boasts natively integrated multimodal functionality with an end-to-end vision encoder to avoid common pitfalls in adapter-based approaches. Celer 2.6 provides highly competitive results on mathematics, coding, and general intelligence benchmarks (ACUMEN), along with low latency. Most importantly, Celer 2.6 is specifically optimized for South Asian language support, with a custom tokenizer for the Devanagari script and strong performance in both Nepali and Hindi without sacrificing English reasoning ability.
- Abstract(参考訳): SAGEAの汎用Celerモデルの最新版であるSAGE Celer 2.6を紹介する。
Celer 2.6 は 5B, 10B, 27B のパラメータサイズで利用可能であり、広範囲なアーキテクチャ変更と未公開モデルでの事前訓練の恩恵を受けることができる。
逆推論(IR)パイプラインを使用して、SAGEAはCeler 2.6をネイティブにトレーニングし、複雑な推論タスクにおけるカスケードエラーと幻覚を最小限にする。
Celer 2.6はまた、アダプタベースのアプローチで一般的な落とし穴を避けるために、エンドツーエンドのビジョンエンコーダを備えたネイティブに統合されたマルチモーダル機能を備えている。
Celer 2.6は、低レイテンシとともに、数学、コーディング、一般インテリジェンスベンチマーク(ACUMEN)に関する非常に競争力のある結果を提供する。
最も重要な点として、セラー2.6は特に東南アジアの言語サポートに最適化されており、デヴァナガリ文字のカスタムトークン化や、ネパール語とヒンディー語の両方で英語の推論能力を犠牲にすることなくパフォーマンスが向上している。
関連論文リスト
- P2L-CA: An Effective Parameter Tuning Framework for Rehearsal-Free Multi-Label Class-Incremental Learning [54.44287764570792]
本稿では,Prompt-to-LabelモジュールとContinuous Adapterモジュールを統合するパラメータ効率フレームワークであるP2L-CAを紹介する。
P2L-CAは最先端の手法よりも大幅に改善されているだけでなく、CILシナリオの強力な一般化も示している。
論文 参考訳(メタデータ) (2026-01-19T04:35:04Z) - Gated Sparse Attention: Combining Computational Efficiency with Training Stability for Long-Context Language Models [0.0]
Gated Sparse Attention (GSA)はスパースとゲートの双方の利点を実現するアーキテクチャである。
GSAは、有界で解釈可能な選択スコアを生成するシグモイドアクティベーションを備えたゲート雷インデクサを組み込んでいる。
論文 参考訳(メタデータ) (2026-01-12T20:33:39Z) - K2-Think: A Parameter-Efficient Reasoning System [80.62468969966133]
K2-Thinkは32Bパラメータモデルを用いて最先端のパフォーマンスを実現する推論システムである。
本システムでは, 先進的なポストトレーニング技術とテストタイム技術を組み合わせることで, より小型のモデルが最上位で競争できることを示す。
K2-Thinkはk2think.aiで無料で利用可能で、クラス内の最高の推論速度はリクエスト1秒あたり2000トークン以上である。
論文 参考訳(メタデータ) (2025-09-09T11:25:55Z) - Ovis2.5 Technical Report [43.715004002753716]
我々は,Ovis2の後継となるOvis2.5を,ネイティブ解像度の視覚知覚と強力なマルチモーダル推論のために提案する。
Ovis2.5はネイティブ解像度で画像を処理できるネイティブ解像度のビジョントランスフォーマーを統合している。
私たちは、リニアチェーンを越えてリフレクションを実行するようにモデルをトレーニングします。
論文 参考訳(メタデータ) (2025-08-15T17:01:08Z) - Kimi K2: Open Agentic Intelligence [118.78600121345099]
Kimi K2は32億の活性化パラメータと1兆の総パラメータを持つ大きな言語モデルである。
MuonClipに基づいて、K2は15.5兆のトークンで事前訓練され、損失のスパイクはゼロだった。
Kimi K2は、オープンソース非思考モデルの間で最先端のパフォーマンスを達成する。
論文 参考訳(メタデータ) (2025-07-28T05:35:43Z) - Eagle 2.5: Boosting Long-Context Post-Training for Frontier Vision-Language Models [90.10322077894033]
長文マルチモーダル学習のためのフロンティア視覚言語モデル(VLM)のファミリーであるEagle 2.5を紹介する。
我々の研究は、長いビデオ理解と高解像度画像理解の課題に対処する。
本稿では,ストーリーレベルのアノテーションとクリップレベルのアノテーションを統合した新しいデータセットであるEagle-Video-110Kを提案する。
論文 参考訳(メタデータ) (2025-04-21T17:57:28Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。