論文の概要: XekRung Technical Report
- arxiv url: http://arxiv.org/abs/2605.00072v1
- Date: Thu, 30 Apr 2026 11:50:32 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-05-04 17:43:28.67254
- Title: XekRung Technical Report
- Title(参考訳): XekRung 技術報告
- Authors: Jiutian Zeng, Junjie Li, Chengwei Dai, Jie Liang, Zhaoyu Hu, Yiliang Zhang, Ziang Weng, Longtao Huang, Dongjie Zhang, Libin Dong, Yang Ge, Yuanda Wang, Kaiwen Lv Kacuila, Bingyu Zhu, Jing Wang, Jin Xu,
- Abstract要約: XekRungは、包括的なセキュリティ機能を提供するために設計された、サイバーセキュリティのための大規模な言語モデルである。
サイバーセキュリティドメインに適した多様なデータパイプラインを開発し、高品質なトレーニングデータのスケーラブルな構築を可能にします。
XekRungは、同じ規模のモデル間で、サイバーセキュリティ固有のベンチマークで最先端のパフォーマンスを達成し、一般的なベンチマークでは強力なパフォーマンスを維持している。
- 参考スコア(独自算出の注目度): 20.7000756582858
- License: http://creativecommons.org/licenses/by-nc-sa/4.0/
- Abstract: We present XekRung, a frontier large language model for cybersecurity, designed to provide comprehensive security capabilities. To achieve this, we develop diverse data synthesis pipelines tailored to the cybersecurity domain, enabling the scalable construction of high-quality training data and providing a strong foundation for cybersecurity knowledge and understanding. Building on this foundation, we establish a complete training pipeline spanning continued pre-training (CPT), supervised fine-tuning (SFT), and reinforcement learning (RL) to further extend the model's capabilities. We further introduce a multi-dimensional evaluation system to guide the iterative improvement of both domain-specific and general-purpose abilities. Extensive experiments demonstrate that XekRung achieves state-of-the-art performance on cybersecurity-specific benchmarks among models of the same scale, while maintaining strong performance on general benchmarks.
- Abstract(参考訳): 我々は,サイバーセキュリティのためのフロンティアな大規模言語モデルであるXekRungを紹介した。
これを実現するために、サイバーセキュリティドメインに適した多様なデータ合成パイプラインを開発し、高品質なトレーニングデータのスケーラブルな構築を可能にし、サイバーセキュリティの知識と理解のための強力な基盤を提供する。
この基礎の上に、継続事前訓練(CPT)、教師付き微調整(SFT)、強化学習(RL)にまたがる完全なトレーニングパイプラインを構築し、モデルの能力をさらに拡張する。
さらに,ドメイン固有能力と汎用能力の両方の反復的改善を導くための多次元評価システムを導入する。
大規模な実験により、XekRungは、同じスケールのモデル間で、サイバーセキュリティ固有のベンチマークで最先端のパフォーマンスを達成し、一般的なベンチマークでは強力なパフォーマンスを維持している。
関連論文リスト
- Insight-V++: Towards Advanced Long-Chain Visual Reasoning with Multimodal Large Language Models [65.4947731385794]
基礎画像中心モデルであるInsight-Vから進化した統合多エージェント視覚推論フレームワークを提案する。
空間的時間的推論を強化し、評価ロバスト性を向上させる2つの新しいアルゴリズムST-GRPOとJ-GRPOを導入する。
LLaVA-NeXTやQwen2.5-VLといったベースモデルの実験は、挑戦的な画像とビデオの推論ベンチマーク間で大きなパフォーマンス向上を示している。
論文 参考訳(メタデータ) (2026-03-18T15:28:07Z) - Revisiting the Generic Transformer: Deconstructing a Strong Baseline for Time Series Foundation Models [18.841505010078112]
本稿では,標準パッチ変換器の可能性について検討し,最先端のゼロショット予測性能を実現することを実証する。
我々は,モデルスケーリング,データ合成,トレーニング技術を網羅的に研究し,高パフォーマンスに必要な材料を分離する。
論文 参考訳(メタデータ) (2026-02-06T18:01:44Z) - Llama-3.1-FoundationAI-SecurityLLM-Reasoning-8B Technical Report [48.22833523688154]
私たちは、サイバーセキュリティのための初のオープンソースのネイティブ推論モデルであるFoundation-Sec-8B-Reasoningを紹介します。
このモデルは、教師付き微調整(SFT)と検証可能な報酬(RLVR)からの強化学習を組み合わせた2段階のプロセスで訓練される。
論文 参考訳(メタデータ) (2026-01-28T21:15:24Z) - Scalable In-Context Q-Learning [68.9917436397079]
textbfScalable textbfIn-textbfContext textbfQ-textbfLearning (textbfSICQL)を提案する。
textbfSICQLは動的プログラミングとワールドモデリングを利用して、ICRLを効率的な報酬とタスクの一般化に向けて制御する。
論文 参考訳(メタデータ) (2025-06-02T04:21:56Z) - When Demonstrations Meet Generative World Models: A Maximum Likelihood
Framework for Offline Inverse Reinforcement Learning [62.00672284480755]
本稿では, 専門家エージェントから, 一定の有限個の実演において観測された動作を過小評価する報酬と環境力学の構造を復元することを目的とする。
タスクを実行するための正確な専門知識モデルは、臨床的意思決定や自律運転のような安全に敏感な応用に応用できる。
論文 参考訳(メタデータ) (2023-02-15T04:14:20Z) - Towards All-in-one Pre-training via Maximizing Multi-modal Mutual
Information [77.80071279597665]
マルチモーダル相互情報事前学習(M3I事前学習)を最大化するオールインワン単段階事前学習手法を提案する。
提案手法は,ImageNet分類,オブジェクト検出,LVIS長鎖オブジェクト検出,ADE20kセマンティックセマンティックセマンティックセマンティクスなど,様々なビジョンベンチマークにおける事前学習手法よりも優れた性能を実現する。
論文 参考訳(メタデータ) (2022-11-17T18:59:49Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。