Fugu-MT 論文翻訳(概要): From Context to Skills: Can Language Models Learn from Context Skillfully?

論文の概要: From Context to Skills: Can Language Models Learn from Context Skillfully?

arxiv url: http://arxiv.org/abs/2604.27660v2
Date: Sun, 03 May 2026 14:10:15 GMT
ステータス: 翻訳完了
システム内更新日: 2026-05-05 14:09:07.078256
Title: From Context to Skills: Can Language Models Learn from Context Skillfully?
Title（参考訳）: コンテキストからスキルへ:言語モデルはコンテキストスキルから学ぶことができるか?
Authors: Shuzheng Si, Haozhe Zhao, Yu Lei, Qingyi Wang, Dingwei Chen, Zhitong Wang, Zhenhailong Wang, Kangyang Luo, Zheng Wang, Gang Chen, Fanchao Qi, Minjia Zhang, Maosong Sun,
Abstract要約: Ctx2Skillは、コンテキスト固有のスキルを自律的に発見、洗練、選択する自己進化フレームワークである。より良い文脈学習能力を得るために、どんな言語モデルにもプラグインできる。
参考スコア（独自算出の注目度）: 56.5857437218136
License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
Abstract: Many real-world tasks require language models (LMs) to reason over complex contexts that exceed their parametric knowledge. This calls for context learning, where LMs directly learn relevant knowledge from the given context. An intuitive solution is inference-time skill augmentation: extracting the rules and procedures from context into natural-language skills. However, constructing such skills for context learning scenarios faces two challenges: the prohibitive cost of manual skill annotation for long, technically dense contexts, and the lack of external feedback for automated skill construction. In this paper, we propose Ctx2Skill, a self-evolving framework that autonomously discovers, refines, and selects context-specific skills without human supervision or external feedback. At its core, a multi-agent self-play loop has a Challenger that generates probing tasks and rubrics, a Reasoner that attempts to solve them guided by an evolving skill set, and a neutral Judge that provides binary feedback. Crucially, both the Challenger and the Reasoner evolve through accumulated skills: dedicated Proposer and Generator agents analyze failure cases and synthesize them into targeted skill updates for both sides, enabling automated skill discovery and refinement. To prevent adversarial collapse caused by increasingly extreme task generation and over-specialized skill accumulation, we further introduce a Cross-time Replay mechanism that identifies the skill set achieving the best balance across representative cases for the Reasoner side, ensuring robust and generalizable skill evolution. The resulting skills can be plugged into any language model to obtain better context learning capability. Evaluated on four context learning tasks from CL-bench, Ctx2Skill consistently improves solving rates across backbone models.
Abstract（参考訳）: 多くの実世界のタスクは、パラメトリック知識を超える複雑なコンテキストを推論するために言語モデル(LM)を必要とする。これはコンテキスト学習と呼ばれ、LMは与えられたコンテキストから関連する知識を直接学習する。直感的な解決策は推論時スキル増強(Inference-time skill augmentation)であり、コンテキストからルールとプロシージャを自然言語スキルに抽出する。しかし、コンテキスト学習シナリオのためのこのようなスキルの構築には、長い技術的に密集したコンテキストに対する手動スキルアノテーションの禁止コストと、自動スキル構築のための外部からのフィードバックの欠如という2つの課題がある。本稿では、人間の監督や外部からのフィードバックなしに、文脈固有のスキルを自律的に発見、洗練、選択する自己進化型フレームワークであるCtx2Skillを提案する。中心となるマルチエージェントのセルフプレイループには、探索タスクとルーリックを生成するチャレンジャー、進化するスキルセットによってガイドされるそれらを解決しようとするReasoner、バイナリフィードバックを提供する中立なジャッジがある。専門のProposerとGeneratorエージェントは、障害ケースを分析し、双方のターゲットとするスキル更新に合成することで、自動スキル発見と改善を可能にします。タスク生成の激化と過剰なスキル蓄積による敵意の崩壊を防止するため,Reasoner側の代表事例間の最適なバランスを達成し,堅牢で汎用的なスキル進化を確実にするクロスタイム・リプレイ機構を導入する。得られたスキルは、より良い文脈学習能力を得るために、任意の言語モデルにプラグインすることができる。 CL-benchから4つのコンテキスト学習タスクを評価することで、Ctx2Skillはバックボーンモデル間の解決率を一貫して改善する。

論文の概要: From Context to Skills: Can Language Models Learn from Context Skillfully?

関連論文リスト