論文の概要: SoftSkill: Behavioral Compression for Contextual Adaptation
- arxiv url: http://arxiv.org/abs/2606.20333v1
- Date: Thu, 18 Jun 2026 15:04:47 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-06-19 18:23:39.93641
- Title: SoftSkill: Behavioral Compression for Contextual Adaptation
- Title(参考訳): SoftSkill: コンテキスト適応のための行動圧縮
- Authors: Xijia Tao, Yihua Teng, Xinyu Fu, Ziru Liu, Kecheng Chen, Yuzhi Zhao, Suiyun Zhang, Rui Liu, Lingpeng Kong,
- Abstract要約: 本稿では、自然言語スキルがコンパクトな連続コンテキストオブジェクトを初期化できるかどうかを問う。
そこで本研究では,凍結したバックボーン法であるSoftSkillを提案する。
Skillとは対照的に、SoftSkillはSearchQAでは5.2ポイント、LiveMathでは12.5ポイントの精度向上を実現している。
- 参考スコア(独自算出の注目度): 45.10778084241114
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Agent skills are commonly deployed as natural-language Markdown files that encode answer policies, evidence-use habits, and task procedures. These files are readable and portable, but they are consumed indirectly: for each task instance, a frozen language model must translate a long textual artifact into generation-time behavior. This paper asks whether a natural-language skill can instead initialize a compact continuous context object, refined by a trainable soft delta while the base model remains frozen. We propose SoftSkill, a frozen-backbone method that tunes such soft skills with next-token prediction and deploys them as latent behavioral priors at inference time. In our main single-round setting, a length-32 SoftSkill prefix on Qwen3.5-4B improves over no-skill prompting by 8.3 points on SearchQA, 42.1 points on LiveMath, and 1.3 points on DocVQA. Relative to SkillOpt, SoftSkill improves accuracy by 5.2 points on SearchQA and 12.5 points on LiveMath, while replacing hundreds to thousands of Markdown skill tokens with a few virtual tokens. We further study agentic execution as a harder boundary case, where sparse trajectory imitation provides useful signal but does not yet robustly compress long-horizon procedural behavior. More broadly, the results suggest that some task skills are better treated not as additional Markdown to be reinterpreted at inference time, but as compact latent controls over how a frozen model enters the task.
- Abstract(参考訳): エージェントスキルは一般的に、回答ポリシー、エビデンス利用習慣、タスク手順をエンコードする自然言語のMarkdownファイルとしてデプロイされる。
これらのファイルは読みやすくポータブルだが、間接的に消費される。各タスクインスタンスに対して、凍結された言語モデルは長いテキストのアーティファクトを生成時の振る舞いに変換する必要がある。
本稿では,学習可能なソフトデルタによって改良されたコンパクトな連続文脈オブジェクトを,ベースモデルが凍結状態のままに初期化できるかどうかを問う。
そこで本研究では,そのソフトスキルを次世代の予測で調整し,予測時に潜時行動前処理として展開する,フリーズバックボーン方式のSoftSkillを提案する。
メインのシングルラウンド設定では、Qwen3.5-4Bの32のSoftSkillプレフィックスは、検索QAの8.3ポイント、LiveMathの42.1ポイント、DocVQAの1.3ポイントよりも向上する。
SkillOptとは対照的に、SoftSkillは検索QAで5.2ポイント、LiveMathで12.5ポイント、Markdownスキルトークンで数百から数千の仮想トークンを置き換える。
我々はさらに,スパース軌跡模倣が有用な信号を提供するが,長期の手続き動作を頑健に圧縮しない,という,より難しい境界条件としてのエージェント実行について検討した。
より広義には、いくつかのタスクスキルは、推論時にMarkdownを追加して再解釈するよりも、凍結モデルがどのようにタスクに入るかに関するコンパクトな潜在性制御として、より良く扱われることを示している。
関連論文リスト
- VISUALSKILL: Multimodal Skills for Computer-Use Agents [63.79539541125141]
ターゲットアプリケーション毎に調整された階層型マルチモーダルスキルであるVISUALSKILLを提案する。
著者によるドキュメンテーションとライブアプリケーションUI探索を組み合わせた2段階のパイプラインで、それぞれのスキルを構築します。
2つのCUAベンチマークでは、Claude Code CLIエージェントがClaude Opus 4.6によって支援され、VISUALSKILLで平均スコア0.456に達した。
論文 参考訳(メタデータ) (2026-06-16T19:57:07Z) - AIP: A Graph Representation for Learning and Governing Agent Skills [1.1458853556386797]
現在、エージェントスキルは、エージェントがすべてのセッションでどのように振る舞うかを読み、解釈し、再導出する必要があるフリーフォームの散文で構成されている。
これは、実装が重いタスクに対する信頼性の低下と、スキル創造と改善の難しさの2つの複合コストを課します。
Agent Instruction Protocol (AIP) は両方とも、有向実行グラフとしてスキルをモデル化することで対処する。
コンパイラのメタスキルは、既存の人書きスキルをこの形式に変換する。
論文 参考訳(メタデータ) (2026-06-03T12:02:49Z) - Universal Adversarial Suffixes Using Calibrated Gumbel-Softmax Relaxation [9.099589602551573]
我々は,任意の入力に付加されたユニバーサル逆接接尾辞について検討し,タスクやモデル間での精度を広く低減する。
提案手法は,Gumbel-Softmax 緩和を用いた微分可能な「ソフト」形式で接尾辞を学習し,推論のために識別する。
あるモデルで訓練された1つの接尾辞は、他のモデルに効果的に転送され、常に精度と精度の調整の両方を低下させる。
論文 参考訳(メタデータ) (2025-12-09T00:03:39Z) - MrT5: Dynamic Token Merging for Efficient Byte-level Language Models [50.46453950887946]
この研究は、より効率的なByT5の変種であるMrT5(MergeT5)を導入し、トークン削除機構をエンコーダに統合し、入力シーケンスの長さを動的に短縮する。
MrT5は、削除されたトークンから重要な情報をよりコンパクトなシーケンスに"マージ"し、残りのトークンからコンテキスト情報を活用する。
MrT5は、XNLI、TyDi QA、文字レベルのタスクなどの下流評価ではByT5に匹敵する精度を示し、シーケンス長を最大75%削減する。
論文 参考訳(メタデータ) (2024-10-28T06:14:12Z) - Syntax-Aware On-the-Fly Code Completion [13.268277642411974]
我々はPyCoderを提案する。トークン型は軽量な構文情報の一種である。
私たちのPyCoderはトークンレベルの予測に対して77.12%の精度でCodeXGLUEのリーダーボードで1位を獲得しました。
論文 参考訳(メタデータ) (2022-11-09T04:24:18Z) - Politeness Transfer: A Tag and Generate Approach [167.9924201435888]
本稿では, 丁寧性伝達の新たな課題について紹介する。
意味を保ちながら、非政治的な文を丁寧な文に変換することを含む。
我々はタグを設計し、スタイル属性を識別するパイプラインを生成し、その後、ターゲットスタイルで文を生成する。
論文 参考訳(メタデータ) (2020-04-29T15:08:53Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。