論文の概要: SearchSkill: Teaching LLMs to Use Search Tools with Evolving Skill Banks
- arxiv url: http://arxiv.org/abs/2605.09038v2
- Date: Thu, 14 May 2026 10:12:06 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-05-15 21:45:34.372317
- Title: SearchSkill: Teaching LLMs to Use Search Tools with Evolving Skill Banks
- Title(参考訳): 検索スキル:LLMにスキルバンクを進化させる検索ツールを教える
- Authors: Jinchao Hu, Meizhi Zhong, Kehai Chen, Min Zhang,
- Abstract要約: 本稿では,再利用可能な検索スキルによってクエリ計画を明確にするフレームワークを提案する。
オープンソースモデルとクローズドソースモデル全体で、SearchSkillは知識集約型QAベンチマークの正確なマッチを改善している。
これらの結果は、明示的なスキル条件付きクエリプランニングが、未分化のアクションとして検索を扱うための軽量な代替手段であることを示唆している。
- 参考スコア(独自算出の注目度): 32.240602087886494
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Teaching language models to use search tools is not only a question of whether they search, but also of whether they issue good queries. This is especially important in open-domain question answering, where broad or copied queries often waste retrieval budget and derail later reasoning. We propose \Ours, a framework that makes query planning explicit through reusable search skills. At each step, the model first selects a skill, then generates a search or answer action conditioned on the selected skill card. The skill inventory itself is not fixed: SearchSkill maintains an evolving SkillBank, expands or refines it from recurrent failure patterns, and reconstructs affected trajectories before supervised training. The resulting two-stage SFT recipe aligns training with the inference-time protocol of skill selection followed by skill-grounded execution. Across open-source and closed-source models, SearchSkill improves exact match on knowledge-intensive QA benchmarks and yields better retrieval behavior, including fewer copied first queries, more atomic hop-focused queries, and more correct answers within a small search budget. These results suggest that explicit skill-conditioned query planning is a lightweight alternative to treating search as an undifferentiated action.
- Abstract(参考訳): 検索ツールを使うための言語モデルを教えることは、検索するかどうかだけでなく、良いクエリを発行するかどうかという問題でもある。
これは、広範またはコピーされたクエリが検索予算を浪費し、後続の推論を遅らせる、オープンドメインの質問応答において特に重要である。
再利用可能な検索スキルによってクエリ計画を明確にするフレームワークである‘Ours’を提案する。
各ステップで、まず、モデルがスキルを選択し、選択されたスキルカードに条件付き検索または回答アクションを生成する。
SearchSkillは進化を続けるSkillBankを維持し、繰り返し発生する障害パターンからそれを拡張または洗練し、教師付きトレーニングの前に影響のあるトラジェクトリを再構築する。
得られた2段階のSFTレシピは、スキル選択の推論時プロトコルとトレーニングを整合させ、その後、スキル接地実行を行う。
オープンソースモデルとクローズドソースモデル全体で、SearchSkillは知識集約型QAベンチマークの正確なマッチングを改善し、コピーされた最初のクエリの少ない、アトミックなホップ中心のクエリ、小さな検索予算内でのより正確な回答など、より良い検索動作を提供する。
これらの結果は、明示的なスキル条件付きクエリプランニングが、未分化のアクションとして検索を扱うための軽量な代替手段であることを示唆している。
関連論文リスト
- Beyond the limitation of a single query: Train your LLM for query expansion with Reinforcement Learning [23.104182075898297]
Reasoning-augmented search agent, such as Search-R1, are trained to reason, search, and generate the final answer repeateratively。
我々は、強化学習によるクエリ拡張のネイティブ機能を備えたLLMベースの検索エージェントを訓練する。
シュレッシャーモデルの助けを借りて,小型の3B LLMでもクエリ拡張の強力な能力を実証できることが判明した。
論文 参考訳(メタデータ) (2025-10-11T04:23:30Z) - Reasoning-enhanced Query Understanding through Decomposition and Interpretation [87.56450566014625]
ReDIは、分解と解釈によるクエリ理解のための推論強化アプローチである。
我々は,大規模検索エンジンから実世界の複雑なクエリの大規模データセットをコンパイルした。
BRIGHT と BEIR の実験により、ReDI はスパースと密度の高い検索パラダイムの両方において、強いベースラインを一貫して超えることを示した。
論文 参考訳(メタデータ) (2025-09-08T10:58:42Z) - SEM: Reinforcement Learning for Search-Efficient Large Language Models [26.075903427834838]
大きな言語モデル(LLM)は、推論だけでなく、外部ツールの呼び出しでもその能力を実証している。
既存の強化学習アプローチは、しばしば冗長な探索行動を引き起こす。
本研究では,学習後強化学習フレームワークであるSEMを提案する。
論文 参考訳(メタデータ) (2025-05-12T09:45:40Z) - ReSearch: Learning to Reason with Search for LLMs via Reinforcement Learning [74.65632662894086]
本稿では,強化学習を通じてLLMをReason with Searchに学習するフレームワークであるReSearchを提案する。
提案手法では,検索操作を推論チェーンの不可欠な要素として扱う。
分析によると、ReSearchは自然にリフレクションや自己訂正のような高度な推論機能を引き出す。
論文 参考訳(メタデータ) (2025-03-25T09:00:58Z) - ConvGQR: Generative Query Reformulation for Conversational Search [37.54018632257896]
ConvGQRは、生成事前訓練された言語モデルに基づいて会話クエリを再構成する新しいフレームワークである。
本稿では,クエリ再構成と検索の両方を最適化する知識注入機構を提案する。
論文 参考訳(メタデータ) (2023-05-25T01:45:06Z) - Query Rewriting for Retrieval-Augmented Large Language Models [139.242907155883]
大規模言語モデル(LLM)は、検索対象のパイプラインで強力なブラックボックスリーダーを動作させる。
この作業では、検索拡張LDMに対する以前の検索テーマ読み込みの代わりに、新しいフレームワークであるRewrite-Retrieve-Readを導入する。
論文 参考訳(メタデータ) (2023-05-23T17:27:50Z) - Graph Enhanced BERT for Query Understanding [55.90334539898102]
クエリ理解は、ユーザの検索意図を探索し、ユーザが最も望まれる情報を発見できるようにする上で、重要な役割を果たす。
近年、プレトレーニング言語モデル (PLM) は様々な自然言語処理タスクを進歩させてきた。
本稿では,クエリコンテンツとクエリグラフの両方を活用可能な,グラフ強化事前学習フレームワークGE-BERTを提案する。
論文 参考訳(メタデータ) (2022-04-03T16:50:30Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。