論文の概要: CoHyDE: Iterative Co-Training of LLM Rewriter & Dense Encoder for Tool Retrieval
- arxiv url: http://arxiv.org/abs/2605.29271v1
- Date: Thu, 28 May 2026 02:41:30 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-05-30 02:45:55.59903
- Title: CoHyDE: Iterative Co-Training of LLM Rewriter & Dense Encoder for Tool Retrieval
- Title(参考訳): CoHyDE: ツール検索のためのLCMリライタとデンスエンコーダの反復的共同開発
- Authors: Vaishali Senthil, Ashutosh Hathidara, Sebastian Schreiber,
- Abstract要約: CoHyDEは、高密度エンコーダとリライターを単一の共進化システムとして訓練する。
ToolBenchカタログの10kツールサブセットでは、CoHyDEの3ラウンドが、標準クエリでは+2.5pp NDCG@5で最強の単一コンポーネントベースラインよりも改善されている。
どちらのコンポーネントも独立して使用すると、よく整ったクエリとあいまいなクエリの両方でCoHyDEと一致せず、あいまいなクエリでは最大8ppの損失がある。
- 参考スコア(独自算出の注目度): 0.3823356975862005
- License: http://creativecommons.org/licenses/by-sa/4.0/
- Abstract: Tool retrieval over large API catalogs is a core bottleneck for LLM agents: user queries arrive in colloquial, often underspecified language, while the catalog uses technical API vocabulary that no fixed encoder can bridge on its own. The two dominant training approaches, contrastive encoder fine-tuning and HyDE-style query expansion with a frozen LLM, address this problem from opposite ends and fail in complementary directions: the fine-tuned encoder excels when the query's surface form already matches the catalog but collapses when it does not, while zero-shot HyDE is more robust to underspecified queries yet generates catalog-unaware hypothetical descriptions that degrade retrieval when queries are well-formed. We introduce CoHyDE, an iterative procedure that trains the dense encoder and the LLM rewriter as a single co-evolving system: the encoder is retrained with InfoNCE on catalog-style hypothetical descriptions produced by the rewriter, and the rewriter is preference-aligned via DPO against the encoder's retrieval scores, with both sides warm-started on the tool catalog before the loop begins. On a ~10k tool subset of the ToolBench catalog, three rounds of CoHyDE improve over the strongest single-component baseline by +2.5 pp NDCG@5 on standard queries and +6.3 pp on held-out vague queries, with gains as large as +8 pp on the hardest vague tier. Ablations confirm that co-training is the key ingredient: using either component in isolation fails to match CoHyDE on both well-formed and vague queries, with losses of up to -8 pp on vague queries.
- Abstract(参考訳): 大きなAPIカタログ上のツール検索は、LLMエージェントの中核的なボトルネックである。ユーザクエリは口語で、しばしば未定義の言語に到達するが、カタログは、固定エンコーダが独自のブリッジをできない技術的API語彙を使用する。
対照的なエンコーダの微調整とHyDEスタイルのクエリ拡張という2つの主流のトレーニングアプローチは、この問題を逆の端から解決し、補完的な方向で解決する: 微調整されたエンコーダは、クエリの表面形状が既にカタログと一致するが、そうでない場合には崩壊する。
我々は,高密度エンコーダとLCMリライタを単一共進化システムとして訓練する反復的手順であるCoHyDEを紹介した。エンコーダは,リライタが生成するカタログスタイルの仮説記述に基づいてInfoNCEで再学習され,リライタは,エンコーダの検索スコアに対してDPOを介して優先的に調整される。
ToolBenchカタログの10kのツールサブセットでは、CoHyDEの3ラウンドが、標準クエリで2.5pp NDCG@5、ホールドアウトのあいまいクエリで6.3ppという最強の単一コンポーネントベースラインよりも改善され、最も難しいあいまいな層では+8ppのゲインがある。
どちらかのコンポーネントを分離して使用すると、よくできたクエリとあいまいなクエリの両方でCoHyDEと一致せず、あいまいなクエリでは最大8ppの損失がある。
関連論文リスト
- GrepSeek: Training Search Agents for Direct Corpus Interaction [66.69568141699311]
GrepSeekは、コンパクトな検索エージェントを訓練し、大きなテキストコーパスから証拠を見つけ、フィルタリングし、構成する、最適化された直接コーパスインタラクション(DCI)検索エージェントである。
DCIを大規模に実用化するためには、シェルコマンドのシーケンシャルな実行とバイトエクササイズ等価性を保ちながら、シェルベースの検索を最大7.6タイムで高速化するセマンティックス保存のシャード並列実行エンジンを使用する。
論文 参考訳(メタデータ) (2026-05-28T03:37:33Z) - Retrieval as Reasoning: Self-Evolving Agent-Native Retrieval via LLM-Wiki [6.956097396264084]
LLMエージェントは、検索をワンショットのコンテキストフェッチのように振る舞うのではなく、推論のように振る舞う必要がある。
現在、RAG(Retrieval-Augmented Generation)システムは、類似性を埋め込んだフラットチャンクとして外部知識を整理している。
本稿では,外部知識をコンパイル可能,構成可能,自己進化的構造として扱うことにより,検索パラダイムを運用するエージェントネイティブ検索システム LLM-Wiki を提案する。
論文 参考訳(メタデータ) (2026-05-25T06:36:14Z) - Succeeding at Scale: Automated Multi-Retriever Fusion and Query-Side Adaptation for Multi-Tenant Search [22.080200394842123]
DevRev Searchは、完全に自動パイプラインで構築されたテクニカルカスタマーサポートのためのパス検索ベンチマークである。
低ランク適応によるクエリエンコーダのみを微調整することで、実用的な textbfIndex-Preserving Adaptation 戦略を提案する。
DevRev SearchとSciFactの実験では、クエリエンコーダ内の特定のトランスフォーマー層をターゲットにすることで、最適な品質効率のトレードオフが得られることを示した。
論文 参考訳(メタデータ) (2026-01-08T06:44:40Z) - SweRank: Software Issue Localization with Code Ranking [109.3289316191729]
SweRankは、ソフトウェア問題ローカライゼーションのための効率的な検索と参照のためのフレームワークである。
パブリックなGitHubリポジトリからキュレートされた大規模なデータセットであるSweLocを構築します。
SweRankは最先端の性能を達成し、従来のランキングモデルとコストの高いエージェントベースシステムの両方より優れていることを示す。
論文 参考訳(メタデータ) (2025-05-07T19:44:09Z) - Effective Instruction Parsing Plugin for Complex Logical Query Answering on Knowledge Graphs [51.33342412699939]
知識グラフクエリ埋め込み(KGQE)は、不完全なKGに対する複雑な推論のために、低次元KG空間に一階論理(FOL)クエリを埋め込むことを目的としている。
近年の研究では、FOLクエリの論理的セマンティクスをよりよく捉えるために、さまざまな外部情報(エンティティタイプや関係コンテキストなど)を統合している。
コードのようなクエリ命令から遅延クエリパターンをキャプチャする効果的なクエリ命令解析(QIPP)を提案する。
論文 参考訳(メタデータ) (2024-10-27T03:18:52Z) - RRADistill: Distilling LLMs' Passage Ranking Ability for Long-Tail Queries Document Re-Ranking on a Search Engine [2.0379810233726126]
大規模言語モデル(LLM)は、クエリとドキュメント間の意味的関係を理解するのに優れている。
これらのクエリは、少ないユーザエンゲージメントと限られたフィードバックのため、フィードバックベースのランキングでは難しい。
本稿では,エンコーダモデルとデコーダモデルの両方に対して,効率的なラベル生成パイプラインと新しいsLLMトレーニング手法を提案する。
論文 参考訳(メタデータ) (2024-10-08T11:28:06Z) - List-aware Reranking-Truncation Joint Model for Search and
Retrieval-augmented Generation [80.12531449946655]
本稿では,2つのタスクを同時に実行可能なRe rank-Truncation joint model(GenRT)を提案する。
GenRTは、エンコーダ-デコーダアーキテクチャに基づく生成パラダイムによるリランクとトランケーションを統合している。
提案手法は,Web検索および検索拡張LLMにおけるリランクタスクとトラルケーションタスクの両方においてSOTA性能を実現する。
論文 参考訳(メタデータ) (2024-02-05T06:52:53Z) - Noise-Robust Dense Retrieval via Contrastive Alignment Post Training [89.29256833403167]
Contrastive Alignment POst Training (CAPOT) は、指数再生を必要とせず、モデルロバスト性を改善する高効率な微調整法である。
CAPOTはドキュメントエンコーダを凍結することで堅牢な検索を可能にし、クエリエンコーダはノイズの多いクエリを修正されていないルートに整列させる。
MSMARCO、Natural Questions、Trivia QAパス検索のCAPOTノイズ変動を評価し、CAPOTがオーバーヘッドを伴わないデータ増大に類似した影響があることを発見した。
論文 参考訳(メタデータ) (2023-04-06T22:16:53Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。