Fugu-MT 論文翻訳(概要): PromptEmbedder:: Efficient and Transferable Text Embedding via Dual-LLM Soft Prompting

論文の概要: PromptEmbedder:: Efficient and Transferable Text Embedding via Dual-LLM Soft Prompting

arxiv url: http://arxiv.org/abs/2605.28066v1
Date: Wed, 27 May 2026 07:23:55 GMT
ステータス: 翻訳完了
システム内更新日: 2026-05-28 17:38:55.839189
Title: PromptEmbedder:: Efficient and Transferable Text Embedding via Dual-LLM Soft Prompting
Title（参考訳）: PromptEmbedder:Dual-LLM Soft Promptingによる効率的かつ伝達可能なテキスト埋め込み
Authors: Yu-Che Tsai, Kuan-Yu Chen, Yuan-Hao Chen, Yu-Han Chang, Ching-Yu Tsai, Yu-Hsiang Chuang, Shou-De Lin,
Abstract要約: PromptEmbedderは、特定のバックボーン重みから埋め込み知識を分離する新しいデュアルLLMフレームワークである。 PromptEmbedderは、GPUメモリを40%削減し、トレーニングを3.7倍高速化しながら、LoRAの微調整で同等のパフォーマンスを実現していることを示す。
参考スコア（独自算出の注目度）: 5.314283762755523
License: http://creativecommons.org/licenses/by/4.0/
Abstract: Large Language Models (LLMs) have demonstrated remarkable efficacy in text embedding, yet current adaptation methods like LoRA face significant bottlenecks in computational efficiency and cross-architecture transferability. Whenever a new backbone emerges, existing approaches require costly retraining from scratch. To address this, we propose PromptEmbedder, a novel dual-LLM framework that decouples embedding knowledge from specific backbone weights. PromptEmbedder utilizes a Prompting LLM to generate instruction-aware soft prompts for a frozen Embedding LLM via a differentiable generation process with continuous relaxation, ensuring full gradient flow during contrastive training. By localizing task-specific knowledge within the Prompting LLM, adapting to new architectures requires only retraining a lightweight linear alignment matrix. Evaluations on the MTEB benchmark show that PromptEmbedder achieves comparable performance with LoRA finetuning while reducing GPU memory by 40% and accelerating training by 3.7x. Our approach establishes a scalable, architecture-agnostic paradigm for efficient LLM-based representation learning.
Abstract（参考訳）: 大規模言語モデル (LLM) はテキスト埋め込みにおいて顕著な有効性を示しているが、LoRAのような現在の適応手法は計算効率とアーキテクチャ間転送性において重大なボトルネックに直面している。新しいバックボーンが出現するたびに、既存のアプローチはスクラッチからコストがかかる。これを解決するために,特定のバックボーン重みから埋め込み知識を分離する新しいデュアルLLMフレームワークであるPromptEmbedderを提案する。 PromptEmbedderは、Prompting LLMを使用して、連続的な緩和を伴う微分可能生成プロセスを通じて、コントラストトレーニング中の完全な勾配流を保証する、凍結した埋め込みLDMのための命令対応ソフトプロンプトを生成する。 Prompting LLM内でタスク固有の知識をローカライズすることで、新しいアーキテクチャに適応するためには、軽量な線形アライメント行列を再トレーニングする必要がある。 MTEBベンチマークの評価によると、PromptEmbedderはLoRAの微調整で同等のパフォーマンスを達成し、GPUメモリを40%削減し、トレーニングを3.7倍加速している。提案手法は,LLMに基づく効率的な表現学習のための,スケーラブルでアーキテクチャに依存しないパラダイムを確立する。

論文の概要: PromptEmbedder:: Efficient and Transferable Text Embedding via Dual-LLM Soft Prompting

関連論文リスト