論文の概要: Towards Dynamic Dense Retrieval with Routing Strategy
- arxiv url: http://arxiv.org/abs/2602.22547v1
- Date: Thu, 26 Feb 2026 02:38:40 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-02-27 18:41:22.491306
- Title: Towards Dynamic Dense Retrieval with Routing Strategy
- Title(参考訳): ルーティング戦略による動的高密度検索に向けて
- Authors: Zhan Su, Fengran Mo, Jinghan Zhang, Yuchen Hui, Jia Ao Sun, Bingbing Wen, Jian-Yun Nie,
- Abstract要約: DDR(textitdynamic dense search)と呼ばれる新しい高密度検索手法を提案する。
DDRは、特定のドメインに特化したテキストモジュールとして、テキストチューニングを使用する。これらのモジュールは、動的ルーティング戦略と組み合わせることで、検索部に高い柔軟性を持つドメイン適応を可能にする。
6つのゼロショットダウンストリームタスクに対する広範囲な評価は、このアプローチがDRを越え、トレーニングパラメータの2%しか利用せず、IRのより柔軟な高密度検索を実現する方法を示している。
- 参考スコア(独自算出の注目度): 24.128232978517076
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: The \textit{de facto} paradigm for applying dense retrieval (DR) to new tasks involves fine-tuning a pre-trained model for a specific task. However, this paradigm has two significant limitations: (1) It is difficult adapt the DR to a new domain if the training dataset is limited. (2) Old DR models are simply replaced by newer models that are trained from scratch when the former are no longer up to date. Especially for scenarios where the model needs to be updated frequently, this paradigm is prohibitively expensive. To address these challenges, we propose a novel dense retrieval approach, termed \textit{dynamic dense retrieval} (DDR). DDR uses \textit{prefix tuning} as a \textit{module} specialized for a specific domain. These modules can then be compositional combined with a dynamic routing strategy, enabling highly flexible domain adaptation in the retrieval part. Extensive evaluation on six zero-shot downstream tasks demonstrates that this approach can surpass DR while utilizing only 2\% of the training parameters, paving the way to achieve more flexible dense retrieval in IR. We see it as a promising future direction for applying dense retrieval to various tasks.
- Abstract(参考訳): 新しいタスクに高密度検索(DR)を適用するための‘textit{de facto}パラダイムは、特定のタスクのために事前訓練されたモデルを微調整する。
しかし、このパラダイムには2つの重要な制限がある。(1)トレーニングデータセットが制限されている場合、DRを新しいドメインに適応させることは困難である。
2) 従来の DR モデルは単に新しいモデルに置き換えられ、以前のモデルがもはや最新のものになっていないとき、スクラッチからトレーニングされる。
特に、モデルを頻繁に更新する必要があるシナリオでは、このパラダイムは違法に高価です。
これらの課題に対処するため,新しい高密度検索手法である「textit{dynamic dense search} (DDR)」を提案する。
DDRは特定のドメインに特化した \textit{prefix tuning} を \textit{module} として使用する。
これらのモジュールは動的ルーティング戦略と組み合わせて構成することができ、検索部において高い柔軟性を持つドメイン適応を可能にする。
6つのゼロショットダウンストリームタスクに対する広範囲な評価は、この手法がDRを超えることを示し、トレーニングパラメータの2倍しか利用せず、IRにおけるより柔軟な高密度検索を実現するための道を開いた。
様々なタスクに高密度検索を適用する上で,将来的な方向性として期待できる。
関連論文リスト
- GLASS: A Generative Recommender for Long-sequence Modeling via SID-Tier and Semantic Search [51.44490997013772]
GLASSは、SID-TierとSemantic Searchを通じて、長期的なユーザ関心を生成プロセスに統合する新しいフレームワークである。
GLASSは2つの大規模実世界のデータセットの実験において最先端のベースラインを上回っていることを示す。
論文 参考訳(メタデータ) (2026-02-05T13:48:33Z) - SitEmb-v1.5: Improved Context-Aware Dense Retrieval for Semantic Association and Long Story Comprehension [77.93156509994994]
本研究では,検索性能を向上させるために,より広いコンテキストウインドウに条件付きで短いチャンクを表現する方法を示す。
既存の埋め込みモデルは、そのような場所のコンテキストを効果的にエンコードするのに十分な装備がない。
我々の手法は、最先端の埋め込みモデルよりも大幅に優れている。
論文 参考訳(メタデータ) (2025-08-03T23:59:31Z) - Birdie: Advancing State Space Models with Reward-Driven Objectives and Curricula [23.071384759427072]
状態空間モデル(SSM)はトランスフォーマーよりも利点があるが、長期のコンテキスト内検索のようなテキストコピー、連想リコール、質問応答を必要とするタスクに苦労する。
本研究では,SSMのコンテキスト内検索能力を大幅に向上する新たな学習手法であるBirdieを提案する。
論文 参考訳(メタデータ) (2024-11-01T21:01:13Z) - Disentangled Modeling of Domain and Relevance for Adaptable Dense
Retrieval [54.349418995689284]
本稿では,Dense Retrieval (DDR) という新しいフレームワークを提案する。
REMとDAMをアンタングルにすることで、DDRはフレキシブルなトレーニングパラダイムを可能にし、REMは一度監視でトレーニングされ、DAMは教師なしのデータでトレーニングされる。
DDRは強力なDRベースラインに比べて格付け性能が大幅に向上し、ほとんどのシナリオにおいて従来の検索手法よりも大幅に向上する。
論文 参考訳(メタデータ) (2022-08-11T11:18:50Z) - Retrieve-and-Fill for Scenario-based Task-Oriented Semantic Parsing [110.4684789199555]
シナリオベースのセマンティックパーシングを導入し、最初に発話の「scenario」を曖昧にする必要がある元のタスクの変種を紹介します。
この定式化により、タスクの粗くきめ細かな側面を分離することが可能となり、それぞれがオフザシェルフニューラルネットワークモジュールで解決される。
私たちのモデルはモジュール化され、差別化可能で、解釈可能で、シナリオから余分な監督を得られるようになります。
論文 参考訳(メタデータ) (2022-02-02T08:00:21Z) - Bilevel Online Adaptation for Out-of-Domain Human Mesh Reconstruction [94.25865526414717]
本稿では,事前に訓練されたヒトメッシュ再構築モデルをドメイン外ストリーミングビデオに適応させるという新たな問題を検討する。
重みプローブと重み更新の2つのステップに全体多対象の最適化プロセスを分割するBilevel Online Adaptationを提案します。
BOAが2つのヒューマンメッシュ再構築ベンチマークで最先端の結果をもたらすことを実証する。
論文 参考訳(メタデータ) (2021-03-30T15:47:58Z) - Low-Resource Domain Adaptation for Compositional Task-Oriented Semantic
Parsing [85.35582118010608]
タスク指向のセマンティックパーシングは仮想アシスタントの重要なコンポーネントである。
近年のディープラーニングの進歩は、より複雑なクエリを解析するいくつかのアプローチを可能にしている。
そこで本研究では,教師付きニューラルネットワークを10倍の精度で高速化する手法を提案する。
論文 参考訳(メタデータ) (2020-10-07T17:47:53Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。