Fugu-MT 論文翻訳(概要): Towards Dynamic Dense Retrieval with Routing Strategy

論文の概要: Towards Dynamic Dense Retrieval with Routing Strategy

arxiv url: http://arxiv.org/abs/2602.22547v1
Date: Thu, 26 Feb 2026 02:38:40 GMT
ステータス: 翻訳完了
システム内更新日: 2026-02-27 18:41:22.491306
Title: Towards Dynamic Dense Retrieval with Routing Strategy
Title（参考訳）: ルーティング戦略による動的高密度検索に向けて
Authors: Zhan Su, Fengran Mo, Jinghan Zhang, Yuchen Hui, Jia Ao Sun, Bingbing Wen, Jian-Yun Nie,
Abstract要約: DDR(textitdynamic dense search)と呼ばれる新しい高密度検索手法を提案する。 DDRは、特定のドメインに特化したテキストモジュールとして、テキストチューニングを使用する。これらのモジュールは、動的ルーティング戦略と組み合わせることで、検索部に高い柔軟性を持つドメイン適応を可能にする。 6つのゼロショットダウンストリームタスクに対する広範囲な評価は、このアプローチがDRを越え、トレーニングパラメータの2%しか利用せず、IRのより柔軟な高密度検索を実現する方法を示している。
参考スコア（独自算出の注目度）: 24.128232978517076
License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
Abstract: The \textit{de facto} paradigm for applying dense retrieval (DR) to new tasks involves fine-tuning a pre-trained model for a specific task. However, this paradigm has two significant limitations: (1) It is difficult adapt the DR to a new domain if the training dataset is limited. (2) Old DR models are simply replaced by newer models that are trained from scratch when the former are no longer up to date. Especially for scenarios where the model needs to be updated frequently, this paradigm is prohibitively expensive. To address these challenges, we propose a novel dense retrieval approach, termed \textit{dynamic dense retrieval} (DDR). DDR uses \textit{prefix tuning} as a \textit{module} specialized for a specific domain. These modules can then be compositional combined with a dynamic routing strategy, enabling highly flexible domain adaptation in the retrieval part. Extensive evaluation on six zero-shot downstream tasks demonstrates that this approach can surpass DR while utilizing only 2\% of the training parameters, paving the way to achieve more flexible dense retrieval in IR. We see it as a promising future direction for applying dense retrieval to various tasks.
Abstract（参考訳）: 新しいタスクに高密度検索(DR)を適用するための‘textit{de facto}パラダイムは、特定のタスクのために事前訓練されたモデルを微調整する。しかし、このパラダイムには2つの重要な制限がある。(1)トレーニングデータセットが制限されている場合、DRを新しいドメインに適応させることは困難である。 2) 従来の DR モデルは単に新しいモデルに置き換えられ、以前のモデルがもはや最新のものになっていないとき、スクラッチからトレーニングされる。特に、モデルを頻繁に更新する必要があるシナリオでは、このパラダイムは違法に高価です。これらの課題に対処するため,新しい高密度検索手法である「textit{dynamic dense search} (DDR)」を提案する。 DDRは特定のドメインに特化した \textit{prefix tuning} を \textit{module} として使用する。これらのモジュールは動的ルーティング戦略と組み合わせて構成することができ、検索部において高い柔軟性を持つドメイン適応を可能にする。 6つのゼロショットダウンストリームタスクに対する広範囲な評価は、この手法がDRを超えることを示し、トレーニングパラメータの2倍しか利用せず、IRにおけるより柔軟な高密度検索を実現するための道を開いた。様々なタスクに高密度検索を適用する上で,将来的な方向性として期待できる。

関連論文リスト

GLASS: A Generative Recommender for Long-sequence Modeling via SID-Tier and Semantic Search [51.44490997013772]
GLASSは、SID-TierとSemantic Searchを通じて、長期的なユーザ関心を生成プロセスに統合する新しいフレームワークである。 GLASSは2つの大規模実世界のデータセットの実験において最先端のベースラインを上回っていることを示す。
論文参考訳（メタデータ） (2026-02-05T13:48:33Z)
SitEmb-v1.5: Improved Context-Aware Dense Retrieval for Semantic Association and Long Story Comprehension [77.93156509994994]
本研究では,検索性能を向上させるために,より広いコンテキストウインドウに条件付きで短いチャンクを表現する方法を示す。既存の埋め込みモデルは、そのような場所のコンテキストを効果的にエンコードするのに十分な装備がない。我々の手法は、最先端の埋め込みモデルよりも大幅に優れている。
論文参考訳（メタデータ） (2025-08-03T23:59:31Z)
UniSTD: Towards Unified Spatio-Temporal Learning across Diverse Disciplines [64.84631333071728]
本稿では,時間的モデリングのためのトランスフォーマーベースの統合フレームワークであるbfUnistageを紹介する。我々の研究は、タスク固有の視覚テキストが時間学習のための一般化可能なモデルを構築することができることを示した。また、時間的ダイナミクスを明示的に組み込むための時間的モジュールも導入する。
論文参考訳（メタデータ） (2025-03-26T17:33:23Z)
Birdie: Advancing State Space Models with Reward-Driven Objectives and Curricula [23.071384759427072]
状態空間モデル(SSM)はトランスフォーマーよりも利点があるが、長期のコンテキスト内検索のようなテキストコピー、連想リコール、質問応答を必要とするタスクに苦労する。本研究では,SSMのコンテキスト内検索能力を大幅に向上する新たな学習手法であるBirdieを提案する。
論文参考訳（メタデータ） (2024-11-01T21:01:13Z)
Frequency Disentangled Learning for Segmentation of Midbrain Structures from Quantitative Susceptibility Mapping Data [1.9150304734969674]
深層モデルでは、ターゲット関数を低周波数から高周波数に適合させる傾向がある。ディープセグメンテーションモデルのトレーニングに十分なサンプルがない場合が多い。周波数領域の絡み合いに基づく新しいトレーニング手法を提案する。
論文参考訳（メタデータ） (2023-02-25T04:30:11Z)
DPTDR: Deep Prompt Tuning for Dense Passage Retrieval [53.217524851268216]
ディーププロンプトチューニング(DPT)は多くの自然言語処理(NLP)タスクで大きな成功を収めている。しかし、微細チューニング(FT)が依然として支配的な高密度検索においては、十分に解明されていない。本稿では,DPTに基づく検索手法,すなわち検索指向の中間事前学習と統合負のマイニングの2つのモデル非依存型およびタスク非依存型戦略を提案する。
論文参考訳（メタデータ） (2022-08-24T12:55:00Z)
Disentangled Modeling of Domain and Relevance for Adaptable Dense Retrieval [54.349418995689284]
本稿では,Dense Retrieval (DDR) という新しいフレームワークを提案する。 REMとDAMをアンタングルにすることで、DDRはフレキシブルなトレーニングパラダイムを可能にし、REMは一度監視でトレーニングされ、DAMは教師なしのデータでトレーニングされる。 DDRは強力なDRベースラインに比べて格付け性能が大幅に向上し、ほとんどのシナリオにおいて従来の検索手法よりも大幅に向上する。
論文参考訳（メタデータ） (2022-08-11T11:18:50Z)
Retrieve-and-Fill for Scenario-based Task-Oriented Semantic Parsing [110.4684789199555]
シナリオベースのセマンティックパーシングを導入し、最初に発話の「scenario」を曖昧にする必要がある元のタスクの変種を紹介します。この定式化により、タスクの粗くきめ細かな側面を分離することが可能となり、それぞれがオフザシェルフニューラルネットワークモジュールで解決される。私たちのモデルはモジュール化され、差別化可能で、解釈可能で、シナリオから余分な監督を得られるようになります。
論文参考訳（メタデータ） (2022-02-02T08:00:21Z)
Bilevel Online Adaptation for Out-of-Domain Human Mesh Reconstruction [94.25865526414717]
本稿では,事前に訓練されたヒトメッシュ再構築モデルをドメイン外ストリーミングビデオに適応させるという新たな問題を検討する。重みプローブと重み更新の2つのステップに全体多対象の最適化プロセスを分割するBilevel Online Adaptationを提案します。 BOAが2つのヒューマンメッシュ再構築ベンチマークで最先端の結果をもたらすことを実証する。
論文参考訳（メタデータ） (2021-03-30T15:47:58Z)
Lifelong Learning Without a Task Oracle [13.331659934508764]
監視されたディープニューラルネットワークは、新しいタスクが学習されると、古いタスクの精度が大幅に低下することが知られている。本稿では,メモリオーバーヘッドの少ないタスク割り当てマップの提案と比較を行う。最高のパフォーマンスの変種は、平均的なパラメータメモリの増大を1.7%に抑えるだけである。
論文参考訳（メタデータ） (2020-11-09T21:30:31Z)
Low-Resource Domain Adaptation for Compositional Task-Oriented Semantic Parsing [85.35582118010608]
タスク指向のセマンティックパーシングは仮想アシスタントの重要なコンポーネントである。近年のディープラーニングの進歩は、より複雑なクエリを解析するいくつかのアプローチを可能にしている。そこで本研究では,教師付きニューラルネットワークを10倍の精度で高速化する手法を提案する。
論文参考訳（メタデータ） (2020-10-07T17:47:53Z)
Zero-shot Neural Passage Retrieval via Domain-targeted Synthetic Question Generation [10.324402925019946]
ニューラルネットワークモデルの普及に対する大きな障害は、従来の用語ベースのテクニックを超えるために、大規模な教師付きトレーニングセットが必要であることである。本稿では,このギャップを埋めるために合成質問生成を用いる経路探索のためのゼロショット学習手法を提案する。
論文参考訳（メタデータ） (2020-04-29T22:21:31Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。