Fugu-MT 論文翻訳(概要): Deep Domain Specialisation for single-model multi-domain learning to rank

論文の概要: Deep Domain Specialisation for single-model multi-domain learning to rank

arxiv url: http://arxiv.org/abs/2407.01069v1
Date: Mon, 01 Jul 2024 08:19:19 GMT
ステータス: 翻訳完了
システム内更新日: 2024-12-02 04:16:09.603023
Title: Deep Domain Specialisation for single-model multi-domain learning to rank
Title（参考訳）: シングルモデルマルチドメイン学習におけるランク付けのためのディープドメインスペシャライゼーション
Authors: Paul Missault, Abdelmaseeh Felfel,
Abstract要約: 複数のモデルをトレーニングし、メンテナンスし、更新するコストは、すべてのドメインに責任を持つ単一のモデルを持つよりも高い。本稿では,複数のドメインをひとつのモデルに統合するディープ・ドメイン・スペシャライゼーション(DDS)のアーキテクチャを提案する。
参考スコア（独自算出の注目度）: 1.534667887016089
License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
Abstract: Information Retrieval (IR) practitioners often train separate ranking models for different domains (geographic regions, languages, stores, websites,...) as it is believed that exclusively training on in-domain data yields the best performance when sufficient data is available. Despite their performance gains, training multiple models comes at a higher cost to train, maintain and update compared to having only a single model responsible for all domains. Our work explores consolidated ranking models that serve multiple domains. Specifically, we propose a novel architecture of Deep Domain Specialisation (DDS) to consolidate multiple domains into a single model. We compare our proposal against Deep Domain Adaptation (DDA) and a set of baseline for multi-domain models. In our experiments, DDS performed the best overall while requiring fewer parameters per domain as other baselines. We show the efficacy of our method both with offline experimentation and on a large-scale online experiment on Amazon customer traffic.
Abstract（参考訳）: 情報検索(IR)実践者は、しばしば異なるドメイン(地理領域、言語、ストア、ウェブサイトなど)の異なるランキングモデルを訓練する。パフォーマンスの向上にもかかわらず、複数のモデルをトレーニングし、メンテナンスし、更新するコストが高い。本稿では,複数のドメインを対象とする総合的なランキングモデルについて検討する。具体的には、複数のドメインを単一のモデルに統合するディープ・ドメイン・スペシャライゼーション(DDS)のアーキテクチャを提案する。我々は、Deep Domain Adaptation (DDA)に対する提案と、マルチドメインモデルのベースラインセットを比較した。我々の実験では、DDSはドメインごとのパラメータを他のベースラインとして必要としながら、総合的に最善を尽くした。本手法は,オフライン実験と大規模オンライン実験の両方において,Amazonの顧客トラフィックに対する有効性を示す。

関連論文リスト

Selecting and Merging: Towards Adaptable and Scalable Named Entity Recognition with Large Language Models [5.466962214217334]
Supervised Fine-tuning (SFT) は、大きな言語モデル(LLM)と、名前付きエンティティ認識(NER)のような情報抽出(IE)タスクの整合に広く用いられている。推論時に専門家モデルを動的に選択・マージするSaMフレームワークを提案する。
論文参考訳（メタデータ） (2025-06-28T08:28:52Z)
A Unified Data Augmentation Framework for Low-Resource Multi-Domain Dialogue Generation [52.0964459842176]
現在の最先端の対話システムは、広範なトレーニングデータセットに大きく依存している。我々はtextbfAMD$2$G と呼ばれる textbfMulti-textbfDomain textbfDialogue textbfGeneration のための新しいデータ textbfAugmentation フレームワークを提案する。 AMD$2$Gフレームワークは、データ拡張プロセスと、ドメインに依存しないトレーニングとドメイン適応トレーニングという2段階のトレーニングアプローチで構成されている。
論文参考訳（メタデータ） (2024-06-14T09:52:27Z)
Virtual Classification: Modulating Domain-Specific Knowledge for Multidomain Crowd Counting [67.38137379297717]
マルチドメインのクラウドカウントは、複数の多様なデータセットの一般的なモデルを学ぶことを目的としている。ディープネットワークは、ドメインバイアスとして知られるすべてのドメインではなく、支配的なドメインの分布をモデル化することを好む。マルチドメイン群カウントにおけるドメインバイアス問題を処理するために,MDKNet(Modulating Domain-specific Knowledge Network)を提案する。
論文参考訳（メタデータ） (2024-02-06T06:49:04Z)
Decoupled Training: Return of Frustratingly Easy Multi-Domain Learning [20.17925272562433]
マルチドメイン学習は、複数の重複するが識別できないドメインにわたって、最小限の平均リスクでモデルをトレーニングすることを目的としている。本稿では,D-Train(Decoupled Training, D-Train)を提案する。 D-Trainは、まずルートモデルを温めるためにすべてのドメインで事前訓練を行い、その後、複数のヘッドに分割して各ドメインでトレーニングを行い、最後にバックボーンを固定して頭部を微調整する3段階の総合訓練戦略である。
論文参考訳（メタデータ） (2023-09-19T04:06:41Z)
Adapting Self-Supervised Representations to Multi-Domain Setups [47.03992469282679]
現在の最先端の自己教師型アプローチは、個々のドメインで訓練するときに有効であるが、目に見えないドメインでは限定的な一般化を示す。本稿では,汎用的で軽量なドメイン・ディスタングル・モジュールを提案する。
論文参考訳（メタデータ） (2023-09-07T20:05:39Z)
Exploring Distributional Shifts in Large Language Models for Code Analysis [36.73114441988879]
コード機能を持つ3つの大規模言語モデルがどのようにドメイン外データに一般化するかを検討する。コード要約とコード生成という,2つの基本的なアプリケーションについて検討する。複数のドメインに適応したモデルが同時に、単一のドメインに適応したモデルと同等に動作していることが分かりました。
論文参考訳（メタデータ） (2023-03-16T07:45:46Z)
Meta-DMoE: Adapting to Domain Shift by Meta-Distillation from Mixture-of-Experts [33.21435044949033]
既存のほとんどのメソッドは、単一のモデルを使って複数のソースドメインでトレーニングを行います。本稿では,知識蒸留プロセスとして定式化された非教師なし試験時間適応のための新しいフレームワークを提案する。
論文参考訳（メタデータ） (2022-10-08T02:28:10Z)
Disentangled Modeling of Domain and Relevance for Adaptable Dense Retrieval [54.349418995689284]
本稿では,Dense Retrieval (DDR) という新しいフレームワークを提案する。 REMとDAMをアンタングルにすることで、DDRはフレキシブルなトレーニングパラダイムを可能にし、REMは一度監視でトレーニングされ、DAMは教師なしのデータでトレーニングされる。 DDRは強力なDRベースラインに比べて格付け性能が大幅に向上し、ほとんどのシナリオにおいて従来の検索手法よりも大幅に向上する。
論文参考訳（メタデータ） (2022-08-11T11:18:50Z)
Variational Attention: Propagating Domain-Specific Knowledge for Multi-Domain Learning in Crowd Counting [75.80116276369694]
群集カウントでは, 激しいラベル付けの問題により, 新しい大規模データセットを収集する難易度が知覚される。マルチドメイン共同学習を活用し,DKPNet(Domain-specific Knowledge Propagating Network)を提案する。主に、異なるドメインに対する注意分布を明示的にモデル化する、新しい変動注意法(VA)技術を提案する。
論文参考訳（メタデータ） (2021-08-18T08:06:37Z)
Batch Normalization Embeddings for Deep Domain Generalization [50.51405390150066]
ドメインの一般化は、異なるドメインと見えないドメインで堅牢に実行されるように機械学習モデルをトレーニングすることを目的としている。一般的な領域一般化ベンチマークにおいて,最先端技術よりも分類精度が著しく向上したことを示す。
論文参考訳（メタデータ） (2020-11-25T12:02:57Z)
Multi-Domain Spoken Language Understanding Using Domain- and Task-Aware Parameterization [78.93669377251396]
音声言語理解は、各ドメインでトレーニングデータのセットが利用できる教師付き学習問題として対処されてきた。既存の1つのアプローチは、ドメイン間の共同トレーニングに共有パラメータを使用して、マルチドメイン学習を行うことによって、この問題を解決する。本稿では,ドメイン固有モデルパラメータとタスク固有モデルパラメータを用いて,この手法のパラメータ化を改善することを提案する。
論文参考訳（メタデータ） (2020-04-30T15:15:40Z)
Dynamic Fusion Network for Multi-Domain End-to-end Task-Oriented Dialog [70.79442700890843]
本稿では,対象ドメインと各ドメインの関連性を自動的に活用する新しい動的核融合ネットワーク(DF-Net)を提案する。トレーニングデータが少ないと、平均13.9%の事前最良モデルを上回り、転送可能性を示す。
論文参考訳（メタデータ） (2020-04-23T08:17:22Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。