論文の概要: Dense Retrieval Adaptation using Target Domain Description
- arxiv url: http://arxiv.org/abs/2307.02740v1
- Date: Thu, 6 Jul 2023 02:59:47 GMT
- ステータス: 処理完了
- システム内更新日: 2023-07-07 15:24:54.766319
- Title: Dense Retrieval Adaptation using Target Domain Description
- Title(参考訳): ターゲットドメイン記述を用いたDense Retrieval Adaptation
- Authors: Helia Hashemi, Yong Zhuang, Sachith Sri Ram Kothur, Srivas Prasad,
Edgar Meij, W. Bruce Croft
- Abstract要約: ドメイン適応は、データ分布がソースドメインと異なる新しいドメインに検索モデルを適用するプロセスである。
本稿では,合成文書コレクション,クエリセット,擬似関連ラベルを生成する新しい自動データ構築パイプラインを提案する。
5つの異なる対象領域に対する実験により, 構築された合成データを用いた高密度検索モデルの適用により, 対象領域上での効率的な検索性能が得られた。
- 参考スコア(独自算出の注目度): 18.120678619163037
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: In information retrieval (IR), domain adaptation is the process of adapting a
retrieval model to a new domain whose data distribution is different from the
source domain. Existing methods in this area focus on unsupervised domain
adaptation where they have access to the target document collection or
supervised (often few-shot) domain adaptation where they additionally have
access to (limited) labeled data in the target domain. There also exists
research on improving zero-shot performance of retrieval models with no
adaptation. This paper introduces a new category of domain adaptation in IR
that is as-yet unexplored. Here, similar to the zero-shot setting, we assume
the retrieval model does not have access to the target document collection. In
contrast, it does have access to a brief textual description that explains the
target domain. We define a taxonomy of domain attributes in retrieval tasks to
understand different properties of a source domain that can be adapted to a
target domain. We introduce a novel automatic data construction pipeline that
produces a synthetic document collection, query set, and pseudo relevance
labels, given a textual domain description. Extensive experiments on five
diverse target domains show that adapting dense retrieval models using the
constructed synthetic data leads to effective retrieval performance on the
target domain.
- Abstract(参考訳): 情報検索(ir)において、ドメイン適応とは、データ分布がソースドメインとは異なる新しいドメインに検索モデルを適用するプロセスである。
この領域の既存の手法は、対象のドキュメントコレクションへのアクセスや、対象のドメイン内のラベル付き(制限された)データへのアクセスを監督(しばしば数ショット)するドメイン適応に焦点をあてている。
適応性のない検索モデルのゼロショット性能向上に関する研究もある。
本稿では、未探索のIRにおける領域適応の新しいカテゴリを紹介する。
ここではゼロショット設定と同様、検索モデルが対象文書コレクションにアクセスできないと仮定する。
対照的に、ターゲットドメインを説明する短いテキスト記述にアクセスすることができる。
検索タスクにおいて、対象ドメインに適合可能なソースドメインの異なる特性を理解するために、ドメイン属性の分類を定義する。
本稿では,テキストドメイン記述を前提として,合成文書コレクション,クエリセット,擬似関連ラベルを生成する新しい自動データ構築パイプラインを提案する。
5つの多様な対象領域に関する広範囲な実験により,構築した合成データを用いた高密度検索モデルの適用により,対象領域での効果的な検索性能が得られた。
関連論文リスト
- Phrase Grounding-based Style Transfer for Single-Domain Generalized
Object Detection [109.58348694132091]
単一ドメインの一般化オブジェクト検出は、複数の未確認対象ドメインに対するモデルの一般化性を高めることを目的としている。
これは、ターゲットのドメインデータをトレーニングに組み込むことなく、ドメインシフトに対処するモデルを必要とするため、実用的だが難しいタスクである。
そこで我々は,課題に対する新しい文節接頭辞に基づくスタイル伝達手法を提案する。
論文 参考訳(メタデータ) (2024-02-02T10:48:43Z) - A Two-Stage Framework with Self-Supervised Distillation For Cross-Domain Text Classification [46.47734465505251]
クロスドメインテキスト分類は、ラベル付きデータを持たないターゲットドメインにモデルを適応させることを目的としている。
クロスドメインテキスト分類のための2段階フレームワークを提案する。
論文 参考訳(メタデータ) (2023-04-18T06:21:40Z) - Domain-Agnostic Prior for Transfer Semantic Segmentation [197.9378107222422]
教師なしドメイン適応(UDA)はコンピュータビジョンコミュニティにおいて重要なトピックである。
ドメインに依存しない事前学習(DAP)を用いてドメイン間表現学習を規則化する機構を提案する。
我々の研究は、UDAがより良いプロキシ、おそらく他のデータモダリティの恩恵を受けていることを明らかにしている。
論文 参考訳(メタデータ) (2022-04-06T09:13:25Z) - Instance Relation Graph Guided Source-Free Domain Adaptive Object
Detection [79.89082006155135]
教師なしドメイン適応(Unsupervised Domain Adaptation, UDA)は、ドメインシフトの問題に取り組むための効果的なアプローチである。
UDAメソッドは、ターゲットドメインの一般化を改善するために、ソースとターゲット表現を整列させようとする。
Source-Free Adaptation Domain (SFDA)設定は、ソースデータへのアクセスを必要とせずに、ターゲットドメインに対してソーストレーニングされたモデルを適用することで、これらの懸念を軽減することを目的としている。
論文 参考訳(メタデータ) (2022-03-29T17:50:43Z) - Inferring Latent Domains for Unsupervised Deep Domain Adaptation [54.963823285456925]
Unsupervised Domain Adaptation (UDA)は、ラベル付きデータが利用できないターゲットドメインでモデルを学習する問題を指す。
本稿では,視覚データセット中の潜在ドメインを自動的に発見することにより,udaの問題に対処する新しい深層アーキテクチャを提案する。
提案手法を公開ベンチマークで評価し,最先端のドメイン適応手法よりも優れていることを示す。
論文 参考訳(メタデータ) (2021-03-25T14:33:33Z) - Domain Adaptation with Incomplete Target Domains [61.68950959231601]
本稿では、この新たなドメイン適応問題に対処するために、不完全データインプットに基づく Adversarial Network (IDIAN) モデルを提案する。
提案モデルでは,対象領域における部分的な観測に基づいて,欠落した特徴値を満たすデータ計算モジュールを設計する。
我々は、クロスドメインベンチマークタスクと、不完全なターゲットドメインを用いた実世界適応タスクの両方で実験を行う。
論文 参考訳(メタデータ) (2020-12-03T00:07:40Z) - Learning to Cluster under Domain Shift [20.00056591000625]
本研究では、ソースデータとターゲットデータの両方にアノテーションがない場合に、ソースからターゲットドメインに知識を転送する問題に対処する。
ディープクラスタリングに関する最近の研究から着想を得た私たちのアプローチは、複数のソースドメインから収集されたデータからの情報を活用する。
本手法は,少数のサンプルが存在する場合でも,関連する意味情報を自動的に発見できることを示す。
論文 参考訳(メタデータ) (2020-08-11T12:03:01Z) - Cross-domain Self-supervised Learning for Domain Adaptation with Few
Source Labels [78.95901454696158]
ドメイン適応のためのクロスドメイン自己教師型学習手法を提案する。
本手法は,ソースラベルが少ない新しいターゲット領域において,ターゲット精度を著しく向上させる。
論文 参考訳(メタデータ) (2020-03-18T15:11:07Z) - Enlarging Discriminative Power by Adding an Extra Class in Unsupervised
Domain Adaptation [5.377369521932011]
新たに人工的なクラスを追加し、新しいクラスのGAN生成サンプルとともにデータ上でモデルをトレーニングする。
私たちのアイデアは、DANN、VADA、DIRT-Tといった既存のメソッドと互換性がある、非常に一般的なものです。
論文 参考訳(メタデータ) (2020-02-19T07:58:24Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。