論文の概要: MICO: Selective Search with Mutual Information Co-training
- arxiv url: http://arxiv.org/abs/2209.04378v1
- Date: Fri, 9 Sep 2022 16:26:52 GMT
- ステータス: 処理完了
- システム内更新日: 2022-09-12 12:17:26.442534
- Title: MICO: Selective Search with Mutual Information Co-training
- Title(参考訳): MICO:相互情報協調学習による選択検索
- Authors: Zhanyu Wang, Xiao Zhang, Hyokun Yun, Choon Hui Teo, Trishul Chilimbi
- Abstract要約: MICOは、選択探索のための相互情報COトレーニングフレームワークである。
トレーニング後、MICOは文書をクラスタ化するだけでなく、検索を効率的にするために、未確認のクエリを関連するクラスタにルーティングする。
- 参考スコア(独自算出の注目度): 14.456028769565386
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: In contrast to traditional exhaustive search, selective search first clusters
documents into several groups before all the documents are searched
exhaustively by a query, to limit the search executed within one group or only
a few groups. Selective search is designed to reduce the latency and
computation in modern large-scale search systems. In this study, we propose
MICO, a Mutual Information CO-training framework for selective search with
minimal supervision using the search logs. After training, MICO does not only
cluster the documents, but also routes unseen queries to the relevant clusters
for efficient retrieval. In our empirical experiments, MICO significantly
improves the performance on multiple metrics of selective search and
outperforms a number of existing competitive baselines.
- Abstract(参考訳): 従来の徹底的な検索とは対照的に、選択的な検索ファーストは文書を複数のグループに分類し、すべての文書がクエリによって徹底的に検索される。
選択的検索は、現代の大規模検索システムにおけるレイテンシと計算量を削減するように設計されている。
本研究では,検索ログを用いた選択的検索のための相互情報協調学習フレームワークであるmicoを提案する。
トレーニング後、micoはドキュメントをクラスタ化するだけでなく、未取得のクエリを関連するクラスタにルーティングして効率的な検索を行う。
実証実験では、MICOは選択探索の複数の指標の性能を著しく改善し、既存の競争基準よりも優れています。
関連論文リスト
- PseudoSeer: a Search Engine for Pseudocode [18.726136894285403]
疑似コードを含む学術論文の効率的な検索と検索を容易にするために、新しい擬似コード検索エンジンが設計された。
スニペットを活用することで、ユーザはタイトル、抽象情報、著者情報、コードスニペットなど、紙のさまざまな面を検索できる。
重み付けされたBM25ベースのランキングアルゴリズムを検索エンジンで使用し、検索結果の優先順位付け時に考慮される要因について述べる。
論文 参考訳(メタデータ) (2024-11-19T16:58:03Z) - Query-oriented Data Augmentation for Session Search [71.84678750612754]
本稿では,検索ログの強化とモデリングの強化を目的としたクエリ指向データ拡張を提案する。
検索コンテキストの最も重要な部分を変更することで補足的なトレーニングペアを生成する。
我々は、現在のクエリを変更するためのいくつかの戦略を開発し、その結果、様々な難易度で新しいトレーニングデータを得る。
論文 参考訳(メタデータ) (2024-07-04T08:08:33Z) - ExcluIR: Exclusionary Neural Information Retrieval [74.08276741093317]
本稿では,排他的検索のためのリソースセットであるExcluIRを提案する。
評価ベンチマークには3,452の高品質な排他的クエリが含まれている。
トレーニングセットには70,293の排他的クエリが含まれており、それぞれに正のドキュメントと負のドキュメントがペアリングされている。
論文 参考訳(メタデータ) (2024-04-26T09:43:40Z) - Generative Retrieval as Multi-Vector Dense Retrieval [71.75503049199897]
生成検索は、文書の識別子をエンドツーエンドで生成する。
それまでの研究は、原子識別子による生成的検索が単一ベクトル密度検索と等価であることを示した。
生成的検索と多ベクトル高密度検索は,文書の問合せに対する関連性を測定するのと同じ枠組みを共有していることを示す。
論文 参考訳(メタデータ) (2024-03-31T13:29:43Z) - Survival of the Most Influential Prompts: Efficient Black-Box Prompt
Search via Clustering and Pruning [77.61565726647784]
本稿では,まず検索空間をクラスタ化してプルークするブラックボックス探索手法を提案する。
検索空間設計と最適化は,ブラックボックス・プロンプトに基づく学習の有用性と効率性を両立させる上で重要な役割を担っている。
論文 参考訳(メタデータ) (2023-10-19T14:25:06Z) - Deep Reinforcement Agent for Efficient Instant Search [14.086339486783018]
本稿では,関連する文書を検索する上で,意味的により健全なトークンを識別することで,負荷問題に対処することを提案する。
我々は、検索エンジンと直接対話し、単語の重要性を予測する強化エージェントを訓練する。
トリガーサーチ数とシステム性能のトレードオフを研究するために,新しい評価フレームワークを提案する。
論文 参考訳(メタデータ) (2022-03-17T22:47:15Z) - The Weights can be Harmful: Pareto Search versus Weighted Search in
Multi-Objective Search-Based Software Engineering [6.492599077364121]
明確な嗜好が存在する場合でも,重みは検索プロセスに有害であることを示す。
我々の重要な発見は、重み付けされた検索が、検索の初期段階で比較的少ないリソースを消費することで、一定のレベルのソリューション品質に達することである。
論文 参考訳(メタデータ) (2022-02-08T09:09:20Z) - Exploring Complicated Search Spaces with Interleaving-Free Sampling [127.07551427957362]
本稿では,長距離接続を伴う複雑な検索空間上に探索アルゴリズムを構築する。
我々はtextbfIF-NAS という単純なアルゴリズムを提案し、異なるサブネットワークを構築するために周期的なサンプリング戦略を実行する。
提案した探索空間において、IF-NASはランダムサンプリングと従来の重み付け検索のアルゴリズムを有意差で上回っている。
論文 参考訳(メタデータ) (2021-12-05T06:42:48Z) - Exposing Query Identification for Search Transparency [69.06545074617685]
本稿では,検索システムの2つのクラスにおいて,クエリとドキュメントの役割を逆転させることにより,検索タスクとしてのEQIの実現可能性について検討する。
本研究では,クエリのランク付けの質を評価するための評価基準を導出するとともに,近似EQIの様々な実践的側面に着目した経験的分析を行う。
論文 参考訳(メタデータ) (2021-10-14T20:19:27Z) - Improving Document Representations by Generating Pseudo Query Embeddings
for Dense Retrieval [11.465218502487959]
反復的なクラスタリングプロセスにより,各文書のクエリを模倣する手法を設計する。
また、2段階のスコア計算手順でマッチング関数を最適化する。
いくつかの人気ランキングとQAデータセットに関する実験結果から、私たちのモデルが最先端の結果を達成できることが示された。
論文 参考訳(メタデータ) (2021-05-08T05:28:24Z) - Searching for a Search Method: Benchmarking Search Algorithms for
Generating NLP Adversarial Examples [10.993342896547691]
自然言語処理(NLP)タスクの逆例を生成するために,複数のブラックボックス探索アルゴリズムの動作について検討した。
検索アルゴリズム,検索空間,検索予算の3つの要素を詳細に分析する。
論文 参考訳(メタデータ) (2020-09-09T17:04:42Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。