論文の概要: Leveraging semantically similar queries for ranking via combining
representations
- arxiv url: http://arxiv.org/abs/2106.12621v1
- Date: Wed, 23 Jun 2021 18:36:20 GMT
- ステータス: 処理完了
- システム内更新日: 2021-06-25 14:49:47.566741
- Title: Leveraging semantically similar queries for ranking via combining
representations
- Title(参考訳): 表現の組み合わせによるランキングのセマンティックな類似クエリの活用
- Authors: Hayden S. Helm and Marah Abdin and Benjamin D. Pedigo and Shweti
Mahajan and Vince Lyzinski and Youngser Park and Amitabh Basu and
Piali~Choudhury and Christopher M. White and Weiwei Yang and Carey E. Priebe
- Abstract要約: データスカース設定では、特定のクエリで利用可能なラベル付きデータの量は、高度に可変で効率の悪いランキング関数につながる可能性がある。
少量のデータの影響を軽減する一つの方法は、セマンティックに類似したクエリからの情報を活用することである。
我々は,この現象をバイアス分散トレードオフの文脈で記述し,Bingナビゲーショングラフとショウジョウバエ幼虫コネクトームのデータスカース設定に適用する。
- 参考スコア(独自算出の注目度): 20.79800117378761
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: In modern ranking problems, different and disparate representations of the
items to be ranked are often available. It is sensible, then, to try to combine
these representations to improve ranking. Indeed, learning to rank via
combining representations is both principled and practical for learning a
ranking function for a particular query. In extremely data-scarce settings,
however, the amount of labeled data available for a particular query can lead
to a highly variable and ineffective ranking function. One way to mitigate the
effect of the small amount of data is to leverage information from semantically
similar queries. Indeed, as we demonstrate in simulation settings and real data
examples, when semantically similar queries are available it is possible to
gainfully use them when ranking with respect to a particular query. We describe
and explore this phenomenon in the context of the bias-variance trade off and
apply it to the data-scarce settings of a Bing navigational graph and the
Drosophila larva connectome.
- Abstract(参考訳): 現代のランキング問題では、ランク付けされる項目の異なる、異なる表現がしばしば利用できる。
したがって、これらの表現を組み合わせてランキングを改善するのは賢明である。
実際、表現を組み合わせることでランク付けを学ぶことは、特定のクエリのランク付け関数を学ぶための原則と実践の両方である。
しかし、極めてデータ量の多い設定では、特定のクエリで利用可能なラベル付きデータの量は、高度に可変で非効率なランキング機能につながる可能性がある。
少量のデータの影響を軽減する一つの方法は、セマンティックに類似したクエリからの情報を活用することである。
実際、シミュレーション設定や実データ例で示すように、セマンティックに類似したクエリが利用可能であれば、特定のクエリに対してランク付けするときに、それらを適切に使用できる。
我々は,この現象をバイアス分散トレードオフの文脈で記述し,Bingナビゲーショングラフとショウジョウバエ幼虫コネクトームのデータスカース設定に適用する。
関連論文リスト
- HyQE: Ranking Contexts with Hypothetical Query Embeddings [9.23634055123276]
検索拡張システムでは、検索したコンテキストをユーザクエリとの関連性に基づいて順序付けするために、コンテキストランキング技術が一般的に使用される。
大規模言語モデル(LLM)は、文脈のランク付けに使われてきた。
LLMの微調整を必要とせずに、埋め込み類似性とLLM機能を組み合わせたスケーラブルなランキングフレームワークを導入する。
論文 参考訳(メタデータ) (2024-10-20T03:15:01Z) - Query-oriented Data Augmentation for Session Search [71.84678750612754]
本稿では,検索ログの強化とモデリングの強化を目的としたクエリ指向データ拡張を提案する。
検索コンテキストの最も重要な部分を変更することで補足的なトレーニングペアを生成する。
我々は、現在のクエリを変更するためのいくつかの戦略を開発し、その結果、様々な難易度で新しいトレーニングデータを得る。
論文 参考訳(メタデータ) (2024-07-04T08:08:33Z) - Database-Augmented Query Representation for Information Retrieval [59.57065228857247]
データベース拡張クエリ表現(DAQu)と呼ばれる新しい検索フレームワークを提案する。
DAQuは、元のクエリを複数のテーブルにまたがるさまざまな(クエリ関連の)メタデータで拡張する。
リレーショナルデータベースのメタデータを組み込む様々な検索シナリオにおいてDAQuを検証する。
論文 参考訳(メタデータ) (2024-06-23T05:02:21Z) - The Surprising Effectiveness of Rankers Trained on Expanded Queries [4.874071145951159]
我々は,他のクエリのパフォーマンスを損なうことなく,難しいクエリや難しいクエリのランク付け性能を向上させる。
我々は,クエリ毎に推定されるクエリ性能スコアとともに,特殊ランク付け器と基本ランク付け器の関連性スコアを組み合わせる。
DL-Hardデータセットを用いた実験では,クエリ性能に基づくスコアリング手法が,パスランキングタスクにおいて最大25%の大幅な改善を実現していることがわかった。
論文 参考訳(メタデータ) (2024-04-03T09:12:22Z) - Learning List-Level Domain-Invariant Representations for Ranking [59.3544317373004]
リストレベルのアライメント -- より高いレベルのリストでドメイン不変表現を学習する。
利点は2つある: これは、ランク付けに縛られる最初のドメイン適応の一般化をもたらし、その結果、提案法に対する理論的支援を提供する。
論文 参考訳(メタデータ) (2022-12-21T04:49:55Z) - Exposing Query Identification for Search Transparency [69.06545074617685]
本稿では,検索システムの2つのクラスにおいて,クエリとドキュメントの役割を逆転させることにより,検索タスクとしてのEQIの実現可能性について検討する。
本研究では,クエリのランク付けの質を評価するための評価基準を導出するとともに,近似EQIの様々な実践的側面に着目した経験的分析を行う。
論文 参考訳(メタデータ) (2021-10-14T20:19:27Z) - Connecting Images through Time and Sources: Introducing Low-data,
Heterogeneous Instance Retrieval [3.6526118822907594]
バリエーションやセマンティックな内容のパネルによく反応する機能を選択するのは簡単ではないことを示す。
Alegoriaベンチマークの新しい拡張バージョンを導入し、詳細なアノテーションを使って記述子を比較します。
論文 参考訳(メタデータ) (2021-03-19T10:54:51Z) - PiRank: Learning To Rank via Differentiable Sorting [85.28916333414145]
ランク付けのための新しい分類可能なサロゲートであるPiRankを提案する。
ピランクは所望の指標をゼロ温度の限界で正確に回収する。
論文 参考訳(メタデータ) (2020-12-12T05:07:36Z) - Surprise: Result List Truncation via Extreme Value Theory [92.5817701697342]
そこで本研究では,問合せ時における可逆的・校正的関連度スコアを,ランク付けされたスコアに留まらず,統計的に生成する手法を提案する。
本稿では、画像、テキスト、IRデータセット間での結果リストのトランケーションタスクにおいて、その効果を実証する。
論文 参考訳(メタデータ) (2020-10-19T19:15:50Z) - Distance-based Positive and Unlabeled Learning for Ranking [13.339237388350043]
階級の学習は一般的な関心の問題である。
整数線形プログラムを用いた表現の組み合わせによるランク付け学習は,「興味のある項目に類似する項目は少ない」ほど軽快な場合には有効であることを示す。
論文 参考訳(メタデータ) (2020-05-20T01:53:58Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。