論文の概要: Leveraging semantically similar queries for ranking via combining
representations
- arxiv url: http://arxiv.org/abs/2106.12621v1
- Date: Wed, 23 Jun 2021 18:36:20 GMT
- ステータス: 処理完了
- システム内更新日: 2021-06-25 14:49:47.566741
- Title: Leveraging semantically similar queries for ranking via combining
representations
- Title(参考訳): 表現の組み合わせによるランキングのセマンティックな類似クエリの活用
- Authors: Hayden S. Helm and Marah Abdin and Benjamin D. Pedigo and Shweti
Mahajan and Vince Lyzinski and Youngser Park and Amitabh Basu and
Piali~Choudhury and Christopher M. White and Weiwei Yang and Carey E. Priebe
- Abstract要約: データスカース設定では、特定のクエリで利用可能なラベル付きデータの量は、高度に可変で効率の悪いランキング関数につながる可能性がある。
少量のデータの影響を軽減する一つの方法は、セマンティックに類似したクエリからの情報を活用することである。
我々は,この現象をバイアス分散トレードオフの文脈で記述し,Bingナビゲーショングラフとショウジョウバエ幼虫コネクトームのデータスカース設定に適用する。
- 参考スコア(独自算出の注目度): 20.79800117378761
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: In modern ranking problems, different and disparate representations of the
items to be ranked are often available. It is sensible, then, to try to combine
these representations to improve ranking. Indeed, learning to rank via
combining representations is both principled and practical for learning a
ranking function for a particular query. In extremely data-scarce settings,
however, the amount of labeled data available for a particular query can lead
to a highly variable and ineffective ranking function. One way to mitigate the
effect of the small amount of data is to leverage information from semantically
similar queries. Indeed, as we demonstrate in simulation settings and real data
examples, when semantically similar queries are available it is possible to
gainfully use them when ranking with respect to a particular query. We describe
and explore this phenomenon in the context of the bias-variance trade off and
apply it to the data-scarce settings of a Bing navigational graph and the
Drosophila larva connectome.
- Abstract(参考訳): 現代のランキング問題では、ランク付けされる項目の異なる、異なる表現がしばしば利用できる。
したがって、これらの表現を組み合わせてランキングを改善するのは賢明である。
実際、表現を組み合わせることでランク付けを学ぶことは、特定のクエリのランク付け関数を学ぶための原則と実践の両方である。
しかし、極めてデータ量の多い設定では、特定のクエリで利用可能なラベル付きデータの量は、高度に可変で非効率なランキング機能につながる可能性がある。
少量のデータの影響を軽減する一つの方法は、セマンティックに類似したクエリからの情報を活用することである。
実際、シミュレーション設定や実データ例で示すように、セマンティックに類似したクエリが利用可能であれば、特定のクエリに対してランク付けするときに、それらを適切に使用できる。
我々は,この現象をバイアス分散トレードオフの文脈で記述し,Bingナビゲーショングラフとショウジョウバエ幼虫コネクトームのデータスカース設定に適用する。
関連論文リスト
- Learning List-Level Domain-Invariant Representations for Ranking [59.3544317373004]
リストレベルのアライメント -- より高いレベルのリストでドメイン不変表現を学習する。
利点は2つある: これは、ランク付けに縛られる最初のドメイン適応の一般化をもたらし、その結果、提案法に対する理論的支援を提供する。
論文 参考訳(メタデータ) (2022-12-21T04:49:55Z) - Weight Set Decomposition for Weighted Rank Aggregation: An interpretable
and visual decision support tool [0.0]
本稿では、その構造上、重み付けされた階数集計問題に利用できる富について述べる。
重み集合分解を, 分解に有用な凸特性の集合に適用し, 差分領域を可視化する。
論文 参考訳(メタデータ) (2022-05-31T19:09:55Z) - Graph Enhanced BERT for Query Understanding [55.90334539898102]
クエリ理解は、ユーザの検索意図を探索し、ユーザが最も望まれる情報を発見できるようにする上で、重要な役割を果たす。
近年、プレトレーニング言語モデル (PLM) は様々な自然言語処理タスクを進歩させてきた。
本稿では,クエリコンテンツとクエリグラフの両方を活用可能な,グラフ強化事前学習フレームワークGE-BERTを提案する。
論文 参考訳(メタデータ) (2022-04-03T16:50:30Z) - Exposing Query Identification for Search Transparency [69.06545074617685]
本稿では,検索システムの2つのクラスにおいて,クエリとドキュメントの役割を逆転させることにより,検索タスクとしてのEQIの実現可能性について検討する。
本研究では,クエリのランク付けの質を評価するための評価基準を導出するとともに,近似EQIの様々な実践的側面に着目した経験的分析を行う。
論文 参考訳(メタデータ) (2021-10-14T20:19:27Z) - Using Query Expansion in Manifold Ranking for Query-Oriented
Multi-Document Summarization [3.146785346730256]
本稿では,この問題を解くために,多様体ランキングに組み合わされたクエリ拡張手法を提案する。
本手法では,検索語自体と知識ベースであるWordNetの情報を同義語で拡張するだけでなく,文書自体の情報を様々な方法で拡張する。
さらに,単語の重複度と単語間の近接度を用いて文間の類似度を算出する。
論文 参考訳(メタデータ) (2021-07-31T02:20:44Z) - Connecting Images through Time and Sources: Introducing Low-data,
Heterogeneous Instance Retrieval [3.6526118822907594]
バリエーションやセマンティックな内容のパネルによく反応する機能を選択するのは簡単ではないことを示す。
Alegoriaベンチマークの新しい拡張バージョンを導入し、詳細なアノテーションを使って記述子を比較します。
論文 参考訳(メタデータ) (2021-03-19T10:54:51Z) - PiRank: Learning To Rank via Differentiable Sorting [85.28916333414145]
ランク付けのための新しい分類可能なサロゲートであるPiRankを提案する。
ピランクは所望の指標をゼロ温度の限界で正確に回収する。
論文 参考訳(メタデータ) (2020-12-12T05:07:36Z) - Surprise: Result List Truncation via Extreme Value Theory [92.5817701697342]
そこで本研究では,問合せ時における可逆的・校正的関連度スコアを,ランク付けされたスコアに留まらず,統計的に生成する手法を提案する。
本稿では、画像、テキスト、IRデータセット間での結果リストのトランケーションタスクにおいて、その効果を実証する。
論文 参考訳(メタデータ) (2020-10-19T19:15:50Z) - Dynamic Semantic Matching and Aggregation Network for Few-shot Intent
Detection [69.2370349274216]
利用可能な注釈付き発話が不足しているため、インテント検出は困難である。
セマンティック成分はマルチヘッド自己認識によって発話から蒸留される。
本手法はラベル付きインスタンスとラベルなしインスタンスの両方の表現を強化するための総合的なマッチング手段を提供する。
論文 参考訳(メタデータ) (2020-10-06T05:16:38Z) - Distance-based Positive and Unlabeled Learning for Ranking [13.339237388350043]
階級の学習は一般的な関心の問題である。
整数線形プログラムを用いた表現の組み合わせによるランク付け学習は,「興味のある項目に類似する項目は少ない」ほど軽快な場合には有効であることを示す。
論文 参考訳(メタデータ) (2020-05-20T01:53:58Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。