論文の概要: Answering Compositional Queries with Set-Theoretic Embeddings
- arxiv url: http://arxiv.org/abs/2306.04133v1
- Date: Wed, 7 Jun 2023 04:04:36 GMT
- ステータス: 処理完了
- システム内更新日: 2023-06-08 16:16:58.946847
- Title: Answering Compositional Queries with Set-Theoretic Embeddings
- Title(参考訳): 集合論的埋め込みによる合成クエリへの応答
- Authors: Shib Dasgupta, Andrew McCallum, Steffen Rendle, Li Zhang
- Abstract要約: ボックス埋め込みは、学習可能なVennダイアグラムと考えることができる領域ベースの表現である。
双方の行動に関する知見を提供する実験と分析について述べる。
ベクトルとボックスの埋め込みは単一の属性クエリに等しく適しているが、コンポジションクエリボックスの埋め込みは大きな利点がある。
- 参考スコア(独自算出の注目度): 43.926610595182126
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: The need to compactly and robustly represent item-attribute relations arises
in many important tasks, such as faceted browsing and recommendation systems. A
popular machine learning approach for this task denotes that an item has an
attribute by a high dot-product between vectors for the item and attribute -- a
representation that is not only dense, but also tends to correct noisy and
incomplete data. While this method works well for queries retrieving items by a
single attribute (such as \emph{movies that are comedies}), we find that vector
embeddings do not so accurately support compositional queries (such as movies
that are comedies and British but not romances). To address these set-theoretic
compositions, this paper proposes to replace vectors with box embeddings, a
region-based representation that can be thought of as learnable Venn diagrams.
We introduce a new benchmark dataset for compositional queries, and present
experiments and analysis providing insights into the behavior of both. We find
that, while vector and box embeddings are equally suited to single attribute
queries, for compositional queries box embeddings provide substantial
advantages over vectors, particularly at the moderate and larger retrieval set
sizes that are most useful for users' search and browsing.
- Abstract(参考訳): 項目-属性関係をコンパクトかつ堅牢に表現する必要性は、ファステッドブラウジングやレコメンデーションシステムなど、多くの重要なタスクで生じる。
このタスクの一般的な機械学習アプローチは、アイテムがアイテムのベクトルと属性の間の高いドット積によって属性を持つことを意味する。
この方法は、単一の属性でアイテムを検索するクエリ(例えば、コメディーである \emph{movies} など)にうまく機能するが、ベクトル埋め込みは、構成的なクエリ(コメディーである映画や、ロマンスではない映画など)を正確にサポートしていない。
これらの集合論的構成に対処するため,本論文ではベクトルを,学習可能なベン図と考えることができる領域ベースの表現であるボックス埋め込みに置き換える手法を提案する。
本稿では,合成クエリのための新しいベンチマークデータセットを導入し,両者の動作に関する洞察を与える実験と分析を行う。
ベクトルとボックスの埋め込みは、単一属性クエリに等しく適しているが、合成クエリボックスの埋め込みは、特にユーザーの検索やブラウジングに最も有用である、適度で大きな検索セットサイズにおいて、ベクターよりもかなり有利である。
関連論文リスト
- A Geometric Approach to Personalized Recommendation with Set-Theoretic Constraints Using Box Embeddings [43.609405236093025]
行が集合論的に依存する行列補完としてパーソナライズされた項目推薦の問題を定式化する。
ボックス埋め込みは直感的に訓練可能なVennダイアグラムとして理解することができる。
単純かつ複雑な項目レコメンデーションクエリに対して,ベクトルベースニューラルネットワークよりもボックス埋め込みの方が最大30%優れていることを実証的に示す。
論文 参考訳(メタデータ) (2025-02-15T18:18:00Z) - ReTreever: Tree-based Coarse-to-Fine Representations for Retrieval [64.44265315244579]
そこで本研究では,様々なレベルで参照文書を整理し,表現するためのツリーベース手法を提案する。
我々の手法はReTreeverと呼ばれ、クエリと参照ドキュメントが同様のツリーブランチに割り当てられるように、バイナリツリーの内部ノード毎のルーティング関数を共同で学習する。
我々の評価では、ReTreeverは一般的に完全な表現精度を保っている。
論文 参考訳(メタデータ) (2025-02-11T21:35:13Z) - Generative Retrieval as Multi-Vector Dense Retrieval [71.75503049199897]
生成検索は、文書の識別子をエンドツーエンドで生成する。
それまでの研究は、原子識別子による生成的検索が単一ベクトル密度検索と等価であることを示した。
生成的検索と多ベクトル高密度検索は,文書の問合せに対する関連性を測定するのと同じ枠組みを共有していることを示す。
論文 参考訳(メタデータ) (2024-03-31T13:29:43Z) - Multi-Intent Attribute-Aware Text Matching in Searching [21.92265431319774]
本稿では,属性認識エンコーダ,マルチインテントモデリング,インテント認識マッチングという3つの主要コンポーネントから構成されるマルチインテント属性認識マッチングモデルを提案する。
MIMでは、属性の重要性に関して、テキストと属性を重み付けし、スケールされた注意機構を通じて処理する。
意図認識マッチングにおいて、意図は自己監督型マスキングタスクによって評価され、次に組み込まれて最終的なマッチング結果が出力される。
論文 参考訳(メタデータ) (2024-02-12T16:54:22Z) - Improving Items and Contexts Understanding with Descriptive Graph for
Conversational Recommendation [4.640835690336652]
会話レコメンデーションシステム(CRS)における最先端の手法は、外部知識を活用して、項目の表現と文脈の表現を強化する。
我々は,同じ意味空間における項目とその関連する文脈語を共同でモデル化する新しいCRSフレームワークKLEVERを提案する。
CRSデータセットのベンチマーク実験では、KLEVERは特にユーザの応答からの情報が不足している場合に、優れたパフォーマンスを達成することが示されている。
論文 参考訳(メタデータ) (2023-04-11T21:21:46Z) - Same or Different? Diff-Vectors for Authorship Analysis [78.83284164605473]
古典的な著作物分析において、特徴ベクトルは文書を表し、特徴の値は文書中の特徴の相対周波数(関数の増大)を表し、クラスラベルは文書の著者を表す。
筆者らの実験は共著者検証,著者検証,クローズドセットの著者帰属に取り組んでおり,DVは自然に第1の問題を解くのに向いているが,第2と第3の問題を解くための2つの新しい方法も提供している。
論文 参考訳(メタデータ) (2023-01-24T08:48:12Z) - What Are You Token About? Dense Retrieval as Distributions Over the
Vocabulary [68.77983831618685]
本稿では,2つのエンコーダが生成するベクトル表現を,モデルの語彙空間に投影することで解釈する。
得られたプロジェクションは、リッチな意味情報を含み、それらの間の接続を描画し、スパース検索を行う。
論文 参考訳(メタデータ) (2022-12-20T16:03:25Z) - ReSel: N-ary Relation Extraction from Scientific Text and Tables by
Learning to Retrieve and Select [53.071352033539526]
学術論文からN-ary関係を抽出する問題について考察する。
提案手法であるReSelは,このタスクを2段階のプロシージャに分解する。
3つの科学的情報抽出データセットに対する実験により、ReSelは最先端のベースラインを大きく上回っていることがわかった。
論文 参考訳(メタデータ) (2022-10-26T02:28:02Z) - CSFCube -- A Test Collection of Computer Science Research Articles for
Faceted Query by Example [43.01717754418893]
例によるフェーステッドクエリのタスクを紹介します。
ユーザは、入力クエリドキュメントに加えて、より細かいアスペクトを指定することもできる。
我々は,クエリ科学論文に類似した科学的論文を検索できるモデルを構想する。
論文 参考訳(メタデータ) (2021-03-24T01:02:12Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。