Fugu-MT 論文翻訳(概要): Answering Compositional Queries with Set-Theoretic Embeddings

論文の概要: Answering Compositional Queries with Set-Theoretic Embeddings

arxiv url: http://arxiv.org/abs/2306.04133v1
Date: Wed, 7 Jun 2023 04:04:36 GMT
ステータス: 翻訳完了
システム内更新日: 2023-06-08 16:16:58.946847
Title: Answering Compositional Queries with Set-Theoretic Embeddings
Title（参考訳）: 集合論的埋め込みによる合成クエリへの応答
Authors: Shib Dasgupta, Andrew McCallum, Steffen Rendle, Li Zhang
Abstract要約: ボックス埋め込みは、学習可能なVennダイアグラムと考えることができる領域ベースの表現である。双方の行動に関する知見を提供する実験と分析について述べる。ベクトルとボックスの埋め込みは単一の属性クエリに等しく適しているが、コンポジションクエリボックスの埋め込みは大きな利点がある。
参考スコア（独自算出の注目度）: 43.926610595182126
License: http://creativecommons.org/licenses/by/4.0/
Abstract: The need to compactly and robustly represent item-attribute relations arises in many important tasks, such as faceted browsing and recommendation systems. A popular machine learning approach for this task denotes that an item has an attribute by a high dot-product between vectors for the item and attribute -- a representation that is not only dense, but also tends to correct noisy and incomplete data. While this method works well for queries retrieving items by a single attribute (such as \emph{movies that are comedies}), we find that vector embeddings do not so accurately support compositional queries (such as movies that are comedies and British but not romances). To address these set-theoretic compositions, this paper proposes to replace vectors with box embeddings, a region-based representation that can be thought of as learnable Venn diagrams. We introduce a new benchmark dataset for compositional queries, and present experiments and analysis providing insights into the behavior of both. We find that, while vector and box embeddings are equally suited to single attribute queries, for compositional queries box embeddings provide substantial advantages over vectors, particularly at the moderate and larger retrieval set sizes that are most useful for users' search and browsing.
Abstract（参考訳）: 項目-属性関係をコンパクトかつ堅牢に表現する必要性は、ファステッドブラウジングやレコメンデーションシステムなど、多くの重要なタスクで生じる。このタスクの一般的な機械学習アプローチは、アイテムがアイテムのベクトルと属性の間の高いドット積によって属性を持つことを意味する。この方法は、単一の属性でアイテムを検索するクエリ(例えば、コメディーである \emph{movies} など)にうまく機能するが、ベクトル埋め込みは、構成的なクエリ(コメディーである映画や、ロマンスではない映画など)を正確にサポートしていない。これらの集合論的構成に対処するため,本論文ではベクトルを,学習可能なベン図と考えることができる領域ベースの表現であるボックス埋め込みに置き換える手法を提案する。本稿では,合成クエリのための新しいベンチマークデータセットを導入し,両者の動作に関する洞察を与える実験と分析を行う。ベクトルとボックスの埋め込みは、単一属性クエリに等しく適しているが、合成クエリボックスの埋め込みは、特にユーザーの検索やブラウジングに最も有用である、適度で大きな検索セットサイズにおいて、ベクターよりもかなり有利である。

関連論文リスト

MoDora: Tree-Based Semi-Structured Document Analysis System [62.01015188258797]
半構造化文書は、様々な不規則なレイアウトで配置された様々なインターリーブされたデータ要素を統合する。 MoDora は半構造化文書解析のための LLM を利用したシステムである。実験では、MoDoraは5.97%-61.07%の精度でベースラインを上回っている。
論文参考訳（メタデータ） (2026-02-26T14:48:49Z)
Learning to Select: Query-Aware Adaptive Dimension Selection for Dense Retrieval [37.24586920652237]
クエリアウェア適応次元選択フレームワークを提案する。まず、教師付きレバレンスラベルを用いて、埋め込み次元よりも重要な次元を構築し、次に、これらのラベルに埋め込まれた重要度スコアにクエリを埋め込むように予測器を訓練する。推測において、予測子は、擬似関連フィードバックなしで、クエリ埋め込みのみに基づく類似性のために、ディメンションのクエリ対応サブセットを選択する。
論文参考訳（メタデータ） (2026-02-03T09:32:21Z)
PRISM: Fine-Grained Paper-to-Paper Retrieval with Multi-Aspect-Aware Query Optimization [61.783280234747394]
PRISMは文書から文書への検索手法であり、クエリと候補文書の両方に対して、複数のきめ細かい表現を導入している。 SciFullBenchは、クエリと候補の両方のフルペーパーの完全かつセグメンテーションされたコンテキストが利用できる新しいベンチマークである。実験の結果、PRISMは既存の検索基準よりも平均4.3%性能が向上した。
論文参考訳（メタデータ） (2025-07-14T08:41:53Z)
Bridging Queries and Tables through Entities in Table Retrieval [70.13748256886288]
エンティティは、テキスト検索の文脈でよく研究されているが、テーブル検索におけるその応用についての研究は、顕著に欠如している。本稿では、実体表現に基づく相互作用パラダイムを設計し、エンティティ強化トレーニングフレームワークを提案する。提案するフレームワークはプラグアンドプレイでフレキシブルで,既存のテーブルレトリバーのトレーニングプロセスに統合しやすくする。
論文参考訳（メタデータ） (2025-04-09T03:16:33Z)
A Geometric Approach to Personalized Recommendation with Set-Theoretic Constraints Using Box Embeddings [43.609405236093025]
行が集合論的に依存する行列補完としてパーソナライズされた項目推薦の問題を定式化する。ボックス埋め込みは直感的に訓練可能なVennダイアグラムとして理解することができる。単純かつ複雑な項目レコメンデーションクエリに対して,ベクトルベースニューラルネットワークよりもボックス埋め込みの方が最大30%優れていることを実証的に示す。
論文参考訳（メタデータ） (2025-02-15T18:18:00Z)
ReTreever: Tree-based Coarse-to-Fine Representations for Retrieval [64.44265315244579]
そこで本研究では,様々なレベルで参照文書を整理し,表現するためのツリーベース手法を提案する。我々の手法はReTreeverと呼ばれ、クエリと参照ドキュメントが同様のツリーブランチに割り当てられるように、バイナリツリーの内部ノード毎のルーティング関数を共同で学習する。我々の評価では、ReTreeverは一般的に完全な表現精度を保っている。
論文参考訳（メタデータ） (2025-02-11T21:35:13Z)
Generative Retrieval as Multi-Vector Dense Retrieval [71.75503049199897]
生成検索は、文書の識別子をエンドツーエンドで生成する。それまでの研究は、原子識別子による生成的検索が単一ベクトル密度検索と等価であることを示した。生成的検索と多ベクトル高密度検索は,文書の問合せに対する関連性を測定するのと同じ枠組みを共有していることを示す。
論文参考訳（メタデータ） (2024-03-31T13:29:43Z)
Multi-Intent Attribute-Aware Text Matching in Searching [21.92265431319774]
本稿では,属性認識エンコーダ,マルチインテントモデリング,インテント認識マッチングという3つの主要コンポーネントから構成されるマルチインテント属性認識マッチングモデルを提案する。 MIMでは、属性の重要性に関して、テキストと属性を重み付けし、スケールされた注意機構を通じて処理する。意図認識マッチングにおいて、意図は自己監督型マスキングタスクによって評価され、次に組み込まれて最終的なマッチング結果が出力される。
論文参考訳（メタデータ） (2024-02-12T16:54:22Z)
Dense X Retrieval: What Retrieval Granularity Should We Use? [56.90827473115201]
しばしば見過ごされる設計選択は、コーパスが索引付けされる検索単位である。本稿では,高密度検索のための新しい検索ユニット,命題を提案する。実験により、提案のような細粒度単位によるコーパスのインデックス付けは、検索タスクにおける通過レベル単位を著しく上回っていることが明らかとなった。
論文参考訳（メタデータ） (2023-12-11T18:57:35Z)
Improving Items and Contexts Understanding with Descriptive Graph for Conversational Recommendation [4.640835690336652]
会話レコメンデーションシステム(CRS)における最先端の手法は、外部知識を活用して、項目の表現と文脈の表現を強化する。我々は,同じ意味空間における項目とその関連する文脈語を共同でモデル化する新しいCRSフレームワークKLEVERを提案する。 CRSデータセットのベンチマーク実験では、KLEVERは特にユーザの応答からの情報が不足している場合に、優れたパフォーマンスを達成することが示されている。
論文参考訳（メタデータ） (2023-04-11T21:21:46Z)
Same or Different? Diff-Vectors for Authorship Analysis [78.83284164605473]
古典的な著作物分析において、特徴ベクトルは文書を表し、特徴の値は文書中の特徴の相対周波数(関数の増大)を表し、クラスラベルは文書の著者を表す。筆者らの実験は共著者検証,著者検証,クローズドセットの著者帰属に取り組んでおり,DVは自然に第1の問題を解くのに向いているが,第2と第3の問題を解くための2つの新しい方法も提供している。
論文参考訳（メタデータ） (2023-01-24T08:48:12Z)
What Are You Token About? Dense Retrieval as Distributions Over the Vocabulary [68.77983831618685]
本稿では,2つのエンコーダが生成するベクトル表現を,モデルの語彙空間に投影することで解釈する。得られたプロジェクションは、リッチな意味情報を含み、それらの間の接続を描画し、スパース検索を行う。
論文参考訳（メタデータ） (2022-12-20T16:03:25Z)
ReSel: N-ary Relation Extraction from Scientific Text and Tables by Learning to Retrieve and Select [53.071352033539526]
学術論文からN-ary関係を抽出する問題について考察する。提案手法であるReSelは,このタスクを2段階のプロシージャに分解する。 3つの科学的情報抽出データセットに対する実験により、ReSelは最先端のベースラインを大きく上回っていることがわかった。
論文参考訳（メタデータ） (2022-10-26T02:28:02Z)
Aspect-Oriented Summarization through Query-Focused Extraction [23.62412515574206]
実際のユーザのニーズは、特定のクエリではなく、ユーザが興味を持っているデータセットの幅広いトピックという側面に、より深く浸透することが多い。抽出クエリに焦点を絞った学習手法をベンチマークし、モデルを訓練するための対照的な拡張手法を提案する。我々は2つのアスペクト指向データセットを評価し、この手法が一般的な要約システムよりも焦点を絞った要約を得られることを発見した。
論文参考訳（メタデータ） (2021-10-15T18:06:21Z)
CSFCube -- A Test Collection of Computer Science Research Articles for Faceted Query by Example [43.01717754418893]
例によるフェーステッドクエリのタスクを紹介します。ユーザは、入力クエリドキュメントに加えて、より細かいアスペクトを指定することもできる。我々は,クエリ科学論文に類似した科学的論文を検索できるモデルを構想する。
論文参考訳（メタデータ） (2021-03-24T01:02:12Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。