論文の概要: Query Attribute Modeling: Improving search relevance with Semantic Search and Meta Data Filtering
- arxiv url: http://arxiv.org/abs/2508.04683v1
- Date: Wed, 06 Aug 2025 17:47:00 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-08-07 20:09:22.862139
- Title: Query Attribute Modeling: Improving search relevance with Semantic Search and Meta Data Filtering
- Title(参考訳): クエリ属性モデリング:セマンティック検索とメタデータフィルタリングによる検索関連性の改善
- Authors: Karthik Menon, Batool Arhamna Haider, Muhammad Arham, Kanwal Mehreen, Ram Mohan Rao Kadiyala, Hamza Farooq,
- Abstract要約: 本研究では,オープンテキストクエリを構造化メタデータタグやセマンティック要素に分解することで,検索精度と関連性を高めるハイブリッドフレームワークであるクエリ属性モデリング(QAM)を紹介する。
QAMは、自由形式のテキストクエリからメタデータフィルタを自動的に抽出し、ノイズを低減し、関連する項目の集中検索を可能にすることで、従来の検索制限に対処する。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by-nc-sa/4.0/
- Abstract: This study introduces Query Attribute Modeling (QAM), a hybrid framework that enhances search precision and relevance by decomposing open text queries into structured metadata tags and semantic elements. QAM addresses traditional search limitations by automatically extracting metadata filters from free-form text queries, reducing noise and enabling focused retrieval of relevant items. Experimental evaluation using the Amazon Toys Reviews dataset (10,000 unique items with 40,000+ reviews and detailed product attributes) demonstrated QAM's superior performance, achieving a mean average precision at 5 (mAP@5) of 52.99\%. This represents significant improvement over conventional methods, including BM25 keyword search, encoder-based semantic similarity search, cross-encoder re-ranking, and hybrid search combining BM25 and semantic results via Reciprocal Rank Fusion (RRF). The results establish QAM as a robust solution for Enterprise Search applications, particularly in e-commerce systems.
- Abstract(参考訳): 本研究では,オープンテキストクエリを構造化メタデータタグやセマンティック要素に分解することで,検索精度と関連性を高めるハイブリッドフレームワークであるクエリ属性モデリング(QAM)を紹介する。
QAMは、自由形式のテキストクエリからメタデータフィルタを自動的に抽出し、ノイズを低減し、関連する項目の集中検索を可能にすることで、従来の検索制限に対処する。
Amazon Toys Reviewsデータセット(4万以上のレビューと詳細な製品属性を持つ10,000以上のユニークな項目)を使用した実験的な評価は、QAMの優れたパフォーマンスを示し、平均的な精度は52.99\%である。
これは、BM25キーワード検索、エンコーダベースのセマンティック類似検索、クロスエンコーダの再ランク、BM25とReciprocal Rank Fusion (RRF)によるセマンティック結果を組み合わせたハイブリッド検索など、従来の方法よりも大幅に改善されている。
その結果、QAMはエンタープライズ検索アプリケーション、特にeコマースシステムにおける堅牢なソリューションとして確立された。
関連論文リスト
- Aligning Web Query Generation with Ranking Objectives via Direct Preference Optimization [21.140086066964667]
本稿では,クエリ生成プロセスにランキング信号を統合するフレームワークを提案する。
実験の結果,DPO後の問合せと文書の相互関係は高く評価された。
論文 参考訳(メタデータ) (2025-05-25T20:34:12Z) - IterKey: Iterative Keyword Generation with LLMs for Enhanced Retrieval Augmented Generation [24.108631023133704]
IterKeyは、スパース検索によるRAGを強化する反復的なキーワード生成フレームワークである。
BM25ベースのRAGと単純なベースラインよりも5%から20%の精度向上を実現している。
論文 参考訳(メタデータ) (2025-05-13T11:25:15Z) - From Retrieval to Generation: Comparing Different Approaches [15.31883349259767]
我々は,知識集約型タスクに対する検索ベース,生成ベース,ハイブリッドモデルの評価を行った。
我々は、高密度レトリバー、特にDPRは、NQ上でトップ1の精度が50.17%のODQAにおいて高い性能を発揮することを示す。
また、WikiText-103を用いて言語モデリングタスクを解析し、BM25のような検索に基づくアプローチは、生成的手法やハイブリッド手法に比べて難易度が低いことを示す。
論文 参考訳(メタデータ) (2025-02-27T16:29:14Z) - Maybe you are looking for CroQS: Cross-modal Query Suggestion for Text-to-Image Retrieval [15.757140563856675]
この研究は、コレクションの視覚的に一貫したサブセットを探索するために必要な最小限のテキスト修正を提案することに焦点を当てた、新しいタスクを導入している。
提案手法の評価と開発を容易にするため,CroQSというベンチマークを試作した。
画像キャプションやコンテンツ要約などの関連分野からのベースライン手法をこのタスクに適用し、基準性能スコアを提供する。
論文 参考訳(メタデータ) (2024-12-18T13:24:09Z) - CART: A Generative Cross-Modal Retrieval Framework with Coarse-To-Fine Semantic Modeling [53.97609687516371]
クロスモーダル検索は、異なるモーダルデータの相互作用を通じて、クエリと意味的に関連するインスタンスを検索することを目的としている。
従来のソリューションでは、クエリと候補の間のスコアを明示的に計算するために、シングルトウワーまたはデュアルトウワーのフレームワークを使用している。
粗大なセマンティックモデリングに基づく生成的クロスモーダル検索フレームワーク(CART)を提案する。
論文 参考訳(メタデータ) (2024-06-25T12:47:04Z) - Database-Augmented Query Representation for Information Retrieval [59.57065228857247]
データベース拡張クエリ表現(DAQu)と呼ばれる新しい検索フレームワークを提案する。
DAQuは、元のクエリを複数のテーブルにまたがるさまざまな(クエリ関連の)メタデータで拡張する。
リレーショナルデータベースのメタデータを組み込む様々な検索シナリオにおいてDAQuを検証する。
論文 参考訳(メタデータ) (2024-06-23T05:02:21Z) - Large Language Models for Relevance Judgment in Product Search [48.56992980315751]
検索クエリに対する検索および再ランクされたアイテムの高い関連性は、製品検索の成功の土台である。
本稿では,大規模言語モデル(LLM)を活用して,クエリ・イテムペア(QIP)の関連判断を大規模に自動化する手法について述べる。
本研究は,製品検索における関連判断の自動化の分野への直接的な影響を示唆するものである。
論文 参考訳(メタデータ) (2024-06-01T00:52:41Z) - How Does Generative Retrieval Scale to Millions of Passages? [68.98628807288972]
各種コーパス尺度における生成的検索手法の実証的研究を行った。
我々は8.8Mパスのコーパスで数百万のパスに生成検索をスケールし、モデルサイズを最大11Bパラメータまで評価する。
生成的検索は、小さなコーパス上の最先端のデュアルエンコーダと競合するが、数百万のパスへのスケーリングは依然として重要で未解決の課題である。
論文 参考訳(メタデータ) (2023-05-19T17:33:38Z) - Recommender Systems with Generative Retrieval [58.454606442670034]
本稿では,対象候補の識別子を自己回帰的に復号する新たな生成検索手法を提案する。
そのために、各項目のセマンティックIDとして機能するために、意味論的に意味のあるコードワードを作成します。
提案手法を用いて学習した推薦システムは,様々なデータセット上での現在のSOTAモデルよりも大幅に優れていることを示す。
論文 参考訳(メタデータ) (2023-05-08T21:48:17Z) - Query Expansion Using Contextual Clue Sampling with Language Models [69.51976926838232]
本稿では,実効的なフィルタリング戦略と検索した文書の融合の組み合わせを,各文脈の生成確率に基づいて提案する。
我々の語彙マッチングに基づくアプローチは、よく確立された高密度検索モデルDPRと比較して、同様のトップ5/トップ20検索精度と上位100検索精度を実現する。
エンド・ツー・エンドのQAでは、読者モデルも我々の手法の恩恵を受けており、いくつかの競争基準に対してエクサクト・マッチのスコアが最も高い。
論文 参考訳(メタデータ) (2022-10-13T15:18:04Z) - Exposing Query Identification for Search Transparency [69.06545074617685]
本稿では,検索システムの2つのクラスにおいて,クエリとドキュメントの役割を逆転させることにより,検索タスクとしてのEQIの実現可能性について検討する。
本研究では,クエリのランク付けの質を評価するための評価基準を導出するとともに,近似EQIの様々な実践的側面に着目した経験的分析を行う。
論文 参考訳(メタデータ) (2021-10-14T20:19:27Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。