論文の概要: A Unified Structured Query Understanding Framework for Industrial Semantic Search
- arxiv url: http://arxiv.org/abs/2605.27441v1
- Date: Fri, 22 May 2026 19:35:15 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-05-28 17:38:55.276698
- Title: A Unified Structured Query Understanding Framework for Industrial Semantic Search
- Title(参考訳): 産業意味探索のための統一型構造化クエリ理解フレームワーク
- Authors: Ping Liu, Qianqi Shen, Jianqiang Shen, Chunnan Yao, Kevin Kao, Rajat Arora, Dan Xu, Baofen Zheng, Yunxiang Ren, Benjamin Le, Ali Hooshmand, Igor Lapchuk, Juan Bottaro, Raghavan Muthuregunathan, Caleb Johnson, Liangjie Hong, Jingwei Wu, Wenjing Zhang,
- Abstract要約: 大規模産業検索システムにおけるクエリ理解は、通常、異なるタスク固有のコンポーネントのカスケードとして実装される。
本研究では,これらの不均一な関数を単一小言語モデルに統合する統合型クエリ理解システムを提案し,展開する。
LinkedInのジョブ検索システム内で、大規模なオフラインおよびオンラインテストを通じてこのアプローチを検証する。
- 参考スコア(独自算出の注目度): 9.913119853395205
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Query understanding in large-scale industrial search systems is typically implemented as a cascade of disparate, task-specific components. While individually optimizable, this fragmented architecture incurs high maintenance overhead and results in inconsistent behaviors, particularly for long-tail queries. In this work, we propose and deploy a unified structured query understanding system that consolidates these heterogeneous functions into a single Small Language Model (SLM) that performs schema-constrained generation. To address the data bottlenecks inherent in unified modeling, we introduce Query Illuminator, a dual-purpose framework serving as: (i) a teacher model for high-quality auto-annotation and distillation, and (ii) a surrogate judge for scalable evaluation where human labels are scarce. We validate this approach through extensive offline and online tests within LinkedIn's Job Search system. Furthermore, we demonstrate the framework's horizontal extensibility through a cross-domain case study on People Search. The results show improved user engagement and reduced operational costs, achieved while satisfying strict low-latency serving constraints on limited GPU resources.
- Abstract(参考訳): 大規模産業検索システムにおけるクエリ理解は、通常、異なるタスク固有のコンポーネントのカスケードとして実装される。
個別に最適化できるが、この断片化されたアーキテクチャは高いメンテナンスオーバーヘッドをもたらし、特にロングテールクエリーにおいて一貫性のない振る舞いをもたらす。
本研究では,これらの不均一な関数をスキーマ制約付き生成を行う単一小言語モデル (SLM) に統合する統合構造化クエリ理解システムを提案し,展開する。
統一モデリングに固有のデータボトルネックに対処するために、クエリイルミネーター(Query Illuminator)を紹介します。
一 高品質な自動注記・蒸留の教師モデル、及び
二 人間のラベルが乏しいスケーラブルな評価のための代理裁判官。
LinkedInのジョブ検索システム内で、大規模なオフラインおよびオンラインテストを通じてこのアプローチを検証する。
さらに,このフレームワークの水平拡張性を,人検索のクロスドメインケーススタディを通じて実証する。
その結果、限られたGPUリソースに対する厳格な低レイテンシサービス制約を満たしながら、ユーザエンゲージメントの改善と運用コストの削減を実現した。
関連論文リスト
- Constraint Decay: The Fragility of LLM Agents in Backend Code Generation [9.659020624935687]
大きな言語モデル(LLM)エージェントは、緩やかな仕様の下で、自律的なコード生成において強力なパフォーマンスを示す。
プロダクショングレードのソフトウェアは、アーキテクチャパターンやデータベース、オブジェクト-リレーショナルマッピングといった構造的制約に厳格に固執する必要がある。
本稿では,バックエンド生成における構造的制約を適切に扱えるかを評価する。
論文 参考訳(メタデータ) (2026-05-07T15:44:40Z) - Rethinking Deep Research from the Perspective of Web Content Distribution Matching [86.90255285277256]
WeDasは,検索空間の構造的特徴をエージェントの観察空間に組み込んだWebコンテンツ配信アウェアフレームワークである。
本稿では,Query-Result Alignment Scoreを反復的に推定する数ショットの探索機構を提案する。
プラグイン・アンド・プレイモジュールとして、WeDasは4つのベンチマークのサブゴール補完と精度を一貫して改善している。
論文 参考訳(メタデータ) (2026-03-07T14:51:17Z) - SOPRAG: Multi-view Graph Experts Retrieval for Industrial Standard Operating Procedures [15.42553917257021]
SOPRAGは、SOP検索の問題点を解決するために特別に設計された新しいフレームワークである。
SOPRAGは、フラットチャンキングを専門のEntity、Causal、Flowグラフの専門家に置き換える。
SOPRAGは、検索精度と応答性の両方において、強い語彙、密度、グラフベースのRAGベースラインを著しく上回る。
論文 参考訳(メタデータ) (2026-02-02T09:30:43Z) - Resolving Evidence Sparsity: Agentic Context Engineering for Long-Document Understanding [49.26132236798123]
視覚言語モデル(VLM)は、文書理解における主要なアプローチになりつつある。
本稿では,粗いプロセスにおいて,検索者と4つの協調エージェントを編成するマルチエージェントフレームワークSLEUTHを提案する。
このフレームワークは、検索したページ内の重要なテキストおよび視覚的手がかりを特定し、テーブルやチャートなどの健全な視覚的エビデンスをフィルタし、クエリを分析して推論戦略を考案する。
論文 参考訳(メタデータ) (2025-11-28T03:09:40Z) - Reasoning-enhanced Query Understanding through Decomposition and Interpretation [87.56450566014625]
ReDIは、分解と解釈によるクエリ理解のための推論強化アプローチである。
我々は,大規模検索エンジンから実世界の複雑なクエリの大規模データセットをコンパイルした。
BRIGHT と BEIR の実験により、ReDI はスパースと密度の高い検索パラダイムの両方において、強いベースラインを一貫して超えることを示した。
論文 参考訳(メタデータ) (2025-09-08T10:58:42Z) - Leveraging Generative Models for Real-Time Query-Driven Text Summarization in Large-Scale Web Search [54.987957691350665]
クエリ駆動テキスト要約(QDTS)は、与えられたクエリに基づいてテキスト文書から簡潔で情報的な要約を生成することを目的としている。
従来の抽出的要約モデルは、主にランク付け候補の要約セグメントに基づいており、産業応用において支配的なアプローチとなっている。
産業Web検索におけるリアルタイムQDTSに対処するための生成モデルの適用を開拓するための新しいフレームワークを提案する。
論文 参考訳(メタデータ) (2025-08-28T08:51:51Z) - Powering Job Search at Scale: LLM-Enhanced Query Understanding in Job Matching Systems [10.9341814749217]
LLM(Large Language Model)を利用した統合クエリ理解フレームワークを提案する。
提案手法は,ユーザクエリとプロファイル属性などのコンテキスト信号とを共同でモデル化し,構造化された解釈を生成する。
このフレームワークは、オンラインA/Bテストにおける関連品質を改善し、システムの複雑さを著しく低減する。
論文 参考訳(メタデータ) (2025-08-19T21:35:43Z) - Tree-Based Text Retrieval via Hierarchical Clustering in RAGFrameworks: Application on Taiwanese Regulations [0.0]
階層的なクラスタリングに基づく検索手法を提案する。
本手法は,意味的関連コンテンツを適応的に選択しながら,システム応答の精度と関連性を維持する。
我々のフレームワークは実装が簡単で、既存のRAGパイプラインと簡単に統合できます。
論文 参考訳(メタデータ) (2025-06-16T15:34:29Z) - LaSagnA: Language-based Segmentation Assistant for Complex Queries [39.620806493454616]
視覚のための大規模言語モデル(vLLM)は、バウンディングボックスやマスクを含む知覚結果を生成する。
本研究では,これらの問題の主な原因が,学習クエリの複雑さの不足であることを認めた。
本稿では,提案フォーマットの直接統合による課題を効果的に解決するための3つの新しい戦略を提案する。
論文 参考訳(メタデータ) (2024-04-12T14:40:45Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。