論文の概要: OneRetrieval: Unifying Multi-Branch E-commerce Retrieval with an Editable Generative Model
- arxiv url: http://arxiv.org/abs/2606.13533v1
- Date: Thu, 11 Jun 2026 16:21:13 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-06-12 15:55:27.908177
- Title: OneRetrieval: Unifying Multi-Branch E-commerce Retrieval with an Editable Generative Model
- Title(参考訳): OneRetrieval: 編集可能な生成モデルによるマルチブランチEコマース検索の統合
- Authors: Xuxin Zhang, Ben Chen, Yue Lv, Siyuan Wang, Yupeng Li, Yufei Ma, Zihan Liang, Tong Zhao, Ying Yang, Huangyu Dai, Lingtao Mao, Zhipeng Qian, Xinyu Sun, Chenyi Lei, Wenwu Ou, Kun Gai,
- Abstract要約: 産業用eコマース検索は、手作りのマージで融合したマルチブランチ検索段階を通じて、何十億ものアイテムを検索する。
OneRetrievalは、最も強力な生成ベースラインの深いリコールと、クローズドコードブックエンコーディングの桁を超える介入ヒット率とを一致させる。
このシステムはKuaishouで展開され、毎日数億のPVを提供している。
- 参考スコア(独自算出の注目度): 34.47411112516513
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Industrial e-commerce search serves hundreds of millions of items through a multi-branch retrieval stage fused by hand-tuned merging without joint optimization. Generative retrieval (GR) raises the prospect of collapsing this stage into a single model, yet unification is gated by more than retrieval quality: the inverted-index branch converts below the platform average yet persists because it is almost the only branch where operations can inject a new term within hours without any model update; a one-model substitute must preserve this real-time editability. Existing GR methods structurally lack it: closed-codebook methods fix each slot to a quantized embedding at training, while open-vocabulary methods leave new-term routing to model generalization. We present OneRetrieval, a one-model GR framework built on Keyword-Aligned Encoding (KAE), which ties each identifier position to an interpretable attribute word, pairing competitive recall quality with the editability of the inverted index -- to our knowledge the first editable generative retrieval method. An information-theoretic merging organizes 18 attribute categories into six codebook groups with non-uniform capacity; reserved slots in each codebook can be bound to new words after deployment without retraining; and a four-stage fine-tuning pipeline secures quality and editability jointly. On five million real-traffic requests, OneRetrieval matches the deep recall of the strongest generative baseline, with an intervention hit rate over an order of magnitude above closed-codebook encodings. Online, replacing the inverted-index branch significantly lifts order volume; extending to nearly the entire stage holds conversion while improving CTR. The system is deployed at Kuaishou, serving hundreds of millions of PVs daily.
- Abstract(参考訳): 産業用eコマース検索は、共同最適化なしで手作りのマージで融合したマルチブランチ検索段階を通じて、何十億ものアイテムを検索する。
逆インデックス(inverted-index)ブランチ(inverted-index)は、プラットフォーム平均以下に変換されるが、操作がモデル更新なしで数時間以内に新しい用語を注入できる唯一のブランチである。
既存のGRメソッドには構造的に欠けている: クローズドコードブックメソッドはトレーニング時に各スロットを量子化埋め込みに固定する。
キーワード・アラインド・エンコーディング(KAE)上に構築されたワンモデルGRフレームワークであるOneRetrievalについて述べる。
情報理論マージは、18の属性カテゴリを6つのコードブックグループにまとめ、各コードブック内の予約されたスロットは再トレーニングせずに配置後に新しいワードにバインドでき、4段階の微調整パイプラインは品質と編集性を共同で確保する。
500万件のリアルタイムリクエストに対して、OneRetrievalは、最も強力な生成ベースラインの深いリコールと、クローズドコードブックエンコーディングの桁を超える介入ヒット率とを一致させる。
オンラインでは、反転インデックスブランチを置き換えることで、注文量を大幅に増加させ、CTRを改善しながら、ほぼすべてのステージに変換が可能である。
このシステムはKuaishouで展開され、毎日数億のPVを提供している。
関連論文リスト
- PRISMR: Overcoming Parse Collapse in Multimodal Listwise Ranking via Parameterized Representation Internalization [49.659739762240655]
LMM(Large Multimodal Models)を用いたジェネレーティブ・リストワイド・ランキングは,グローバル・リストのコンテキストを単一の前方通過で捉えることを目的としている。
自動回帰デコーダは、無音で候補を省略し、早期に終了することで、流動的で不完全なランク付けを発生させる。
PRISMRは、一貫したコンテキスト内リスト処理をパラメトリックな構造条件に置き換えるフレームワークである。
論文 参考訳(メタデータ) (2026-06-11T06:09:51Z) - GenRec: A Preference-Oriented Generative Framework for Large-Scale Recommendation [14.663434490160016]
我々は、JD App上にデプロイされた嗜好指向の生成フレームワークであるGenRecを紹介する。
月のオンラインA/Bテストでは、GenRecは9.5%のクリック数の改善と8.7%のトランザクション数を達成した。
論文 参考訳(メタデータ) (2026-04-16T11:07:05Z) - Adaptive Chunking: Optimizing Chunking-Method Selection for RAG [0.0]
文書ごとに最適なチャンキング戦略を選択するフレームワークであるAdaptive Chunkingを紹介します。
法、技術、社会科学領域にまたがる多種多様なコーパスにおいて、我々の計量マージ適応法は、下流RAGの性能を著しく向上させる。
論文 参考訳(メタデータ) (2026-03-26T11:20:52Z) - COrAL: Order-Agnostic Language Modeling for Efficient Iterative Refinement [80.18490952057125]
反復改良は、複雑なタスクにおける大規模言語モデル(LLM)の能力を高める効果的なパラダイムとして登場した。
我々はこれらの課題を克服するために、コンテキストワイズ順序非依存言語モデリング(COrAL)を提案する。
当社のアプローチでは、管理可能なコンテキストウィンドウ内で複数のトークン依存関係をモデル化しています。
論文 参考訳(メタデータ) (2024-10-12T23:56:19Z) - Prompt-based Code Completion via Multi-Retrieval Augmented Generation [15.233727939816388]
ProCCは、プロンプトエンジニアリングとコンテキスト多武装バンディットアルゴリズムを活用したコード補完フレームワークである。
ProCCは、収集したオープンソースベンチマークスイートにおいて、最先端のコード補完テクニックを8.6%上回ります。
ProCCはまた, プラグ・アンド・プレイ方式で微調整技術を増強し, 実験した微調整モデルよりも5.6%改善した。
論文 参考訳(メタデータ) (2024-05-13T07:56:15Z) - How Does Generative Retrieval Scale to Millions of Passages? [68.98628807288972]
各種コーパス尺度における生成的検索手法の実証的研究を行った。
我々は8.8Mパスのコーパスで数百万のパスに生成検索をスケールし、モデルサイズを最大11Bパラメータまで評価する。
生成的検索は、小さなコーパス上の最先端のデュアルエンコーダと競合するが、数百万のパスへのスケーリングは依然として重要で未解決の課題である。
論文 参考訳(メタデータ) (2023-05-19T17:33:38Z) - Recommender Systems with Generative Retrieval [58.454606442670034]
本稿では,対象候補の識別子を自己回帰的に復号する新たな生成検索手法を提案する。
そのために、各項目のセマンティックIDとして機能するために、意味論的に意味のあるコードワードを作成します。
提案手法を用いて学習した推薦システムは,様々なデータセット上での現在のSOTAモデルよりも大幅に優れていることを示す。
論文 参考訳(メタデータ) (2023-05-08T21:48:17Z) - Autoregressive Search Engines: Generating Substrings as Document
Identifiers [53.0729058170278]
自動回帰言語モデルは、回答を生成するデファクト標準として現れています。
これまでの研究は、探索空間を階層構造に分割する方法を探究してきた。
本研究では,検索空間の任意の構造を強制しない代替として,経路内のすべてのngramを識別子として使用することを提案する。
論文 参考訳(メタデータ) (2022-04-22T10:45:01Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。