論文の概要: MISS: Multi-Modal Tree Indexing and Searching with Lifelong Sequential Behavior for Retrieval Recommendation
- arxiv url: http://arxiv.org/abs/2508.14515v1
- Date: Wed, 20 Aug 2025 08:22:02 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-08-21 16:52:41.385861
- Title: MISS: Multi-Modal Tree Indexing and Searching with Lifelong Sequential Behavior for Retrieval Recommendation
- Title(参考訳): MISS:検索レコメンデーションのためのマルチモーダルツリーインデックス作成と長期連続行動検索
- Authors: Chengcheng Guo, Junda She, Kuo Cai, Shiyao Wang, Qigen Hu, Qiang Luo, Kun Gai, Guorui Zhou,
- Abstract要約: 大規模産業レコメンデーションシステムは通常、検索とランキングの2段階のパラダイムを採用している。
マルチモーダル・インデックス・ツリーとマルチモーダル・ライフロング・シーケンス・モデリング・モジュールを含むMISS(Multi-modal Indexing and Searching with Lifelong Sequence)を提案する。
- 参考スコア(独自算出の注目度): 14.110932722143643
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Large-scale industrial recommendation systems typically employ a two-stage paradigm of retrieval and ranking to handle huge amounts of information. Recent research focuses on improving the performance of retrieval model. A promising way is to introduce extensive information about users and items. On one hand, lifelong sequential behavior is valuable. Existing lifelong behavior modeling methods in ranking stage focus on the interaction of lifelong behavior and candidate items from retrieval stage. In retrieval stage, it is difficult to utilize lifelong behavior because of a large corpus of candidate items. On the other hand, existing retrieval methods mostly relay on interaction information, potentially disregarding valuable multi-modal information. To solve these problems, we represent the pioneering exploration of leveraging multi-modal information and lifelong sequence model within the advanced tree-based retrieval model. We propose Multi-modal Indexing and Searching with lifelong Sequence (MISS), which contains a multi-modal index tree and a multi-modal lifelong sequence modeling module. Specifically, for better index structure, we propose multi-modal index tree, which is built using the multi-modal embedding to precisely represent item similarity. To precisely capture diverse user interests in user lifelong sequence, we propose collaborative general search unit (Co-GSU) and multi-modal general search unit (MM-GSU) for multi-perspective interests searching.
- Abstract(参考訳): 大規模産業レコメンデーションシステムは通常、大量の情報を扱うために2段階の検索とランキングのパラダイムを用いる。
近年の研究では,検索モデルの性能向上に焦点が当てられている。
有望な方法は、ユーザやアイテムに関する広範な情報を導入することだ。
一方、生涯にわたる連続的な行動は貴重である。
ランキング段階における既存の寿命行動モデリング手法は、検索段階からの寿命行動と候補項目の相互作用に焦点を当てている。
検索段階では,候補項目が多いため,生涯行動の活用は困難である。
一方、既存の検索手法は、主に対話情報を中継し、価値あるマルチモーダル情報を無視する可能性がある。
これらの問題を解決するために,先進ツリーベース検索モデルにおいて,マルチモーダル情報と長寿命シーケンスモデルを活用する先駆的な探索を行った。
マルチモーダル・インデックス・ツリーとマルチモーダル・ライフロング・シーケンス・モデリング・モジュールを含むMISS(Multi-modal Indexing and Searching with Lifelong Sequence)を提案する。
具体的には、より優れたインデックス構造を実現するために、アイテムの類似性を正確に表現するために、マルチモーダル埋め込みを用いて構築されたマルチモーダルインデックスツリーを提案する。
ユーザ生涯における多様なユーザの関心を正確に把握するために,多目的検索のための協調汎用検索ユニット(Co-GSU)と多目的汎用検索ユニット(MM-GSU)を提案する。
関連論文リスト
- MMSearch-R1: Incentivizing LMMs to Search [49.889749277236376]
MMSearch-R1は,実世界のインターネット環境において,オンデマンドでマルチターン検索が可能な,初のエンドツーエンド強化学習フレームワークである。
本フレームワークは画像検索とテキスト検索の両方を統合し,検索ペナルティによる結果に基づく報酬によって,モデルがいつ,どのように呼び出すかの判断を可能にする。
論文 参考訳(メタデータ) (2025-06-25T17:59:42Z) - MambaPro: Multi-Modal Object Re-Identification with Mamba Aggregation and Synergistic Prompt [60.10555128510744]
ReID(Multi-modal object Re-IDentification)は、異なるモダリティから補完的な画像情報を活用することで、特定のオブジェクトを検索することを目的としている。
近年、CLIPのような大規模事前学習モデルでは、従来のシングルモーダルオブジェクトReIDタスクで顕著なパフォーマンスを示している。
マルチモーダルオブジェクトReIDのための新しいフレームワークであるMambaProを紹介する。
論文 参考訳(メタデータ) (2024-12-14T06:33:53Z) - MM-Embed: Universal Multimodal Retrieval with Multimodal LLMs [78.5013630951288]
本稿では,マルチモーダル大言語モデル(MLLM)を用いた情報検索手法を提案する。
まず,16個の検索タスクを持つ10個のデータセットに対して,MLLMをバイエンコーダレトリバーとして微調整する。
我々のモデルMM-Embedはマルチモーダル検索ベンチマークM-BEIR上で最先端の性能を実現する。
論文 参考訳(メタデータ) (2024-11-04T20:06:34Z) - SEMINAR: Search Enhanced Multi-modal Interest Network and Approximate Retrieval for Lifelong Sequential Recommendation [16.370075234443245]
本稿では,SEMINAR-Search Enhanced Multi-Modal Interest Network と Approximate Retrieval という,一生涯にわたるマルチモーダルシーケンスモデルを提案する。
具体的には、Pretraining Search Unitと呼ばれるネットワークが、事前トレーニング-ファインタニング方式で、マルチモーダルクエリ-イテムペアの寿命のシーケンスを学習する。
マルチモーダル埋め込みのオンライン検索速度を高速化するために,マルチモーダルなコードブックベースの製品量子化戦略を提案する。
論文 参考訳(メタデータ) (2024-07-15T13:33:30Z) - An Interactive Multi-modal Query Answering System with Retrieval-Augmented Large Language Models [21.892975397847316]
本稿では,新たに開発したマルチモーダル検索フレームワークとナビゲーショングラフインデックスを用いて,対話型マルチモーダルクエリ・アンサーリング(MQA)システムを提案する。
MQAの特筆すべき点は、異なるモダリティの重要性を評価するために、コントラスト学習を利用することである。
本システムは,計算プルーニング技術を用いて改良した,先進的なナビゲーショングラフインデックスによる効率的な検索を実現する。
論文 参考訳(メタデータ) (2024-07-05T02:01:49Z) - Recommender Systems with Generative Retrieval [58.454606442670034]
本稿では,対象候補の識別子を自己回帰的に復号する新たな生成検索手法を提案する。
そのために、各項目のセマンティックIDとして機能するために、意味論的に意味のあるコードワードを作成します。
提案手法を用いて学習した推薦システムは,様々なデータセット上での現在のSOTAモデルよりも大幅に優れていることを示す。
論文 参考訳(メタデータ) (2023-05-08T21:48:17Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。