論文の概要: Rich-Media Re-Ranker: A User Satisfaction-Driven LLM Re-ranking Framework for Rich-Media Search
- arxiv url: http://arxiv.org/abs/2602.05408v1
- Date: Thu, 05 Feb 2026 07:45:42 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-02-06 18:49:08.822759
- Title: Rich-Media Re-Ranker: A User Satisfaction-Driven LLM Re-ranking Framework for Rich-Media Search
- Title(参考訳): Rich-Media Re-Ranker: リッチメディア検索のためのユーザ満足度駆動型LLMリグレードフレームワーク
- Authors: Zihao Guo, Ligang Zhou, Zeyang Tang, Feicheng Li, Ying Nie, Zhiming Peng, Qingyun Sun, Jianxin Li,
- Abstract要約: 多次元およびきめ細かいモデリングによりユーザ検索満足度を高めるRich-Media Re-Rankerフレームワークを提案する。
提案手法は大規模産業検索システムに導入され,オンラインユーザエンゲージメント率と満足度指標を大幅に改善した。
- 参考スコア(独自算出の注目度): 28.45178179169568
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Re-ranking plays a crucial role in modern information search systems by refining the ranking of initial search results to better satisfy user information needs. However, existing methods show two notable limitations in improving user search satisfaction: inadequate modeling of multifaceted user intents and neglect of rich side information such as visual perception signals. To address these challenges, we propose the Rich-Media Re-Ranker framework, which aims to enhance user search satisfaction through multi-dimensional and fine-grained modeling. Our approach begins with a Query Planner that analyzes the sequence of query refinements within a session to capture genuine search intents, decomposing the query into clear and complementary sub-queries to enable broader coverage of users' potential intents. Subsequently, moving beyond primary text content, we integrate richer side information of candidate results, including signals modeling visual content generated by the VLM-based evaluator. These comprehensive signals are then processed alongside carefully designed re-ranking principle that considers multiple facets, including content relevance and quality, information gain, information novelty, and the visual presentation of cover images. Then, the LLM-based re-ranker performs the holistic evaluation based on these principles and integrated signals. To enhance the scenario adaptability of the VLM-based evaluator and the LLM-based re-ranker, we further enhance their capabilities through multi-task reinforcement learning. Extensive experiments demonstrate that our method significantly outperforms state-of-the-art baselines. Notably, the proposed framework has been deployed in a large-scale industrial search system, yielding substantial improvements in online user engagement rates and satisfaction metrics.
- Abstract(参考訳): ユーザ情報のニーズを満たすために,検索結果のランク付けを改良することで,情報検索システムにおいて再ランク付けが重要な役割を担っている。
しかし,既存手法では,多面的ユーザ意図の不十分なモデリングと,視覚的知覚信号などのリッチな側面情報の無視という,ユーザの検索満足度を向上させるための2つの重要な制限が示されている。
これらの課題に対処するために,多次元およびきめ細かいモデリングによるユーザ検索満足度向上を目的としたRich-Media Re-Rankerフレームワークを提案する。
我々のアプローチは、セッション内のクエリ改善のシーケンスを分析して、真の検索インテントをキャプチャし、クエリを明確で補完的なサブクエリに分解して、ユーザの潜在的なインテントの広範なカバレッジを可能にするクエリプランナから始まります。
次に,VLMに基づく評価器で生成した視覚的コンテンツをモデル化する信号を含む,よりリッチな候補情報を統合する。
これらの包括的信号は、コンテンツ関連性や品質、情報ゲイン、情報ノベルティ、カバー画像の視覚的表示など、複数の面を考慮に入れた、慎重に設計されたリグレード原理と共に処理される。
次に,LLMをベースとしたリランカは,これらの原理と統合信号に基づいて全体的評価を行う。
VLMベースの評価器とLLMベースのリランカのシナリオ適応性を高めるため、マルチタスク強化学習によりそれらの能力をさらに強化する。
大規模な実験により,本手法は最先端のベースラインを著しく上回ることがわかった。
特に,提案するフレームワークは大規模産業検索システムに導入されており,オンラインユーザエンゲージメント率や満足度指標を大幅に改善している。
関連論文リスト
- ViSS-R1: Self-Supervised Reinforcement Video Reasoning [84.1180294023835]
本稿では,新しい自己教師付き強化学習GRPOアルゴリズム(Pretext-GRPO)を標準R1パイプライン内に導入する。
また、プリテキストタスクに基づく自己教師型学習をMLLMのR1ポストトレーニングパラダイムに直接統合するViSS-R1フレームワークを提案する。
論文 参考訳(メタデータ) (2025-11-17T07:00:42Z) - MSRS: Evaluating Multi-Source Retrieval-Augmented Generation [51.717139132190574]
多くの現実世界のアプリケーションは、複数のソースにまたがる情報を統合して要約する能力を必要としている。
本稿では、RAGシステムに対して異なるソース間で情報を統合するための評価ベンチマークを構築するためのスケーラブルなフレームワークを提案する。
論文 参考訳(メタデータ) (2025-08-28T14:59:55Z) - Reinforcement Learning Tuning for VideoLLMs: Reward Design and Data Efficiency [56.475612147721264]
本稿では、離散的かつ連続的な報酬信号を通して意味的推論と時間的推論の両方を監督する二重回帰定式化を提案する。
我々は,ビデオQA,テンポラルビデオグラウンディング,グラウンドドビデオQAを含む8つの代表的なビデオ理解タスクに対するアプローチを評価した。
その結果、MLLMを用いた推論中心のビデオ理解の進展において、報酬設計とデータ選択の重要性が浮き彫りになった。
論文 参考訳(メタデータ) (2025-06-02T17:28:26Z) - InfoDeepSeek: Benchmarking Agentic Information Seeking for Retrieval-Augmented Generation [63.55258191625131]
InfoDeepSeekは、現実世界の動的Web環境でエージェント情報を求めるための新しいベンチマークである。
本稿では,決定性,難易度,多様性の基準を満たす課題クエリを構築するための体系的手法を提案する。
本研究では,情報探索結果の正確性,有用性,コンパクト性に関する詳細な指標を含む,動的エージェント情報探索に適した最初の評価フレームワークを開発する。
論文 参考訳(メタデータ) (2025-05-21T14:44:40Z) - Composed Multi-modal Retrieval: A Survey of Approaches and Applications [81.54640206021757]
複合マルチモーダル検索(CMR)は次世代技術として誕生する。
CMRは、参照視覚入力とテキスト修正を統合することで、画像やビデオをクエリすることを可能にする。
本稿では,CMRの基礎的課題,技術的進歩,応用について概説する。
論文 参考訳(メタデータ) (2025-03-03T09:18:43Z) - Qilin: A Multimodal Information Retrieval Dataset with APP-level User Sessions [39.2477761959206]
検索・レコメンデーション(S&R)を伴う複雑なシステムにおけるユーザエクスペリエンス向上の課題は、学術と産業の両方から大きな注目を集めている。
本稿では,新しいマルチモーダル情報検索データセット,すなわちQilinを提案する。
データセットはXiaohongshuから収集されている。Xiaohongshuは3億人の月間アクティブユーザーがいて、平均的な検索浸透率は70%を超えている。
論文 参考訳(メタデータ) (2025-03-01T14:15:00Z) - RoRA-VLM: Robust Retrieval-Augmented Vision Language Models [41.09545760534495]
RORA-VLMは、視覚言語モデルに特化して設計された、新規で堅牢な検索拡張フレームワークである。
提案手法の有効性とロバスト性を,広く採用されている3つのベンチマークデータセット上で検証する。
論文 参考訳(メタデータ) (2024-10-11T14:51:00Z) - Pistis-RAG: Enhancing Retrieval-Augmented Generation with Human Feedback [41.88662700261036]
RAGシステムは、セマンティックな関連性だけでは生成品質の向上を保証していない場合に制限に直面している。
我々は、LLMと人間の嗜好をよりよく整合させるために、コンテンツ中心のアプローチで設計された新しいRAGフレームワークであるPristis-RAGを提案する。
論文 参考訳(メタデータ) (2024-06-21T08:52:11Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。