論文の概要: CardRewriter: Leveraging Knowledge Cards for Long-Tail Query Rewriting on Short-Video Platforms
- arxiv url: http://arxiv.org/abs/2510.10095v1
- Date: Sat, 11 Oct 2025 08:09:14 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-10-14 18:06:29.778044
- Title: CardRewriter: Leveraging Knowledge Cards for Long-Tail Query Rewriting on Short-Video Platforms
- Title(参考訳): CardRewriter:ショートビデオプラットフォーム上でのロングテールクエリ書き換えに知識カードを活用する
- Authors: Peiyuan Gong, Feiran Zhu, Yaqi Yin, Chenglei Dai, Chao Zhang, Kai Zheng, Wentian Bao, Jiaxin Mao, Yi Zhang,
- Abstract要約: textbfCardRewriterは、ドメイン固有の知識を取り入れたフレームワークで、ロングテールクエリの書き直しを強化します。
CardRewriterは、プロプライエタリなコンテンツをターゲットにしたクエリの書き換え品質を大幅に改善する。
中国最大のショートビデオプラットフォームであるKuaishouに毎日数億人のユーザーがサービスを提供している。
- 参考スコア(独自算出の注目度): 22.46507227200999
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Short-video platforms have rapidly become a new generation of information retrieval systems, where users formulate queries to access desired videos. However, user queries, especially long-tail ones, often suffer from spelling errors, incomplete phrasing, and ambiguous intent, resulting in mismatches between user expectations and retrieved results. While large language models (LLMs) have shown success in long-tail query rewriting within e-commerce, they struggle on short-video platforms, where proprietary content such as short videos, live streams, micro dramas, and user social networks falls outside their training distribution. To address this challenge, we introduce \textbf{CardRewriter}, an LLM-based framework that incorporates domain-specific knowledge to enhance long-tail query rewriting. For each query, our method aggregates multi-source knowledge relevant to the query and summarizes it into an informative and query-relevant knowledge card. This card then guides the LLM to better capture user intent and produce more effective query rewrites. We optimize CardRewriter using a two-stage training pipeline: supervised fine-tuning followed by group relative policy optimization, with a tailored reward system balancing query relevance and retrieval effectiveness. Offline experiments show that CardRewriter substantially improves rewriting quality for queries targeting proprietary content. Online A/B testing further confirms significant gains in long-view rate (LVR) and click-through rate (CTR), along with a notable reduction in initiative query reformulation rate (IQRR). Since September 2025, CardRewriter has been deployed on Kuaishou, one of China's largest short-video platforms, serving hundreds of millions of users daily.
- Abstract(参考訳): ショートビデオプラットフォームは、ユーザーが望むビデオにアクセスするためのクエリを定式化する情報検索システムとして、急速に新しい世代のものになりつつある。
しかし、ユーザクエリ、特にロングテールクエリは、スペルエラー、不完全なフレーズ、曖昧な意図に悩まされ、ユーザの期待と結果のミスマッチが発生します。
大規模言語モデル(LLM)は、eコマース内でのロングテールクエリ書き換えに成功しているが、ショートビデオ、ライブストリーム、マイクロドラマ、ユーザーソーシャルネットワークといったプロプライエタリなコンテンツがトレーニング配信外にあるショートビデオプラットフォームでは苦労している。
この課題に対処するために,LLM ベースのフレームワークである \textbf{CardRewriter} を紹介した。
クエリ毎に,クエリに関連する複数のソース知識を集約し,それを情報およびクエリ関連知識カードに要約する。
このカードはLLMを誘導し、ユーザーの意図をよりよく捉え、より効果的なクエリ書き換えを生成する。
CardRewriterを2段階の訓練パイプラインで最適化する: 教師付き微調整とグループ相対的なポリシー最適化、クエリの妥当性と検索効率のバランスを調整した報酬システム。
オフライン実験は、CardRewriterがプロプライエタリなコンテンツをターゲットにしたクエリの書き換え品質を大幅に改善していることを示している。
オンラインA/Bテストはさらに、LVR(Long-view rate)とCTR(Click-through rate)の顕著な増加と、イニシアチブクエリ改革率(IQRR)の顕著な低下を確認している。
2025年9月以降、CardRewriterは中国最大のショートビデオプラットフォームであるKuaishouに展開され、毎日数億人のユーザーにサービスを提供している。
関連論文リスト
- Beyond Relevance: Improving User Engagement by Personalization for Short-Video Search [16.491313774639007]
我々は,ショートビデオ検索をパーソナライズするための新鮮で包括的なソリューションである$textPR2$を紹介した。
具体的には、$textPR2$はクエリ関連コラボレーティブフィルタリングとパーソナライズされた高密度検索を利用する。
私たちは近年,ユーザエンゲージメントの改善を最も目覚ましいものにしています。
論文 参考訳(メタデータ) (2024-09-17T15:37:51Z) - Bridging Information Asymmetry in Text-video Retrieval: A Data-centric Approach [56.610806615527885]
テキストビデオ検索(TVR)における重要な課題は、ビデオとテキスト間の情報非対称性である。
本稿では,このギャップを埋めるために,テキスト表現を豊かにすることで,映像コンテンツの豊かさに合わせたデータ中心のフレームワークを提案する。
本稿では,最も関連性が高く多様なクエリを識別し,計算コストを低減し,精度を向上するクエリ選択機構を提案する。
論文 参考訳(メタデータ) (2024-08-14T01:24:09Z) - VideoTree: Adaptive Tree-based Video Representation for LLM Reasoning on Long Videos [67.78336281317347]
長文理解は,ビデオデータの冗長度が高く,クエリ非関連情報の豊富さによって複雑になる。
我々は,LLM推論のためのクエリ適応的かつ階層的なビデオ表現を構築する,トレーニング不要なフレームワークであるVideoTreeを提案する。
論文 参考訳(メタデータ) (2024-05-29T15:49:09Z) - Backtracing: Retrieving the Cause of the Query [7.715089044732362]
本稿では,ユーザクエリを最も引き起こす可能性のあるテキストセグメントをシステムで検索する,バックトラシングのタスクを紹介する。
人気情報検索手法と言語モデリング手法のゼロショット性能を評価する。
以上の結果から,後方追跡には改善の余地があり,新たな検索手法が必要であることが示唆された。
論文 参考訳(メタデータ) (2024-03-06T18:59:02Z) - Query Rewriting for Retrieval-Augmented Large Language Models [139.242907155883]
大規模言語モデル(LLM)は、検索対象のパイプラインで強力なブラックボックスリーダーを動作させる。
この作業では、検索拡張LDMに対する以前の検索テーマ読み込みの代わりに、新しいフレームワークであるRewrite-Retrieve-Readを導入する。
論文 参考訳(メタデータ) (2023-05-23T17:27:50Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。