論文の概要: SID-Coord: Coordinating Semantic IDs for ID-based Ranking in Short-Video Search
- arxiv url: http://arxiv.org/abs/2604.10471v1
- Date: Sun, 12 Apr 2026 05:51:35 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-04-14 20:13:16.037009
- Title: SID-Coord: Coordinating Semantic IDs for ID-based Ranking in Short-Video Search
- Title(参考訳): SID-Coord:ショートビデオ検索におけるIDベースのランク付けのためのセマンティックIDのコーディネート
- Authors: Guowen Li, Yuepeng Zhang, Shunyu Zhang, Yi Zhang, Xiaoze Jiang, Yi Wang, Jingwei Zhuo,
- Abstract要約: SID-Coordは、個別のトレーニング可能なセマンティックIDをIDベースのランキングモデルに直接組み込む軽量なセマンティックIDフレームワークである。
SID-Coordは、セマンティックシグナルを補助的な高密度な特徴として扱う代わりに、セマンティックスを構造化識別子として表現する。
実世界の生産環境でのオンラインA/B実験は統計的に有意な改善を示した。
- 参考スコア(独自算出の注目度): 9.72713305999446
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Large-scale short-video search ranking models are typically trained on sparse co-occurrence signals over hashed item identifiers (HIDs). While effective at memorizing frequent interactions, such ID-based models struggle to generalize to long-tailed items with limited exposure. This memorization-generalization trade-off remains a longstanding challenge in such industrial systems. We propose SID-Coord, a lightweight Semantic ID framework that incorporates discrete, trainable semantic IDs (SIDs) directly into ID-based ranking models. Instead of treating semantic signals as auxiliary dense features, SID-Coord represents semantics as structured identifiers and coordinates HID-based memorization with SID-based generalization within a unified modeling framework. To enable effective coordination, SID-Coord introduces three components: (1) an attention-based fusion module over hierarchical SIDs to capture multi-level semantics, (2) a target-aware HID-SID gating mechanism that adaptively balances memorization and generalization, and (3) a SID-driven interest alignment module that models the semantic similarity distribution between target items and user histories. SID-Coord can be integrated into existing production ranking systems without modifying the backbone model. Online A/B experiments in a real-world production environment show statistically significant improvements, with a +0.664% gain in long-play rate in search and a +0.369% increase in search playback duration.
- Abstract(参考訳): 大規模なショートビデオ検索ランキングモデルは通常、ハッシュアイテム識別子(HID)よりも粗い共起信号に基づいて訓練される。
頻繁な相互作用を記憶することは効果的であるが、そのようなIDベースのモデルは、露出が限られた長い長い項目に一般化するのに苦労する。
この記憶化一般化トレードオフは、そのような産業システムにおける長年にわたる課題である。
SID-Coordは、個別のトレーニング可能なセマンティックID(SID)をIDベースのランキングモデルに直接組み込む軽量セマンティックIDフレームワークである。
SID-Coordは、セマンティック信号を補助的な高密度特徴として扱う代わりに、セマンティックスを構造化識別子として表現し、統一モデリングフレームワーク内でのHIDベースの記憶とSIDベースの一般化をコーディネートする。
効果的なコーディネートを実現するため,(1)階層型SID上の注意ベース融合モジュールによるマルチレベルセマンティクスのキャプチャ,(2)記憶と一般化を適応的にバランスさせるターゲット認識型HID-SIDゲーティング機構,(3)ターゲット項目とユーザ履歴間の意味的類似度分布をモデル化するSID駆動型関心アライメントモジュールの3つのコンポーネントを導入している。
SID-Coordは、バックボーンモデルを変更することなく、既存のプロダクションランキングシステムに統合することができる。
実世界の生産環境でのオンラインA/B実験は統計的に有意な改善を示し、検索の長期プレイレートは+0.664%、検索期間は+0.369%上昇した。
関連論文リスト
- Semantic IDs for Recommender Systems at Snapchat: Use Cases, Technical Challenges, and Design Choices [39.95009019603262]
我々はSnapchatでセマンティックID(SID)を適用しているときに遭遇した実践的技術的課題について論じる。
SIDは原子よりも基数が非常に小さく、ID空間のセマンティッククラスタリングを誘導する。
我々は、ランキングモデルの補助機能としてSIDを適用し、また、異なるMLアプリケーションで追加の検索ソースとしてSIDを探索する。
論文 参考訳(メタデータ) (2026-04-05T03:46:52Z) - IntRR: A Framework for Integrating SID Redistribution and Length Reduction [14.327886721362647]
目的整合SID再分配と構造長削減を統合した新しいフレームワークであるIntRRを提案する。
IntRRは、代表的な生成ベースラインよりも大幅に改善され、推奨精度と効率の両方で優れた性能を達成する。
論文 参考訳(メタデータ) (2026-02-24T09:09:40Z) - End-to-End Semantic ID Generation for Generative Advertisement Recommendation [33.453121305193434]
生成広告推薦のための統一SID生成フレームワークを提案する。
具体的には、生の広告データからエンドツーエンドで埋め込みとSIDを協調的に最適化する。
実験により、UniSIDは最先端のSID生成方法よりも一貫して優れていることが示された。
論文 参考訳(メタデータ) (2026-02-11T02:38:26Z) - The Best of the Two Worlds: Harmonizing Semantic and Hash IDs for Sequential Recommendation [51.62815306481903]
我々は,SIDとHIDを調和させる新しいフレームワークであるtextbfnameを提案する。具体的には,HIDのユニークなコラボレーティブアイデンティティを保ちながら,SID内のマルチグラニュラーセマンティクスの両方をキャプチャ可能な,デュアルブランチモデリングアーキテクチャを考案する。
実世界の3つのデータセットの実験では、名前は、既存のベースラインを越えながら、頭と尾の両方の推奨品質のバランスをとる。
論文 参考訳(メタデータ) (2025-12-11T07:50:53Z) - Enhancing Embedding Representation Stability in Recommendation Systems with Semantic ID [29.560370412849874]
本稿では,従来のセマンティックIDの性能を大幅に向上させる新しいトークンパラメータ化手法であるセマンティックIDプレフィックスngramを紹介する。
セマンティックIDプレフィックスngramは, 組込み不安定性に対処するだけでなく, テールIDモデリングを著しく改善し, オーバーフィッティングを低減し, 表現シフトを緩和する。
また,Semantic IDをMeta Production Ads Rankingシステムに統合した経験を報告する。
論文 参考訳(メタデータ) (2025-04-02T21:28:38Z) - VILLS -- Video-Image Learning to Learn Semantics for Person Re-Identification [51.89551385538251]
VILLS (Video-Image Learning to Learn Semantics) は画像やビデオから空間的特徴と時間的特徴を共同で学習する自己教師型手法である。
VILLSはまず、意味的一貫性と頑健な空間的特徴を適応的に抽出する局所意味抽出モジュールを設計する。
そして、VILLSは、一貫した特徴空間における画像とビデオのモダリティを表現するために、統合された特徴学習および適応モジュールを設計する。
論文 参考訳(メタデータ) (2023-11-27T19:30:30Z) - Language Models As Semantic Indexers [78.83425357657026]
本稿では,ジェネレーティブ言語モデルを用いてセマンティックIDを学習するための自己教師型フレームワークLMIndexerを紹介する。
学習したIDの質を検証し,推奨,製品検索,文書検索の3つの課題において有効性を示す。
論文 参考訳(メタデータ) (2023-10-11T18:56:15Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。