論文の概要: Efficient Optimization of Hierarchical Identifiers for Generative Recommendation
- arxiv url: http://arxiv.org/abs/2512.18434v1
- Date: Sat, 20 Dec 2025 17:21:41 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-12-23 18:54:32.330965
- Title: Efficient Optimization of Hierarchical Identifiers for Generative Recommendation
- Title(参考訳): 生成レコメンデーションのための階層型識別子の効率的な最適化
- Authors: Federica Valeau, Odysseas Boufalis, Polytimi Gkotsi, Joshua Rosenthal, David Vos,
- Abstract要約: SEATERは、推薦推論効率と検索品質を向上させる生成的検索モデルである。
我々は,SEATERが報告した,全データセットにわたる強力なベースラインに対する検索品質の改善を再現し,検証する。
評価を大規模音楽レコメンデーションデータセットYambdaに拡張する。
- 参考スコア(独自算出の注目度): 0.13048920509133807
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: SEATER is a generative retrieval model that improves recommendation inference efficiency and retrieval quality by utilizing balanced tree-structured item identifiers and contrastive training objectives. We reproduce and validate SEATER's reported improvements in retrieval quality over strong baselines across all datasets from the original work, and extend the evaluation to Yambda, a large-scale music recommendation dataset. Our experiments verify SEATER's strong performance, but show that its tree construction step during training becomes a major bottleneck as the number of items grows. To address this, we implement and evaluate two alternative construction algorithms: a greedy method optimized for minimal build time, and a hybrid method that combines greedy clustering at high levels with more precise grouping at lower levels. The greedy method reduces tree construction time to less than 2% of the original with only a minor drop in quality on the dataset with the largest item collection. The hybrid method achieves retrieval quality on par with the original, and even improves on the largest dataset, while cutting construction time to just 5-8%. All data and code are publicly available for full reproducibility at https://github.com/joshrosie/re-seater.
- Abstract(参考訳): SEATERは,バランスの取れた木構造アイテム識別子と対照的な学習目標を活用することで,推薦推論効率と検索品質を向上させるジェネレーティブ検索モデルである。
我々は,SEATERが報告した検索品質の改善を,オリジナル作品から全データセットにわたって再現し,評価を大規模音楽レコメンデーションデータセットYambdaに拡張した。
実験では,SEATERの強い性能を検証した上で,トレーニング中の木構築ステップが,項目数の増加とともに大きなボトルネックとなることを示す。
そこで我々は,最小限のビルド時間に最適化されたgreedy法と,高レベルでのgreedyクラスタリングとより高精度なグループ化を組み合わせたハイブリッド手法の2つの代替構築アルゴリズムの実装と評価を行った。
greedy法は、最大のアイテムコレクションを持つデータセットの品質をわずかに低下させることなく、ツリー構築時間を元の2%未満に短縮する。
このハイブリット法は, 従来と同等の検索品質を達成し, 構築時間を5~8%に短縮しつつ, 最大データセットも改善する。
すべてのデータとコードはhttps://github.com/joshrosie/re-seater.comで公開されています。
関連論文リスト
- Let's Revise Step-by-Step: A Unified Local Search Framework for Code Generation with LLMs [16.818072348542923]
本稿では,ステップバイステップのコード修正を効果的に行う統一的なローカル検索フレームワークを提案する。
具体的には、ReLocは4つの主要なアルゴリズムコンポーネントを通して、一連のローカルリビジョンを探索する。
そこで我々は,修正距離に基づいてコード品質を評価できる特化リビジョン報酬モデルを構築し,微粒な選好を生成する。
論文 参考訳(メタデータ) (2025-08-10T17:11:56Z) - TreeBoN: Enhancing Inference-Time Alignment with Speculative Tree-Search and Best-of-N Sampling [62.80050721268028]
推論時アライメントは、追加のトレーニングや微調整を必要とせずに、大きな言語モデルの性能を向上させる。
Best-of-N (BoN) サンプリングは、単純だが強力なアプローチであり、複数のレスポンスを生成し、最良のものを選択する。
我々は、投機的木探索戦略をBest-of-N(BoN)サンプリングに統合する新しいフレームワークであるTreeBoNを提案する。
論文 参考訳(メタデータ) (2024-10-18T04:38:21Z) - Learning Deep Tree-based Retriever for Efficient Recommendation: Theory and Method [76.31185707649227]
効率的なレコメンデーションのために,Deep Tree-based Retriever (DTR)を提案する。
DTRは、トレーニングタスクを、同じレベルでツリーノード上のソフトマックスベースのマルチクラス分類としてフレーム化している。
非リーフノードのラベル付けによって引き起こされる準最適性を緩和するため、損失関数の補正法を提案する。
論文 参考訳(メタデータ) (2024-08-21T05:09:53Z) - Hierarchical clustering with dot products recovers hidden tree structure [53.68551192799585]
本稿では,階層構造の回復に着目した凝集クラスタリングアルゴリズムの新しい視点を提案する。
クラスタを最大平均点積でマージし、例えば最小距離やクラスタ内分散でマージしないような、標準的なアルゴリズムの単純な変種を推奨する。
このアルゴリズムにより得られた木は、汎用確率的グラフィカルモデルの下で、データ中の生成的階層構造をボナフェイド推定することを示した。
論文 参考訳(メタデータ) (2023-05-24T11:05:12Z) - Constructing Tree-based Index for Efficient and Effective Dense
Retrieval [26.706985694158384]
JTRは、TReeベースのインデックスとクエリエンコーディングの合同最適化の略である。
我々は、木に基づくインデックスとクエリエンコーダをエンドツーエンドにトレーニングするために、新しい統合されたコントラスト学習損失を設計する。
実験結果から,JTRは高いシステム効率を維持しつつ,検索性能が向上することが示された。
論文 参考訳(メタデータ) (2023-04-24T09:25:39Z) - Highly Parallel Autoregressive Entity Linking with Discriminative
Correction [51.947280241185]
自己回帰リンクを全ての潜在的な言及に対して並列化する,非常に効率的な手法を提案する。
我々のモデルは以前の生成法より70倍高速で精度が高い。
論文 参考訳(メタデータ) (2021-09-08T17:28:26Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。