論文の概要: OpenOneRec Technical Report
- arxiv url: http://arxiv.org/abs/2512.24762v1
- Date: Wed, 31 Dec 2025 10:15:53 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-01-01 23:27:28.620002
- Title: OpenOneRec Technical Report
- Title(参考訳): OpenOneRecテクニカルレポート
- Authors: Guorui Zhou, Honghui Bao, Jiaming Huang, Jiaxin Deng, Jinghao Zhang, Junda She, Kuo Cai, Lejian Ren, Lu Ren, Qiang Luo, Qianqian Wang, Qigen Hu, Rongzhou Zhang, Ruiming Tang, Shiyao Wang, Wuchao Li, Xiangyu Wu, Xinchen Luo, Xingmei Wang, Yifei Hu, Yunfan Wu, Zhanyu Liu, Zhiyang Zhang, Zixing Zhang, Bo Chen, Bin Wen, Chaoyi Ma, Chengru Song, Chenglong Chu, Defu Lian, Fan Yang, Feng Jiang, Hongtao Cheng, Huanjie Wang, Kun Gai, Pengfei Zheng, Qiang Wang, Rui Huang, Siyang Mao, Tingting Gao, Wei Yuan, Yan Wang, Yang Zhou, Yi Su, Zexuan Cheng, Zhixin Ling, Ziming Li,
- Abstract要約: OneRecシリーズは、断片化されたレコメンデーションパイプラインをエンドツーエンドの生成フレームワークにうまく統合した。
OneRec Foundation (1.7B と 8B) は、新しい最先端(SOTA)を確立するモデルのファミリであり、RecIF-Benchのすべてのタスクにまたがる結果である。
Amazonベンチマークに移行すると、当社のモデルは10種類のデータセットに対して平均26.8%のRecall@10の改善により、最強のベースラインを越えた。
- 参考スコア(独自算出の注目度): 99.17075873619352
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: While the OneRec series has successfully unified the fragmented recommendation pipeline into an end-to-end generative framework, a significant gap remains between recommendation systems and general intelligence. Constrained by isolated data, they operate as domain specialists-proficient in pattern matching but lacking world knowledge, reasoning capabilities, and instruction following. This limitation is further compounded by the lack of a holistic benchmark to evaluate such integrated capabilities. To address this, our contributions are: 1) RecIF Bench & Open Data: We propose RecIF-Bench, a holistic benchmark covering 8 diverse tasks that thoroughly evaluate capabilities from fundamental prediction to complex reasoning. Concurrently, we release a massive training dataset comprising 96 million interactions from 160,000 users to facilitate reproducible research. 2) Framework & Scaling: To ensure full reproducibility, we open-source our comprehensive training pipeline, encompassing data processing, co-pretraining, and post-training. Leveraging this framework, we demonstrate that recommendation capabilities can scale predictably while mitigating catastrophic forgetting of general knowledge. 3) OneRec-Foundation: We release OneRec Foundation (1.7B and 8B), a family of models establishing new state-of-the-art (SOTA) results across all tasks in RecIF-Bench. Furthermore, when transferred to the Amazon benchmark, our models surpass the strongest baselines with an average 26.8% improvement in Recall@10 across 10 diverse datasets (Figure 1). This work marks a step towards building truly intelligent recommender systems. Nonetheless, realizing this vision presents significant technical and theoretical challenges, highlighting the need for broader research engagement in this promising direction.
- Abstract(参考訳): OneRecシリーズは断片化されたレコメンデーションパイプラインをエンドツーエンドの生成フレームワークに統合することに成功しているが、レコメンデーションシステムと汎用インテリジェンスの間には大きなギャップが残っている。
独立したデータによって制約され、ドメインスペシャリストとして機能し、パターンマッチングに精通するが、世界の知識、推論能力、指示に従う能力に欠ける。
この制限は、そのような統合能力を評価するための総合的なベンチマークが欠如していることによってさらに複雑になる。
これに対処するため、私たちの貢献は以下のとおりです。
1) RecIF Bench & Open Data: RecIF-Benchを提案する。
同時に、再現可能な研究を促進するために、16万人のユーザから96万のインタラクションからなる大規模なトレーニングデータセットをリリースする。
2) フレームワークとスケーリング: 完全な再現性を確保するため、私たちは、データ処理、共同トレーニング、ポストトレーニングを含む包括的なトレーニングパイプラインをオープンソース化しました。
このフレームワークを利用することで、一般的な知識の破滅的な忘れを省きながら、推奨能力が予測可能であることを実証する。
3) OneRec-Foundation: 私たちはOneRec Foundation(1.7Bと8B)をリリースします。
さらに、Amazonベンチマークに移行すると、当社のモデルは10の異なるデータセットに対して平均26.8%改善されたRecall@10で、最強のベースラインを越えた(図1)。
この作業は、真にインテリジェントなレコメンデーションシステムを構築するための一歩となる。
それでも、このビジョンを実現することは、この有望な方向への幅広い研究の関与の必要性を強調しながら、重要な技術的および理論的課題を提示する。
関連論文リスト
- MR$^2$-Bench: Going Beyond Matching to Reasoning in Multimodal Retrieval [86.35779264575154]
マルチモーダル検索は、現代のAIアプリケーションにおいて重要なコンポーネントになりつつあるが、その評価は、より現実的で困難なシナリオの要求に遅れている。
マルチモーダル検索のための推論集約型ベンチマークであるMR$2$-Benchを紹介する。
論文 参考訳(メタデータ) (2025-09-30T15:09:14Z) - OneRec-V2 Technical Report [93.91714323473678]
OneRecは、自己回帰生成タスクとしてレコメンデーションを再構築し、高いモデルFLOPの利用を達成する。
Lazy Decoder-Only Architecture: エンコーダボトルネックを排除し、全体の計算を94%削減し、トレーニングリソースを90%削減する。
現実のユーザインタラクションによる優先度調整: ユーザの好みに合うように、継続意識のリワードシェイピングとアダプティブ比クリッピングを組み込む。
論文 参考訳(メタデータ) (2025-08-28T15:29:51Z) - O1 Embedder: Let Retrievers Think Before Action [28.583031173137428]
我々は,対象文書の検索に先立って,入力クエリに有用な思考を生成するO1 Embedderを提案する。
私たちのアプローチは、12の一般的なデータセットで大幅に改善される包括的な実験によって評価されます。
これらの結果は、O1 Embedderの顕著な精度と一般化性を強調し、次世代IR基盤モデルの開発への道を開いた。
論文 参考訳(メタデータ) (2025-02-11T13:48:10Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。