Fugu-MT 論文翻訳(概要): QARM V2: Quantitative Alignment Multi-Modal Recommendation for Reasoning User Sequence Modeling

論文の概要: QARM V2: Quantitative Alignment Multi-Modal Recommendation for Reasoning User Sequence Modeling

arxiv url: http://arxiv.org/abs/2602.08559v1
Date: Mon, 09 Feb 2026 11:57:28 GMT
ステータス: 翻訳完了
システム内更新日: 2026-02-10 20:26:25.207138
Title: QARM V2: Quantitative Alignment Multi-Modal Recommendation for Reasoning User Sequence Modeling
Title（参考訳）: QARM V2: ユーザシーケンスモデリングの推論のための量的アライメントマルチモーダルレコメンデーション
Authors: Tian Xia, Jiaqi Zhang, Yueyang Liu, Hongjian Dou, Tingya Yin, Jiangxia Cao, Xulei Liang, Tianlu Xie, Lihao Liu, Xiang Chen, Shen Wang, Changxin Lao, Haixiang Gan, Jinkai Yu, Keting Cen, Lu Hao, Xu Zhang, Qiqiang Zhong, Zhongbo Sun, Yiyu Wang, Shuang Yang, Mingxin Wen, Xiangyu Wu, Shaoguo Liu, Tingting Gao, Zhaojie Liu, Han Li, Kun Gai,
Abstract要約: 従来のRecSysは、GSU(General Search Unit)およびESU(Exact Search Unit)パラダイムにおけるユーザーシーケンスモデリングのためのIDベースの埋め込みに依存している。本稿では,ユーザシーケンスモデリングにおけるLLMセマンティック理解をRecSysビジネス要求にブリッジする統合フレームワークであるQARM V2を提案する。
参考スコア（独自算出の注目度）: 43.14172197611297
License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
Abstract: With the evolution of large language models (LLMs), there is growing interest in leveraging their rich semantic understanding to enhance industrial recommendation systems (RecSys). Traditional RecSys relies on ID-based embeddings for user sequence modeling in the General Search Unit (GSU) and Exact Search Unit (ESU) paradigm, which suffers from low information density, knowledge isolation, and weak generalization ability. While LLMs offer complementary strengths with dense semantic representations and strong generalization, directly applying LLM embeddings to RecSys faces critical challenges: representation unmatch with business objectives and representation unlearning end-to-end with downstream tasks. In this paper, we present QARM V2, a unified framework that bridges LLM semantic understanding with RecSys business requirements for user sequence modeling.
Abstract（参考訳）: 大規模言語モデル(LLM)の進化に伴い、産業レコメンデーションシステム(RecSys)を強化するために、その豊富な意味理解を活用することへの関心が高まっている。従来のRecSysは、低情報密度、知識分離、および弱い一般化能力に苦しむ一般検索ユニット(GSU)およびエクサクソン検索ユニット(ESU)パラダイムにおけるユーザーシーケンスモデリングのためのIDベースの埋め込みに依存している。 LLMは、密接なセマンティック表現と強力な一般化を備えた補完的な強みを提供するが、LLMの埋め込みをRecSysに直接適用することは、ビジネス目標にマッチしない表現と、下流タスクに未学習のエンドツーエンドを表現するという、重要な課題に直面している。本稿では,ユーザシーケンスモデリングにおけるLLM意味理解をRecSysビジネス要求にブリッジする統合フレームワークQARM V2を提案する。

関連論文リスト

ReaLM: Residual Quantization Bridging Knowledge Graph Embeddings and Large Language Models [18.720486146234077]
大言語モデル(LLM)は知識グラフ補完(KGC)の強力なパラダイムとして登場した。我々は、KG埋め込みとLLMトークン化のギャップを埋める、新しく効果的なフレームワークであるReaLMを提案する。本稿では,ReaLMが最先端性能を実現し,構造化知識と大規模言語モデルとの整合性を確認した。
論文参考訳（メタデータ） (2025-10-10T04:36:13Z)
Think Then Embed: Generative Context Improves Multimodal Embedding [51.76690812535934]
本稿では,ユニバーサル・マルチモーダル・エンベディング (UME) のためのThink-Then-Embed (TTE) フレームワークを提案する。強力なMLLM推論器を利用することで、MMEB-V2ベンチマークで最先端のパフォーマンスを達成し、大規模な社内データセットでトレーニングされたプロプライエタリモデルを上回った。
論文参考訳（メタデータ） (2025-10-06T16:53:56Z)
AMAS: Adaptively Determining Communication Topology for LLM-based Multi-Agent System [19.336020954831202]
大規模言語モデル (LLM) は自然言語処理能力に革命をもたらし、産業問題解決のための自律型マルチエージェントシステム (MAS) として実践的に実装されている。我々は、新しい動的グラフデザイナを通じてLLMベースのMASを再定義するパラダイムシフトフレームワークであるAMASを紹介する。 AMASは個々の入力の固有の特性を利用して、タスク最適化エージェント経路を介してインテリジェントにクエリトラジェクトリをクエリする。
論文参考訳（メタデータ） (2025-10-02T02:50:22Z)
Understanding Generative Recommendation with Semantic IDs from a Model-scaling View [57.471604518714535]
Generative Recommendation (GR)は、リッチアイテムのセマンティクスと協調フィルタリング信号を統合する。一般的なアプローチの1つは、セマンティックID(SID)を使用して、自動回帰ユーザーインタラクションシーケンスモデリングのセットアップでアイテムを表現することである。 SIDをベースとしたGRは,モデルをスケールアップしながら大きなボトルネックを示す。我々は、大規模言語モデル(LLM)を直接レコメンデーションとして使用する別のGRパラダイムを再考する。
論文参考訳（メタデータ） (2025-09-29T21:24:17Z)
Quantization Meets dLLMs: A Systematic Study of Post-training Quantization for Diffusion LLMs [78.09559830840595]
本稿では拡散に基づく言語モデルの定量化に関する最初の体系的研究について述べる。異常に大きなアクティベーション値によって特徴付けられるアクティベーションアウトリーチの存在を同定する。我々は最先端のPTQ手法を実装し、包括的な評価を行う。
論文参考訳（メタデータ） (2025-08-20T17:59:51Z)
Compositional Chain-of-Thought Prompting for Large Multimodal Models [46.721769077885966]
CCoT(コンポジション・チェーン・オブ・ソート)は、新規なゼロショット・オブ・ソート・プロンプト法である。まず,Large Language Model(LLM)を用いてSGを生成し,そのSGをプロンプトに使用して応答を生成する。提案手法は,LMMの性能向上だけでなく,一般的なマルチモーダルベンチマーク上でのLMMの性能向上にも寄与する。
論文参考訳（メタデータ） (2023-11-27T22:23:27Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。