論文の概要: LLM-Aligned Geographic Item Tokenization for Local-Life Recommendation
- arxiv url: http://arxiv.org/abs/2511.14221v1
- Date: Tue, 18 Nov 2025 07:54:32 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-11-19 16:23:52.998078
- Title: LLM-Aligned Geographic Item Tokenization for Local-Life Recommendation
- Title(参考訳): 地域レコメンデーションのためのLLM対応地理的項目トークン化
- Authors: Hao Jiang, Guoquan Wang, Donglin Zhou, Sheng Yu, Yang Zeng, Wencong Zeng, Kun Gai, Guorui Zhou,
- Abstract要約: LGSID は LLM-Hierarchical Geographic Item Tokenization Framework for Local-life Recommendation である。
本稿では,学習前報酬モデルを用いて空間知識の一般化と協調的な信号をLLMに注入する新しいG-DPOアルゴリズムを提案する。
実世界のKuaishou産業データセットの実験によると、LGSIDは最先端の差別的で生成的なレコメンデーションモデルよりも一貫して優れている。
- 参考スコア(独自算出の注目度): 21.430438767288106
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Recent advances in Large Language Models (LLMs) have enhanced text-based recommendation by enriching traditional ID-based methods with semantic generalization capabilities. Text-based methods typically encode item textual information via prompt design and generate discrete semantic IDs through item tokenization. However, in domain-specific tasks such as local-life services, simply injecting location information into prompts fails to capture fine-grained spatial characteristics and real-world distance awareness among items. To address this, we propose LGSID, an LLM-Aligned Geographic Item Tokenization Framework for Local-life Recommendation. This framework consists of two key components: (1) RL-based Geographic LLM Alignment, and (2) Hierarchical Geographic Item Tokenization. In the RL-based alignment module, we initially train a list-wise reward model to capture real-world spatial relationships among items. We then introduce a novel G-DPO algorithm that uses pre-trained reward model to inject generalized spatial knowledge and collaborative signals into LLMs while preserving their semantic understanding. Furthermore, we propose a hierarchical geographic item tokenization strategy, where primary tokens are derived from discrete spatial and content attributes, and residual tokens are refined using the aligned LLM's geographic representation vectors. Extensive experiments on real-world Kuaishou industry datasets show that LGSID consistently outperforms state-of-the-art discriminative and generative recommendation models. Ablation studies, visualizations, and case studies further validate its effectiveness.
- Abstract(参考訳): 近年のLarge Language Models (LLM) の進歩は、意味一般化機能を備えた従来のIDベースの手法を充実させることで、テキストベースの推薦を強化している。
テキストベースの手法は通常、アイテムのテキスト情報をプロンプト設計によってエンコードし、アイテムトークン化を通じて個別の意味IDを生成する。
しかし、地域生活サービスなどのドメイン固有のタスクでは、単に位置情報をプロンプトに注入するだけでは、細かい空間特性や、アイテム間の現実的距離の認識を捉えることができない。
そこで本研究では,LLM対応の地域生活推薦用アイテムトークン化フレームワークであるLGSIDを提案する。
本フレームワークは,(1)RLに基づく地理LLMアライメント,(2)階層的地理的項目トークン化の2つのキーコンポーネントから構成される。
RLをベースとしたアライメントモジュールでは、まずリストワイド報酬モデルを用いて、アイテム間の実空間関係を抽出する。
次に、学習前の報酬モデルを用いて、LLMに一般化された空間知識と協調的な信号を注入し、その意味的理解を保ちながら、新しいG-DPOアルゴリズムを導入する。
さらに,一次トークンを離散空間属性とコンテンツ属性から導出する階層的な地理的項目トークン化戦略を提案し,残余トークンをLLMの地理的表現ベクトルを用いて改良する。
実世界のKuaishou産業データセットに関する大規模な実験は、LGSIDが最先端の差別的・生成的レコメンデーションモデルより一貫して優れていることを示している。
アブレーション研究、可視化、およびケーススタディは、その効果をさらに検証する。
関連論文リスト
- Spatial Preference Rewarding for MLLMs Spatial Understanding [92.25703021388142]
マルチモーダル大言語モデル (MLLM) は, 有望な空間理解能力を示した。
彼らの成功にもかかわらず、MLLMは依然として微粒な空間知覚能力に不足している。
本稿では,MLLMの空間能力を高めるSPR(Spatial Preference Rewarding)アプローチを提案する。
論文 参考訳(メタデータ) (2025-10-16T07:16:18Z) - Automated Label Placement on Maps via Large Language Models [3.7553323195283697]
データ編集問題としてタスクを定式化するALP(Automatic label Placement)の新たなパラダイムを導入する。
この方向を支援するため,実世界の地図上でALPを評価するためのベンチマークデータセットとして,MAPLEをキュレートした。
我々は,MAPLE 上で4つのオープンソース LLM を評価し,各種ランドマークの全体的な性能と一般化を解析した。
論文 参考訳(メタデータ) (2025-07-29T18:00:22Z) - Beyond the Surface: Uncovering Implicit Locations with LLMs for Personalized Local News [0.2749898166276854]
本稿では,タボオラの「ホームページ・フォー・ユー」システムにおける局所的な記事分類のためのLarge Language Models(LLM)について検討する。
LLMは、正確性と説明可能性に関する懸念を高めながら、新たな可能性を提供します。
LLMベースの位置分類を統合したスケーラブルなパイプラインにより、ローカルな記事の配布が27%増加した。
論文 参考訳(メタデータ) (2025-02-20T15:55:52Z) - Grid-Based Projection of Spatial Data into Knowledge Graphs [1.3723120574076129]
実世界の実体の空間的特性を知識グラフにエンコードできることを示す。
本稿では,各街路セグメントを個別に把握する従来の手法から,知識グラフにおける街路ネットワークを表現する新しい手法を提案する。
論文 参考訳(メタデータ) (2024-11-04T17:35:41Z) - DIAL: Dense Image-text ALignment for Weakly Supervised Semantic Segmentation [8.422110274212503]
弱教師付きセマンティックセグメンテーションアプローチは通常、初期シード生成にクラスアクティベーションマップ(CAM)に依存する。
DALNetは、テキストの埋め込みを利用して、さまざまなレベルの粒度のオブジェクトの包括的理解と正確な位置決めを強化する。
このアプローチは特に、シングルステージの手法として、より効率的なエンドツーエンドプロセスを可能にします。
論文 参考訳(メタデータ) (2024-09-24T06:51:49Z) - Swarm Intelligence in Geo-Localization: A Multi-Agent Large Vision-Language Model Collaborative Framework [51.26566634946208]
smileGeoは、新しい視覚的ジオローカライゼーションフレームワークである。
エージェント間のコミュニケーションによって、SmithGeoはこれらのエージェントの固有の知識と、検索された情報を統合する。
その結果,本手法は現在の最先端手法よりも優れていた。
論文 参考訳(メタデータ) (2024-08-21T03:31:30Z) - Language Representations Can be What Recommenders Need: Findings and Potentials [57.90679739598295]
先進的なLM表現から線形にマッピングされた項目表現は、より優れたレコメンデーション性能が得られることを示す。
この結果は、先進言語表現空間と効果的な項目表現空間との同型性を示唆している。
本研究は,自然言語処理とリコメンデーションシステムコミュニティの両方に刺激を与える言語モデリングと行動モデリングの関連性を強調した。
論文 参考訳(メタデータ) (2024-07-07T17:05:24Z) - Text-Video Retrieval with Global-Local Semantic Consistent Learning [122.15339128463715]
我々は,シンプルで効果的なグローバル局所意味的一貫性学習(GLSCL)を提案する。
GLSCLは、テキストビデオ検索のためのモダリティをまたいだ潜在共有セマンティクスを活用する。
本手法はSOTAと同等の性能を実現し,計算コストの約220倍の高速化を実現している。
論文 参考訳(メタデータ) (2024-05-21T11:59:36Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。