論文の概要: OneLoc: Geo-Aware Generative Recommender Systems for Local Life Service
- arxiv url: http://arxiv.org/abs/2508.14646v1
- Date: Wed, 20 Aug 2025 11:57:48 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-08-21 16:52:41.443593
- Title: OneLoc: Geo-Aware Generative Recommender Systems for Local Life Service
- Title(参考訳): OneLoc: ローカルライフサービスのためのジオアウェアな生成レコメンダシステム
- Authors: Zhipeng Wei, Kuo Cai, Junda She, Jie Chen, Minghao Chen, Yang Zeng, Qiang Luo, Wencong Zeng, Ruiming Tang, Kun Gai, Guorui Zhou,
- Abstract要約: ユーザの興味やリアルタイムの位置を考慮に入れたOneLocを提案する。
OneLocは、優れたオフラインおよびオンラインパフォーマンスを達成する。
OneLocはKuaishou Appのローカルライフサービスにデプロイされている。
- 参考スコア(独自算出の注目度): 35.04182485277291
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Local life service is a vital scenario in Kuaishou App, where video recommendation is intrinsically linked with store's location information. Thus, recommendation in our scenario is challenging because we should take into account user's interest and real-time location at the same time. In the face of such complex scenarios, end-to-end generative recommendation has emerged as a new paradigm, such as OneRec in the short video scenario, OneSug in the search scenario, and EGA in the advertising scenario. However, in local life service, an end-to-end generative recommendation model has not yet been developed as there are some key challenges to be solved. The first challenge is how to make full use of geographic information. The second challenge is how to balance multiple objectives, including user interests, the distance between user and stores, and some other business objectives. To address the challenges, we propose OneLoc. Specifically, we leverage geographic information from different perspectives: (1) geo-aware semantic ID incorporates both video and geographic information for tokenization, (2) geo-aware self-attention in the encoder leverages both video location similarity and user's real-time location, and (3) neighbor-aware prompt captures rich context information surrounding users for generation. To balance multiple objectives, we use reinforcement learning and propose two reward functions, i.e., geographic reward and GMV reward. With the above design, OneLoc achieves outstanding offline and online performance. In fact, OneLoc has been deployed in local life service of Kuaishou App. It serves 400 million active users daily, achieving 21.016% and 17.891% improvements in terms of gross merchandise value (GMV) and orders numbers.
- Abstract(参考訳): ローカルライフサービスは、ビデオレコメンデーションが店の位置情報と本質的に関連付けられているクアイシャ州アプリにおいて、重要なシナリオである。
したがって、ユーザの興味とリアルタイムな位置情報を同時に考慮し、シナリオでのレコメンデーションは困難である。
このような複雑なシナリオに直面して、ショートビデオシナリオのOneRec、検索シナリオのOneSug、広告シナリオのEGAなど、新しいパラダイムとしてエンドツーエンド生成レコメンデーションが登場した。
しかし, 地域生活サービスにおいては, 解決すべき課題がいくつかあるため, エンド・ツー・エンドのジェネレーティブ・レコメンデーション・モデルがまだ開発されていない。
最初の課題は、地理的情報をフル活用する方法です。
第2の課題は,ユーザ関心やユーザとストア間の距離,その他のビジネス目標など,複数の目標のバランスを取る方法だ。
課題に対処するため,我々はOneLocを提案する。
具体的には,(1)ジオ・アウェア・セマンティックIDはトークン化のためのビデオ情報と地理的情報の両方を取り込み,(2)エンコーダ内のジオ・アウェア・セルフアテンションはビデオ位置類似性とユーザのリアルタイム位置情報の両方を活用する。
複数の目的のバランスをとるために、強化学習を用い、地理的報酬とGMV報酬という2つの報酬関数を提案する。
上記の設計により、OneLocは優れたオフラインおよびオンラインのパフォーマンスを達成する。
実際、OneLocはKuaishou Appのローカルライフサービスにデプロイされている。
毎日4億人のアクティブユーザーが利用しており、総商品価値(GMV)と注文数において21.016%と17.891%の改善を達成している。
関連論文リスト
- MomentSeeker: A Task-Oriented Benchmark For Long-Video Moment Retrieval [61.414236415351446]
長ビデオモーメント検索(LMVR)のための新しいベンチマークであるMomentSeekerを提案する。
MomentSeekerは、長く多様なビデオに基づいて作られ、平均1200秒以上持続する。
グローバルレベル、イベントレベル、オブジェクトレベル、アクション認識、オブジェクトローカライゼーション、因果推論といった一般的なタスクをカバーする。
論文 参考訳(メタデータ) (2025-02-18T05:50:23Z) - GEOBench-VLM: Benchmarking Vision-Language Models for Geospatial Tasks [84.86699025256705]
本稿では,地理空間的タスクの視覚言語モデル(VLM)を評価するためのベンチマークであるGEOBench-VLMを提案する。
私たちのベンチマークでは、手動で検証された命令が1万以上あり、さまざまな視覚条件、オブジェクトタイプ、スケールにまたがっています。
地理空間固有の課題における性能を評価するために,いくつかの最先端のVLMを評価した。
論文 参考訳(メタデータ) (2024-11-28T18:59:56Z) - Granular Privacy Control for Geolocation with Vision Language Models [36.3455665044992]
GPTGeoChatと呼ばれる新しいベンチマークを開発し、ユーザとの位置情報対話を適度に行うビジョン言語モデルの能力をテストする。
我々は,室内アノテータとGPT-4v間の1,000の画像位置情報の会話を収集する。
位置情報が多すぎるかどうかを判断することで,GPT-4vの位置情報会話を適度に行う様々なVLMの能力を評価する。
論文 参考訳(メタデータ) (2024-07-06T04:06:55Z) - GOMAA-Geo: GOal Modality Agnostic Active Geo-localization [49.599465495973654]
エージェントが空中ナビゲーション中に観測された一連の視覚的手がかりを用いて、複数の可能なモダリティによって特定されたターゲットを見つけるという、アクティブなジオローカライゼーション(AGL)の課題を考察する。
GOMAA-Geo は、ゴールモダリティ間のゼロショット一般化のためのゴールモダリティアクティブなジオローカライゼーションエージェントである。
論文 参考訳(メタデータ) (2024-06-04T02:59:36Z) - Location-Aware Visual Question Generation with Lightweight Models [21.278164764804536]
この研究は、位置認識型視覚質問生成(LocaVQG)という新しいタスクを導入している。
我々は、周囲の画像とGPS座標を用いて、そのような位置認識情報を表現している。
我々はLocaVQGタスクに対処し、携帯電話などのエッジデバイスに適合する軽量モデルを学ぶ。
論文 参考訳(メタデータ) (2023-10-23T17:33:31Z) - Memory efficient location recommendation through proximity-aware
representation [8.505840656442217]
逐次レコメンデーション(PASR:Sequential Recommendation)のための近接認識型領域表現を提案する。
本稿では,重要サンプリングを用いた新たな損失関数を用いて,最適化時の情報的負のサンプルを強調することで,疎結合問題に対処する。
3つの実世界位置ベースソーシャルネットワーキング(LBSN)データセットを用いて評価を行い,PASRが最先端の逐次位置推薦手法を上回ることを示した。
論文 参考訳(メタデータ) (2023-10-10T09:53:07Z) - Geo-Encoder: A Chunk-Argument Bi-Encoder Framework for Chinese
Geographic Re-Ranking [61.60169764507917]
中国の地理的再ランクタスクは、検索された候補者の中で最も関連性の高い住所を見つけることを目的としている。
そこで我々は,中国語の地理的意味論をより効果的に統合する,革新的なフレームワークであるGeo-Encoderを提案する。
論文 参考訳(メタデータ) (2023-09-04T13:44:50Z) - PG$^2$Net: Personalized and Group Preferences Guided Network for Next
Place Prediction [6.276895823979034]
訪問先を予測することは、人間の移動行動の鍵となる。
我々は、パーソナライズされたグループ選好ガイドネットワーク(PG$2$Net)というエンドツーエンドフレームワークを提案する。
論文 参考訳(メタデータ) (2021-10-15T07:02:41Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。