論文の概要: ProfiLLM: Utility-Aligned Agentic User Profiling for Industrial Ride-Hailing Dispatch
- arxiv url: http://arxiv.org/abs/2606.18803v1
- Date: Wed, 17 Jun 2026 08:15:07 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-06-18 17:16:51.064115
- Title: ProfiLLM: Utility-Aligned Agentic User Profiling for Industrial Ride-Hailing Dispatch
- Title(参考訳): ProfiLLM: 産業用配車用エージェントユーザプロファイリング
- Authors: Tengfei Lyu, Zirui Yuan, Xu Liu, Kai Wan, Zihao Lu, Li Ma, Hao Liu,
- Abstract要約: ProfiLLMは2つのモジュールを通して本番システム用のユーティリティ・アライン・ユーザー・プロファイリングを運用する。
再利用可能なグローバル知識、アダプティブなユーザクラスタリングルール、リージョンレベルのサプライ需要前処理を生成する。
結果予測におけるAUCの相対的な改善は+6.14%、ディスパッチシミュレーションでは+4.35%に達する。
- 参考スコア(独自算出の注目度): 20.2442673472594
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Bringing Large Language Models (LLMs) into industrial ride-hailing dispatch as semantic feature extractors over platform-scale behavioral logs is a compelling but under-explored data systems problem. Production matching pipelines remain dominated by structured numerical features, yet decisive behavioral signals (e.g., a driver's habitual aversion to certain regions) are inherently contextual and naturally expressible as LLM-generated user profiles. However, scaling such profiling to a live, millisecond-latency dispatcher faces three intertwined constraints rarely addressed together: on a platform with millions of daily orders, logs exceed any LLM's context window by orders of magnitude; most users are long-tail, with too few interactions for per-user profiling; and surface-fluent profiles do not necessarily improve downstream prediction utility. We present ProfiLLM, an agentic LLM data pipeline that operationalizes utility-aligned user profiling for production matching systems through two modules. (1) Tool-Augmented Global Knowledge Mining equips an LLM agent with 27 analytical tools to mine platform-scale data, producing reusable global knowledge, adaptive user clustering rules, and region-level supply-demand priors. (2) Utility-Aligned Profile Exploration generates multiple candidate profiles per cluster, evaluates them via a lightweight downstream utility proxy, iteratively refines the best candidates and constructs preference pairs for DPO fine-tuning. Deployed on DiDi's production dispatcher, ProfiLLM achieves up to +6.14% relative AUC improvement in outcome prediction, up to +4.35% GMV gain in dispatching simulation, and consistent improvements in a 14-day online A/B test including +0.47% GMV, +0.33% Completion Rate, and -0.82% Cancel-Before-Accept rate.
- Abstract(参考訳): 大規模言語モデル(LLM)を産業配車サービスに導入することで、プラットフォームスケールの行動ログよりもセマンティックな特徴抽出を行うことが可能になる。
生産マッチングパイプラインは、構造化された数値的特徴によって支配されるが、決定的な行動信号(例えば、運転者の特定の領域への習慣的回避)は、本質的に文脈的であり、LLM生成したユーザプロファイルとして自然に表現可能である。
しかし、このようなプロファイリングを生のミリ秒レイテンシディスパッチにスケールすることは、数百万の日次注文を持つプラットフォームでは、ログはLLMのコンテキストウインドウを桁違いに上回る。
ProfiLLMは,2つのモジュールを介し,実運用システム用のユーティリティ整合型ユーザプロファイリングを運用するエージェントLLMデータパイプラインである。
1) ツール強化グローバル知識マイニングは,プラットフォーム規模のデータをマイニングし,再利用可能なグローバル知識,適応的ユーザクラスタリングルール,地域レベルの需給先物を生成するための27種類の分析ツールを備えたLLMエージェントを装備する。
2) ユーザビリティに配慮したプロファイル探索では,クラスタ毎に複数の候補プロファイルを生成し,軽量なダウンストリームユーティリティプロキシを通じて評価し,最適な候補を反復的に洗練し,DPO微調整のための選好ペアを構築する。
DiDiのプロダクションディスパッチ上に展開されたProfiLLMは、結果予測におけるAUCの相対的な改善を+6.14%、ディスパッチシミュレーションにおける最大4.35%のGMVゲイン、および+0.47%のGMV、+0.33%のコンプリートレート、-0.82%のCancel-Before-Acceptレートを含む14日間のオンラインA/Bテストにおける一貫した改善を達成している。
関連論文リスト
- Chimera: Latency- and Performance-Aware Multi-agent Serving for Heterogeneous LLMs [62.17306142810532]
ヘテロジニアスLSMクラスタ上で動作するマルチエージェントワークフローの予測スケジューリングシステムであるChimeraを提案する。
Chimeは最高のレイテンシをトレースし、エンドツーエンドのレイテンシを1.2-2.4$times$で削減し、タスクパフォーマンスを平均8.0-9.5ポイント改善する。
論文 参考訳(メタデータ) (2026-03-23T17:01:42Z) - Synthetic Interaction Data for Scalable Personalization in Large Language Models [67.31884245564086]
本稿ではPersonaGymという高忠実な合成データ生成フレームワークを紹介する。
パーソナライゼーションを静的なペルソナ-参照ペアとして扱う以前の作業とは異なり、PersonaGymは動的な選好プロセスをモデル化する。
我々は,高忠実度マルチターンパーソナライズされたインタラクショントラジェクトリの大規模かつ高品質で多様な合成データセットであるPersonaAtlasをリリースする。
論文 参考訳(メタデータ) (2026-02-12T20:41:22Z) - Diagnostic-Guided Dynamic Profile Optimization for LLM-based User Simulators in Sequential Recommendation [15.61963892566877]
DGDPOは動的かつ反復的な最適化プロセスを通じてユーザプロファイルを構築する新しいフレームワークである。
シングルラウンドインタラクションに限定された既存のLCMベースのユーザシミュレータとは異なり、DGDPOをシーケンシャルレコメンデータと統合するのは初めてです。
論文 参考訳(メタデータ) (2025-08-18T06:17:59Z) - PROMPTEVALS: A Dataset of Assertions and Guardrails for Custom Production Large Language Model Pipelines [0.8148009849453334]
大規模言語モデル(LLM)は、さまざまなドメインにまたがる特殊な実運用データ処理パイプラインに、ますます多くデプロイされている。
これらのアプリケーションの信頼性を向上させるためには、パイプラインと一緒に動作するLCM出力のアサーションやガードレールを作成することが不可欠である。
本稿では,2087のパイプラインプロンプトのデータセットであるPrompTEVALSについて,12623のアサーション基準で紹介する。
論文 参考訳(メタデータ) (2025-04-20T21:04:23Z) - Know Me, Respond to Me: Benchmarking LLMs for Dynamic User Profiling and Personalized Responses at Scale [53.059480071818136]
大規模言語モデル(LLM)は、幅広いタスクでユーザのためのパーソナライズされたアシスタントとして登場した。
PERSONAMEMは180以上のユーザ-LLMインタラクション履歴を持つキュレートされたユーザプロファイルを備えている。
LLMチャットボットのユーザプロファイルの現在状況に応じて,最も適切な応答を識別する能力を評価する。
論文 参考訳(メタデータ) (2025-04-19T08:16:10Z) - PersonaX: A Recommendation Agent Oriented User Modeling Framework for Long Behavior Sequence [8.557534799079956]
PersonaX はエージェントに依存しない LLM-UM フレームワークであり、これらの課題に対処する。
より優れたレコメンデーションパフォーマンスと推論効率を達成するために、下流のレコメンデーションエージェントを拡張する。
論文 参考訳(メタデータ) (2025-03-04T08:41:40Z) - Prompt Tuning as User Inherent Profile Inference Machine [68.16976932088708]
本稿では,ユーザプロファイルの推測にプロンプトチューニングを用いるUserIP-Tuningを提案する。
UserIP-Tuningは最先端のレコメンデーションアルゴリズムより優れている。
提案されたソリューションは2025年5月からHuawei AppGalleryのExploreページにデプロイされている。
論文 参考訳(メタデータ) (2024-08-13T02:25:46Z) - Self-Augmented Preference Optimization: Off-Policy Paradigms for Language Model Alignment [104.18002641195442]
既存のペアデータを必要としない、効果的でスケーラブルなトレーニングパラダイムである自己拡張型優先度最適化(SAPO)を導入する。
負の反応を自律的に生成するセルフプレイの概念に基づいて、我々はさらに、データ探索とエクスプロイトを強化するために、非政治的な学習パイプラインを組み込む。
論文 参考訳(メタデータ) (2024-05-31T14:21:04Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。