論文の概要: Generative Spatiotemporal Intent Sequence Recommendation via Implicit Reasoning in Amap
- arxiv url: http://arxiv.org/abs/2605.28888v1
- Date: Wed, 27 May 2026 07:27:32 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-05-30 00:00:30.927856
- Title: Generative Spatiotemporal Intent Sequence Recommendation via Implicit Reasoning in Amap
- Title(参考訳): Amapにおけるインプシット推論による時空間インテントシーケンス推薦
- Authors: Sicong Wang, Ruiting Dong, Yue Liu, Bowen Zheng, Jun Meng, Jie Li, Shuaijun Guo, Yu Gu, Fanyi Di, Xin Li,
- Abstract要約: 実際のユーザの振る舞いは、多くの場合、分離されたアクションで構成され、代わりに、応答性依存性によって管理されるインテントフローを形成する。
本稿では,複雑な状況下で物理的に整合的に実行可能である意図列を生成することを目的とした生成時シーケンス勧告(GSISR)の課題に焦点をあてる。
本稿では,LLM推論を2つのコンポーネントを通して軽量モデルに内部化する生成フレームワークGPlanを提案する。
- 参考スコア(独自算出の注目度): 13.548870367532752
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Real-world user behavior rarely consists of isolated actions; instead, it often forms intent flows governed by spatiotemporal dependencies. To provide integrated service recommendations, we focus on the task of Generative Spatiotemporal Intent Sequence Recommendation (GSISR), which aims to generate intent sequences that are logically coherent and physically executable within complex spatiotemporal contexts. While LLMs offer strong reasoning potential for GSISR, direct industrial deployment is limited by high inference latency and context-mismatched or physically infeasible plans. To address these challenges, we propose a generative framework, GPlan, that internalizes LLM reasoning into lightweight models through two components. First, to enable reasoning under strict latency constraints, we introduce Progressive Implicit CoT Distillation, which compresses explicit reasoning processes into reserved latent tokens, allowing small models to inherit complex planning logic without generating long reasoning text. Second, to address the disconnect between general knowledge and real-world constraints, we design Spatiotemporal Counterfactual DPO. By aligning the model with counterfactual context-plan pairs, we improve sensitivity to spatiotemporal context and reduce context-mismatched plans. Offline experiments and online A/B testing demonstrate that our approach improves sequence coherence and context responsiveness. Our implementation and the anonymized GSISR dataset are available at https://github.com/alibaba/GPlan.
- Abstract(参考訳): 現実のユーザの振る舞いは、しばしば孤立したアクションで構成され、代わりに、時空間依存によって管理されるインテントフローを形成する。
統合されたサービスレコメンデーションを提供するために、複雑な時空間コンテキスト内で論理的に一貫性があり物理的に実行可能な意図列を生成することを目的とした、時空間固有シーケンス勧告(GSISR)のタスクに焦点を当てる。
LLMはGSISRに強力な推論能力を提供するが、直接の産業展開は高い推論遅延とコンテキストミスまたは物理的に実現不可能な計画によって制限される。
これらの課題に対処するために,LLM推論を2つのコンポーネントを通して軽量モデルに内部化する生成フレームワークGPlanを提案する。
まず、厳密な遅延制約下での推論を可能にするために、プログレッシブインプリシットCoT蒸留を導入する。これは、明示的な推論プロセスを予約された潜在トークンに圧縮し、小さなモデルで長い推論テキストを生成することなく複雑な計画ロジックを継承することを可能にする。
第2に,一般知識と実世界の制約の切り離しに対処するため,時空間DPOを設計する。
モデルと対実的コンテキスト計画ペアを整合させることで、時空間に対する感度を改善し、文脈ミスマッチした計画を減らす。
オフライン実験とオンラインA/Bテストは、我々のアプローチがシーケンスコヒーレンスとコンテキスト応答性を改善することを示す。
我々の実装と匿名化GSISRデータセットはhttps://github.com/alibaba/GPlan.comで公開されています。
関連論文リスト
- LaST-R1: Reinforcing Robotic Manipulation via Adaptive Physical Latent Reasoning [90.86828952599147]
提案するLaST-R1(LaST-R1)は,「最近の推論・行動」政策を活用するために設計された,新しい強化学習フレームワークである。
LaST-R1 は LIBERO ベンチマークで 99.9% の平均成功率を達成した。
実世界の展開では、LaST-R1はSOTAが監督する微調整アプローチよりも22.5%平均的に改善されている。
論文 参考訳(メタデータ) (2026-04-30T17:59:52Z) - DAG-STL: A Hierarchical Framework for Zero-Shot Trajectory Planning under Signal Temporal Logic Specifications [7.389002274709231]
タスクに依存しない軌道データのみを用いて,未知の動的条件下でのオフラインSTL計画について検討する。
DAG-STLは長期STL計画を3段階に変換する階層的なフレームワークである。
Maze2D、OGBench AntMaze、Cubeドメインでの実験により、DAG-STLは直接ロバスト性誘導拡散を著しく上回ることが示された。
論文 参考訳(メタデータ) (2026-04-20T14:41:37Z) - SGA-MCTS: Decoupling Planning from Execution via Training-Free Atomic Experience Retrieval [74.1918709002557]
我々は, LLM計画を非パラメトリック検索として活用するフレームワークである textbfSGA-MCTS を紹介する。
オンラインでは、検索増強剤は、関連するステート-ゴール-アクション原子を取得するために、ハイブリッドシンボリック-セマンティック機構を使用する。
SGA-MCTSは、探索の重い計算コストを効果的に減らし、System 1推論速度におけるシステム2推論の深さを達成し、スケーラブルかつリアルタイムに自律的な計画が実現可能である。
論文 参考訳(メタデータ) (2026-04-16T07:22:36Z) - Agentic Spatio-Temporal Grounding via Collaborative Reasoning [80.83158605034465]
時間的ビデオグラウンド(Temporal Video Grounding)は、テキストクエリが与えられたビデオ内の対象物または人の時間的チューブを検索することを目的としている。
本稿では,STVGの課題に対して,オープンワールドおよびトレーニングフリーシナリオに向けたエージェント時空間グラウンド(ASTG)フレームワークを提案する。
具体的には、現代多言語モデル(MLLM)を活用した2つの特殊エージェントSRA(Spatial Reasoning Agent)とTRA(Temporal Reasoning Agent)である。
人気のあるベンチマークの実験は、既存の弱教師付きおよびゼロショットアプローチをマージンで上回る提案手法の優位性を実証している。
論文 参考訳(メタデータ) (2026-02-10T10:16:27Z) - V-CAGE: Context-Aware Generation and Verification for Scalable Long-Horizon Embodied Tasks [6.820118518027692]
V-CAGEは、大規模なセマンティックアライメントデータセットを生成するクローズドループフレームワークである。
本研究では,シーン合成における幾何学的整合性を実現する文脈認識型インスタンス化機構を提案する。
また、階層的な命令分解モジュールを用いて、抽象意図と低レベル制御のギャップを埋める。
論文 参考訳(メタデータ) (2026-01-21T16:41:51Z) - OxygenREC: An Instruction-Following Generative Framework for E-commerce Recommendation [19.602480244527182]
我々は、Fast-Slow Thinkingを活用する産業レコメンデーションシステムであるOxygenRECを紹介し、厳密なレイテンシとマルチシナリオ要件による深い推論を実現する。
Instruction-Guided Retrieval (IGR) を用いた意味的アライメント機構を導入する。
我々はシナリオ情報を統一報酬マッピングとソフトアダプティブグループクリップポリシー最適化を用いて制御可能な命令に変換する。
論文 参考訳(メタデータ) (2025-12-26T21:13:59Z) - Subgoal Graph-Augmented Planning for LLM-Guided Open-World Reinforcement Learning [0.0]
大規模言語モデル(LLM)は強化学習に強力な高レベル計画機能を提供する。
LLMは、セマンティックに妥当なサブゴールを生成するが、ターゲット環境では不可能または無関係である。
LLMの計画は自己検証と融合し、自信過剰で信頼性の低いサブゴールとなる。
論文 参考訳(メタデータ) (2025-11-26T02:49:44Z) - CSGO: Generalized Optimization for Cold Start in Wireless Collaborative Edge LLM Systems [62.24576366776727]
本稿では,全体の推論遅延を最小限に抑えるために,遅延を考慮したスケジューリングフレームワークを提案する。
提案手法は,ベースライン戦略と比較して,コールドスタート遅延を著しく低減することを示す。
論文 参考訳(メタデータ) (2025-08-15T07:49:22Z) - Entropy-Regularized Token-Level Policy Optimization for Language Agent Reinforcement [67.1393112206885]
大規模言語モデル(LLM)は、対話的な意思決定タスクにおいてインテリジェントなエージェントとして期待されている。
本稿では,トークンレベルでのLLMの最適化に適したエントロピー拡張RL法である,エントロピー正規化トークンレベル最適化(ETPO)を導入する。
我々は,データサイエンスコード生成を多段階対話型タスクのシリーズとしてモデル化したシミュレーション環境におけるETPOの有効性を評価する。
論文 参考訳(メタデータ) (2024-02-09T07:45:26Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。