論文の概要: Agent4POI: Agentic Context-Conditioned Affordance Reasoning for Multimodal Point-of-Interest Recommendation
- arxiv url: http://arxiv.org/abs/2605.15203v1
- Date: Fri, 03 Apr 2026 01:53:05 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-05-25 12:34:33.821453
- Title: Agent4POI: Agentic Context-Conditioned Affordance Reasoning for Multimodal Point-of-Interest Recommendation
- Title(参考訳): Agent4POI:マルチモーダル・ポイント・オブ・インテンシブ・レコメンデーションのためのエージェント・コンテクスト・アフォーマンス・推論
- Authors: Jinze Wang, Yangchen Zeng, Tiehua Zhang, Lu Zhang, Yuze Liu, Yongchao Liu, Xingjun Ma, Zhu Sun,
- Abstract要約: 我々は、コンテクスト条件付きマルチモーダル表現をレコメンデーション時に生成する、最初のPOIレコメンデーションフレームワークであるAgent4POIを紹介する。
Agent4POIは、最強のベースラインに対して23.2%の相対的なゲインを達成し、コンテキストシフトの下でわずか7.5%しか低下しない。
コールドスタートのシナリオでは、Agent4POIは最高のコンテンツベースのベースラインを2.4倍も上回っている。
- 参考スコア(独自算出の注目度): 32.81909871547641
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: We introduce Agent4POI, the first POI recommendation framework that generates context-conditioned multimodal representations at recommendation time, rather than relying on static POI embeddings pre-computed independently of context. Existing multimodal systems encode each POI once as a static embedding, a design that precludes reasoning about why the same cafe affords solo work on Monday but group celebration on Friday evening. We formally prove that no pre-computed encoder can satisfy context-sensitive ranking under standard bilinear scoring, motivating inference-time item-side representation. Agent4POI inverts this computation: given a situational context, a four-phase LLM agent generates dynamic, context-specific affordance queries (Phase 1) and executes a five-step cross-modal chain-of-thought over image, review, and metadata evidence (Phase 2). The resulting uncertainty-aware affordance representation is grounded in Gibsonian affordance theory. These cross-modal verdicts form a structured, uncertainty-adjusted affordance representation (Phase 3), which is aligned with user preferences via a semantic caching system for low-latency ranking (Phase 4). On three POI benchmarks and three evaluation configurations (standard, cold-start, context-shift), Agent4POI achieves a 23.2% relative gain over the strongest baseline and degrades by only 7.5% under context-shift versus 16--17\% for the strongest baselines. In cold-start scenarios, Agent4POI outperforms the best content-based baseline by up to 2.4x, whereas ID-based methods fail to generalize.
- Abstract(参考訳): 我々は,コンテキストに依存しない静的なPOI埋め込みに頼るのではなく,コンテクスト条件付きマルチモーダル表現をレコメンデーション時に生成する,最初のPOIレコメンデーションフレームワークであるAgent4POIを紹介する。
既存のマルチモーダルシステムでは、各POIを静的な埋め込みとしてエンコードしています。
我々は,事前計算したエンコーダが標準双線形スコアリングの下で文脈に敏感なランキングを満足できないことを正式に証明し,推論時項目側表現の動機付けを行う。
エージェント4POIはこの計算を逆転する: 状況に応じて、4段階のLCMエージェントが動的でコンテキスト固有のアベイランスクエリ(Phase 1)を生成し、画像、レビュー、メタデータのエビデンスに対して5段階のクロスモーダルチェーンを実行する(Phase2)。
結果として生じる不確実性を考慮した可測性表現は、ギブソンの可測性理論に基礎を置いている。
これらのクロスモーダルな評定は、低レイテンシランキングのためのセマンティックキャッシングシステム(Phase 4)を介して、ユーザの嗜好と整合した構造化された不確実性調整価格表現(Phase 3)を形成する。
3つのPOIベンチマークと3つの評価設定(標準、コールドスタート、コンテキストシフト)において、Agent4POIは最強のベースラインに対して23.2%の相対的なゲインを獲得し、最強のベースラインに対してコンテキストシフトで7.5%しか低下しない。
コールドスタートのシナリオでは、Agent4POIは最高のコンテンツベースのベースラインを2.4倍上回り、IDベースのメソッドは一般化に失敗する。
関連論文リスト
- Agentic Forecasting using Sequential Bayesian Updating of Linguistic Beliefs [1.7470133607730627]
BLF (Bayesian Linguistic Forecaster) は二進予測のためのエージェントシステムである。
ForecastBenchのリーダーボードからの400のバックテスト質問に対して、BLFはすべての主要な公開メソッドを上回ります。
論文 参考訳(メタデータ) (2026-04-20T17:57:51Z) - Unifying Group-Relative and Self-Distillation Policy Optimization via Sample Routing [79.88256756334327]
自己蒸留政策最適化(SDPO)は、より密集したロジットレベルの監視を提供することによってこの問題に対処する。
サンプル制御ポリシー最適化(SRPO)を提案する。
SRPOは、試料をGRPOの報酬整合強化に向け、サンプルをSDPOの目標ロジットレベルの補正に向ける。
論文 参考訳(メタデータ) (2026-04-02T17:29:18Z) - Coverage Improvement and Fast Convergence of On-policy Preference Learning [67.36750525893514]
言語モデルアライメントのためのオンラインのオンラインプライオリティ学習アルゴリズムは、オフラインのアルゴリズムよりも大幅に優れている。
我々は,サンプリング政策の包括的範囲が政治訓練を通じてどのように進展するかを分析する。
一般機能クラス設定における報奨蒸留のための原則的オンライン方式を開発した。
論文 参考訳(メタデータ) (2026-01-13T10:46:06Z) - Anchoring Values in Temporal and Group Dimensions for Flow Matching Model Alignment [61.80228667422234]
VGPOは時間次元とグループ次元の両方で値の推定を再定義する。
スパース端末の報酬を密度の高いプロセス認識値推定に変換する。
標準群正規化を絶対値によって強化された新しいプロセスに置き換え、安定した最適化信号を維持する。
論文 参考訳(メタデータ) (2025-12-13T16:31:26Z) - Q-BERT4Rec: Quantized Semantic-ID Representation Learning for Multimodal Recommendation [5.699357781063521]
セマンティック表現と量子化モデリングを統合するシーケンシャルレコメンデーションフレームワークであるQ-Bert4Recを提案する。
当社のモデルをパブリックなAmazonベンチマークで検証し、Q-Bert4Recが多くの強力な既存手法よりも優れていることを示す。
ソースコードは公開後、GitHubで公開されます。
論文 参考訳(メタデータ) (2025-12-02T07:06:44Z) - A-IPO: Adaptive Intent-driven Preference Optimization [14.221471110333828]
underlinetextbfAdaptive textbfunderlineIntent-driven textbfunderlinePreference textbfunderlineOptimization (textbfA-IPO)を紹介する。
A-IPOは、各ユーザプロンプトの背後にある潜在意図を推論するインテントモジュールを導入し、この推論意図を報酬関数に明示的に組み込む。
論文 参考訳(メタデータ) (2025-10-11T07:29:11Z) - Eigen-1: Adaptive Multi-Agent Refinement with Monitor-Based RAG for Scientific Reasoning [53.45095336430027]
暗黙的な検索と構造化された協調を組み合わせた統合フレームワークを開発する。
Humanity's Last Exam (HLE) Bio/Chem Goldでは,48.3%の精度を実現している。
SuperGPQAとTRQAの結果はドメイン間の堅牢性を確認した。
論文 参考訳(メタデータ) (2025-09-25T14:05:55Z) - Sem-DPO: Mitigating Semantic Inconsistency in Preference Optimization for Prompt Engineering [5.568436850698628]
Sem-DPOは意味的一貫性を維持しながら、その単純さと効率を維持するDPOの亜種である。
本研究は,Sem-DPOが原文の有界近傍で学習のプロンプトを継続していることを示す。
3つの標準テキスト-画像のプロンプト-最適化ベンチマークと2つの言語モデルにおいて、Sem-DPOはDPOよりもCLIPの類似度が8-12%高く、5-9%高いHPSv2.1、PickScore)。
論文 参考訳(メタデータ) (2025-07-27T05:20:13Z) - Reinforcing Video Reasoning with Focused Thinking [65.85683941058916]
本稿では,集中的思考と深い報酬の粒度で視覚的推論を強化する新しいフレームワークであるTW-GRPOを提案する。
具体的には,高情報密度のトークンを優先するトークン重み付け機構を用いる。
また,シングルチョイスからマルチチョイスQAタスクにシフトすることで,RLトレーニングを再構築する。
論文 参考訳(メタデータ) (2025-05-30T15:42:19Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。