論文の概要: Adversarial Neural Trip Recommendation
- arxiv url: http://arxiv.org/abs/2109.11731v1
- Date: Fri, 24 Sep 2021 03:57:25 GMT
- ステータス: 処理完了
- システム内更新日: 2021-09-27 14:08:47.708890
- Title: Adversarial Neural Trip Recommendation
- Title(参考訳): 対人神経トリップ勧告
- Authors: Linlang Jiang, Jingbo Zhou, Tong Xu, Yanyan Li, Hao Chen, Jizhou
Huang, Hui Xiong
- Abstract要約: 本稿では,これらの課題に対処するための適応型ニューラルトリップ勧告フレームワークを提案する。
まず,POI間の相関関係を学習できる新しいアテンションベースのエンコーダデコーダトリップジェネレータを考案する。
ANTの別の新しい特徴は、高品質な旅行を誘導するために、強化学習と統合された敵対的な学習戦略に依存している。
- 参考スコア(独自算出の注目度): 35.70265509185104
- License: http://creativecommons.org/licenses/by-nc-nd/4.0/
- Abstract: Trip recommender system, which targets at recommending a trip consisting of
several ordered Points of Interest (POIs), has long been treated as an
important application for many location-based services. Currently, most prior
arts generate trips following pre-defined objectives based on constraint
programming, which may fail to reflect the complex latent patterns hidden in
the human mobility data. And most of these methods are usually difficult to
respond in real time when the number of POIs is large. To that end, we propose
an Adversarial Neural Trip Recommendation (ANT) framework to tackle the above
challenges. First of all, we devise a novel attention-based encoder-decoder
trip generator that can learn the correlations among POIs and generate
well-designed trips under given constraints. Another novelty of ANT relies on
an adversarial learning strategy integrating with reinforcement learning to
guide the trip generator to produce high-quality trips. For this purpose, we
introduce a discriminator, which distinguishes the generated trips from
real-life trips taken by users, to provide reward signals to optimize the
generator. Moreover, we devise a novel pre-train schema based on learning from
demonstration, which speeds up the convergence to achieve a
sufficient-and-efficient training process. Extensive experiments on four
real-world datasets validate the effectiveness and efficiency of our proposed
ANT framework, which demonstrates that ANT could remarkably outperform the
state-of-the-art baselines with short response time.
- Abstract(参考訳): trip recommenderシステムは、複数の注文ポイント(pois)からなる旅行を推奨するシステムであり、多くのロケーションベースのサービスにとって重要なアプリケーションとして扱われてきた。
現在、ほとんどの先行技術は、制約プログラミングに基づいた事前定義された目標に従ってトリップを生成しており、人間の移動データに隠された複雑な潜在パターンを反映していない可能性がある。
そして、これらのメソッドのほとんどは、poisの数が大きければ、リアルタイムに応答するのが困難である。
そこで本稿では,これらの課題に対処するためのANT(Adversarial Neural Trip Recommendation)フレームワークを提案する。
まず、新しい注意に基づくエンコーダデコーダトリップジェネレータを考案し、POI間の相関関係を学習し、与えられた制約の下で適切に設計されたトリップを生成する。
ANTの別の新しい特徴は、高品質な旅行を誘導するために、強化学習と統合された敵対的な学習戦略に依存している。
この目的のために,生成したトリップとユーザの実生活トリップを区別する判別器を導入し,ジェネレータを最適化するための報奨信号を提供する。
さらに,実演からの学習に基づく新しい事前学習スキーマを考案し,コンバージェンスを高速化し,十分な効率のトレーニングプロセスを実現する。
4つの実世界のデータセットに対する大規模な実験により提案したANTフレームワークの有効性と効率が検証された。
関連論文リスト
- OTO Planner: An Efficient Only Travelling Once Exploration Planner for Complex and Unknown Environments [6.128246045267511]
オンリートラベル・ワン・プランナー」は複雑な環境下で繰り返し経路を減少させる効率的な探索プランナーである。
高速フロンティア更新、視点評価、視点改善が含まれる。
探査時間と移動距離を10%から20%削減し、フロンティア検出の速度を6~9倍向上させる。
論文 参考訳(メタデータ) (2024-06-11T14:23:48Z) - Short vs. Long-term Coordination of Drones: When Distributed Optimization Meets Deep Reinforcement Learning [0.9208007322096532]
自律型対話型ドローンの群れは、交通監視などスマートシティのアプリケーションに魅力的なセンシング機能を提供する。
本稿では,ドローン群による大規模時空間センシングにおけるタスク割り当て問題に焦点をあてる。
長期DRLと短期集団学習を統合した新しい相乗的最適化手法を提案する。
論文 参考訳(メタデータ) (2023-11-16T12:28:31Z) - Learning-Initialized Trajectory Planning in Unknown Environments [4.2960463890487555]
未知の環境での自律飛行の計画には、空間軌道と時間軌道の両方を正確に計画する必要がある。
本稿ではニューラルdトラジェクトリ・プランナーを用いて最適化を導く新しい手法を提案する。
遅延計画に対する耐性を持って、堅牢なオンラインリプランニングをサポートするフレームワークを提案する。
論文 参考訳(メタデータ) (2023-09-19T15:07:26Z) - Optimizing Group Utility in Itinerary Planning: A Strategic and
Crowd-Aware Approach [6.1392189155269925]
反復レコメンデーションは、多くの現実世界の応用において複雑なシーケンス予測問題である。
既存のソリューションは通常、一人称視点に焦点を合わせ、自然の群衆の振る舞いによる現実の問題に対処できない。
実環境におけるグループユーティリティを最適化するStrategic and CrowdAware Itinerary Recommendation (SCAIR)アルゴリズムを導入する。
論文 参考訳(メタデータ) (2023-04-04T10:04:43Z) - Long-HOT: A Modular Hierarchical Approach for Long-Horizon Object
Transport [83.06265788137443]
我々は、時間的拡張ナビゲーションのための新しいオブジェクトトランスポートタスクと新しいモジュラーフレームワークを提案することで、長距離探査と航法を具現化する上で重要な課題に対処する。
私たちの最初の貢献は、深層探査と長期計画に焦点を当てた新しいLong-HOT環境の設計である。
重み付けされたフロンティアの助けを借りて探索を行うために,シーンのトポロジカルグラフを構築するモジュラー階層輸送ポリシー(HTP)を提案する。
論文 参考訳(メタデータ) (2022-10-28T05:30:49Z) - SURF: Semi-supervised Reward Learning with Data Augmentation for
Feedback-efficient Preference-based Reinforcement Learning [168.89470249446023]
我々は、大量のラベルなしサンプルとデータ拡張を利用する半教師付き報酬学習フレームワークSURFを提案する。
報奨学習にラベルのないサンプルを活用するために,選好予測器の信頼性に基づいてラベルのないサンプルの擬似ラベルを推定する。
本実験は, ロボット操作作業における嗜好に基づく手法のフィードバック効率を有意に向上させることを実証した。
論文 参考訳(メタデータ) (2022-03-18T16:50:38Z) - DeepAltTrip: Top-k Alternative Itineraries for Trip Recommendation [4.727697892741763]
本稿では,DeepAltTripというディープラーニングベースのフレームワークを提案する。
経路生成のステップでは,多様なユーザ定義制約をシームレスに処理できる新しいサンプリングアルゴリズムを提案する。
論文 参考訳(メタデータ) (2021-09-08T10:36:59Z) - Self-Supervised Reinforcement Learning for Recommender Systems [77.38665506495553]
逐次リコメンデーションタスクのための自己指導型強化学習を提案する。
提案手法は,2つの出力層を持つ標準レコメンデーションモデルを強化する。
このようなアプローチに基づいて、自己監督型Q-ラーニング(SQN)と自己監督型アクター・クライブ(SAC)という2つのフレームワークを提案する。
論文 参考訳(メタデータ) (2020-06-10T11:18:57Z) - Sequential Recommendation with Self-Attentive Multi-Adversarial Network [101.25533520688654]
逐次レコメンデーションにおける文脈情報の影響を明示的にモデル化するためのMFGAN(Multi-Factor Generative Adversarial Network)を提案する。
当社のフレームワークは,複数種類の因子情報を組み込むことが柔軟であり,各因子が推奨決定にどのように貢献するかを時間とともに追跡することができる。
論文 参考訳(メタデータ) (2020-05-21T12:28:59Z) - Sequential Recommender via Time-aware Attentive Memory Network [67.26862011527986]
本稿では,注意機構と繰り返し単位を改善するための時間ゲーティング手法を提案する。
また,長期と短期の嗜好を統合するマルチホップ・タイムアウェア・アテンテーティブ・メモリ・ネットワークを提案する。
提案手法は,候補探索タスクに対してスケーラブルであり,ドット積に基づくTop-Kレコメンデーションのための潜在因数分解の非線形一般化とみなすことができる。
論文 参考訳(メタデータ) (2020-05-18T11:29:38Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。