論文の概要: Simulated Contextual Bandits for Personalization Tasks from
Recommendation Datasets
- arxiv url: http://arxiv.org/abs/2210.10631v1
- Date: Wed, 12 Oct 2022 21:53:15 GMT
- ステータス: 処理完了
- システム内更新日: 2022-10-23 20:18:14.986762
- Title: Simulated Contextual Bandits for Personalization Tasks from
Recommendation Datasets
- Title(参考訳): レコメンデーションデータセットからのパーソナライズタスクのためのシミュレートされたコンテキストバンディット
- Authors: Anton Dereventsov and Anton Bibin
- Abstract要約: そこで本稿では,MovieLens, Netflix, Last.fm, Million Songなどのレコメンデーションデータセットから, パーソナライズタスクのためのシミュレートされたコンテキスト帯域環境を生成する手法を提案する。
これにより、実生活データに基づいてパーソナライズ環境を開発し、現実のユーザインタラクションの微妙な性質を反映することができる。
- 参考スコア(独自算出の注目度): 0.0
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: We propose a method for generating simulated contextual bandit environments
for personalization tasks from recommendation datasets like MovieLens, Netflix,
Last.fm, Million Song, etc. This allows for personalization environments to be
developed based on real-life data to reflect the nuanced nature of real-world
user interactions. The obtained environments can be used to develop methods for
solving personalization tasks, algorithm benchmarking, model simulation, and
more. We demonstrate our approach with numerical examples on MovieLens and IMDb
datasets.
- Abstract(参考訳): 本研究では,映画レンズ,netflix, last.fm, million songなどのレコメンデーションデータセットからパーソナライズタスクのための文脈的バンディット環境をシミュレートする手法を提案する。
これにより、実生活データに基づいてパーソナライズ環境を開発し、現実のユーザインタラクションの微妙な性質を反映することができる。
得られた環境は、パーソナライズタスク、アルゴリズムベンチマーク、モデルシミュレーションなどを解決する方法の開発に利用できる。
我々は,movielens と imdb データセットの数値例を用いて本手法を実証する。
関連論文リスト
- CERES: Critical-Event Reconstruction via Temporal Scene Graph Completion [7.542220697870245]
本稿では,実世界のデータに基づくシミュレーションにおけるオンデマンドシナリオ生成手法を提案する。
実世界のデータセットから得られたシナリオをシミュレーションに統合することにより、テストの妥当性と妥当性を高める。
論文 参考訳(メタデータ) (2024-10-17T13:02:06Z) - Flex: End-to-End Text-Instructed Visual Navigation with Foundation Models [59.892436892964376]
本稿では,視覚に基づく制御ポリシを用いて,ロバストな閉ループ性能を実現するために必要な最小限のデータ要件とアーキテクチャ適応について検討する。
この知見はFlex (Fly-lexically) で合成され,VLM(Vision Language Models) をフリーズしたパッチワイド特徴抽出器として利用するフレームワークである。
本研究では,本手法が4段階のフライ・トゥ・ターゲットタスクにおいて有効であることを示す。
論文 参考訳(メタデータ) (2024-10-16T19:59:31Z) - Zero-shot Imitation Policy via Search in Demonstration Dataset [0.16817021284806563]
行動クローンは、ポリシーを学ぶためにデモのデータセットを使用する。
本稿では,事前学習した基礎モデルの潜在空間を用いて,実演データセットをインデックス化することを提案する。
提案手法は,マインクラフト環境において,有意義なデモンストレーションを効果的に再現し,エージェントの人間的行動を示す。
論文 参考訳(メタデータ) (2024-01-29T18:38:29Z) - ALP: Action-Aware Embodied Learning for Perception [60.64801970249279]
認知のための行動認識型身体学習(ALP)について紹介する。
ALPは、強化学習ポリシーと逆ダイナミクス予測目標を最適化することにより、行動情報を表現学習に組み込む。
ALPは、複数の下流認識タスクにおいて、既存のベースラインよりも優れていることを示す。
論文 参考訳(メタデータ) (2023-06-16T21:51:04Z) - Federated Privacy-preserving Collaborative Filtering for On-Device Next
App Prediction [52.16923290335873]
本稿では,モバイルデバイス使用時の次のアプリの起動を予測するための新しいSeqMFモデルを提案する。
古典行列分解モデルの構造を修正し、学習手順を逐次学習に更新する。
提案手法のもうひとつの要素は,ユーザからリモートサーバへの送信データの保護を保証する,新たなプライバシメカニズムである。
論文 参考訳(メタデータ) (2023-02-05T10:29:57Z) - Neural-Sim: Learning to Generate Training Data with NeRF [31.81496344354997]
本稿では,ニューラルレージアンスフィールド(NeRF)を対象アプリケーションの損失関数を持つ閉ループに使用した,最初の完全微分可能な合成データパイプラインを提案する。
提案手法は,人的負担を伴わないオンデマンドでデータを生成し,目標タスクの精度を最大化する。
論文 参考訳(メタデータ) (2022-07-22T22:48:33Z) - Synthetic Data-Based Simulators for Recommender Systems: A Survey [55.60116686945561]
本調査は,モデリングとシミュレーションの分野における最近のトレンドを包括的に概観することを目的としている。
まずは、シミュレーターを実装するフレームワークの開発の背後にあるモチベーションから始めます。
我々は,既存のシミュレータの機能,近似,産業的有効性に基づいて,新しい一貫した一貫した分類を行う。
論文 参考訳(メタデータ) (2022-06-22T19:33:21Z) - Task2Sim : Towards Effective Pre-training and Transfer from Synthetic
Data [74.66568380558172]
本稿では,グラフィックスシミュレータから下流タスクへの合成データに基づく事前学習モデルの転送可能性について検討する。
本稿では、最適なシミュレーションパラメータに対する下流タスク表現を統一したモデルマッピングであるTask2Simを紹介する。
このマッピングはトレーニングによって学習し、"見える"タスクのセットで最適なパラメータのセットを見つける。
トレーニングが完了すると、ワンショットで新しい"見えない"タスクの最適なシミュレーションパラメータを予測するために使用することができる。
論文 参考訳(メタデータ) (2021-11-30T19:25:27Z) - Domain Curiosity: Learning Efficient Data Collection Strategies for
Domain Adaptation [16.539422751949797]
ドメインキュリオシティ — データの提供に明示的に最適化された探索的ポリシのトレーニング方法です。
ほとんどの好奇心のある方法とは対照的に、私たちのアプローチは学習に明示的に報いるため、環境騒音に対して堅牢です。
提案手法は,提案手法によって収集された環境動態について,モデルがどの程度学習できるかを比較することで評価する。
論文 参考訳(メタデータ) (2021-03-12T12:02:11Z) - A User's Guide to Calibrating Robotics Simulators [54.85241102329546]
本稿では,シミュレーションで学習したモデルやポリシーを現実世界に伝達することを目的とした,様々なアルゴリズムの研究のためのベンチマークとフレームワークを提案する。
我々は、様々なアルゴリズムの性能に関する洞察を特徴付け、提供するために、広く知られたシミュレーション環境の実験を行う。
我々の分析は、この分野の実践者にとって有用であり、sim-to-realアルゴリズムの動作と主特性について、より深い選択をすることができる。
論文 参考訳(メタデータ) (2020-11-17T22:24:26Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。