Fugu-MT 論文翻訳(概要): Player Modeling via Multi-Armed Bandits

論文の概要: Player Modeling via Multi-Armed Bandits

arxiv url: http://arxiv.org/abs/2102.05264v1
Date: Wed, 10 Feb 2021 05:04:45 GMT
ステータス: 翻訳完了
システム内更新日: 2021-02-11 14:48:06.296038
Title: Player Modeling via Multi-Armed Bandits
Title（参考訳）: マルチアーマッドバンドを用いたプレイヤーモデリング
Authors: Robert C. Gray, Jichen Zhu, Dannielle Arigo, Evan Forman and Santiago Onta\~n\'on
Abstract要約: マルチアームバンディット(MAB)に基づく新しいプレイヤーモデリング手法を提案する。本研究では,ユーザ研究におけるデータ生成に先立って,これらのアルゴリズムの評価と微調整を行うアプローチを提案する。
参考スコア（独自算出の注目度）: 6.64975374754221
License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
Abstract: This paper focuses on building personalized player models solely from player behavior in the context of adaptive games. We present two main contributions: The first is a novel approach to player modeling based on multi-armed bandits (MABs). This approach addresses, at the same time and in a principled way, both the problem of collecting data to model the characteristics of interest for the current player and the problem of adapting the interactive experience based on this model. Second, we present an approach to evaluating and fine-tuning these algorithms prior to generating data in a user study. This is an important problem, because conducting user studies is an expensive and labor-intensive process; therefore, an ability to evaluate the algorithms beforehand can save a significant amount of resources. We evaluate our approach in the context of modeling players' social comparison orientation (SCO) and present empirical results from both simulations and real players.
Abstract（参考訳）: 本稿では,アダプティブゲームにおけるプレイヤー行動のみからパーソナライズされたプレイヤーモデルを構築することに焦点を当てる。 1つ目は、マルチアームバンド(mabs)に基づくプレイヤーモデリングに対する新しいアプローチです。このアプローチは,現在のプレーヤの関心特性をモデル化するためにデータ収集の問題と,このモデルに基づいてインタラクティブなエクスペリエンスを適用する問題の両方を同時にかつ原則的に解決する。第2に,ユーザ調査でデータを生成する前に,これらのアルゴリズムを評価し,微調整する手法を提案する。ユーザ研究は費用がかかり、労働集約的なプロセスであるため、事前にアルゴリズムを評価する能力は大量のリソースを節約できるため、これは重要な問題である。我々は,プレイヤーの社会的比較傾向(SCO)をモデル化し,シミュレーションと実プレイヤーの両方から経験的な結果を示す。

関連論文リスト

Evaluating Language Models' Evaluations of Games [65.49017696754825]
我々は,AIシステムのゲーム評価を評価する新しいパラダイムを提唱する。私たちは100ドル以上の新しいボードゲームと450以上の人間の判断の大規模なデータセットを活用しています。本結果から,推論モデルは,非推論言語モデルよりもゲーム評価において,一般に人々と一致していることが示唆された。
論文参考訳（メタデータ） (2025-10-13T02:45:37Z)
Intention-Conditioned Flow Occupancy Models [69.79049994662591]
大規模な事前学習は、今日の機械学習研究のやり方を根本的に変えた。同じフレームワークを強化学習に適用することは、RLの中核的な課題に対処するための魅力的な方法を提供するので、魅力的です。生成AIの最近の進歩は、高度に複雑な分布をモデリングするための新しいツールを提供している。
論文参考訳（メタデータ） (2025-06-10T15:27:46Z)
Slow Thinking for Sequential Recommendation [88.46598279655575]
本稿では,STREAM-Recという新しいスローシンキングレコメンデーションモデルを提案する。弊社のアプローチは、過去のユーザの振る舞いを分析し、多段階の熟考的推論プロセスを生成し、パーソナライズされたレコメンデーションを提供する。具体的には,(1)レコメンデーションシステムにおける適切な推論パターンを特定すること,(2)従来のレコメンデーションシステムの推論能力を効果的に刺激する方法を検討すること,の2つの課題に焦点を当てる。
論文参考訳（メタデータ） (2025-04-13T15:53:30Z)
Enhancing LLM Reasoning via Critique Models with Test-Time and Training-Time Supervision [120.40788744292739]
本稿では、推論と批判モデルの役割を分離する2人プレイヤパラダイムを提案する。まず、批判データを収集する自動化およびスケーラブルなフレームワークであるAutoMathCritiqueを提案する。テスト時間における難解なクエリに対するアクターのパフォーマンスを,批判モデルが一貫して改善することが実証された。
論文参考訳（メタデータ） (2024-11-25T17:11:54Z)
Collaborative-Enhanced Prediction of Spending on Newly Downloaded Mobile Games under Consumption Uncertainty [49.431361908465036]
ラベルのばらつきと極端性を緩和する頑健なモデルトレーニングと評価フレームワークを提案する。本フレームワークでは,ユーザIDに頼ることなく,ユーザのゲーム支出を予測するための協調型モデルを提案する。当社のアプローチは、オフラインデータに対する注目すべき textbf17.11% の強化を実現し、プロダクションモデルよりも顕著に改善されていることを示す。
論文参考訳（メタデータ） (2024-04-12T07:47:02Z)
Difficulty Modelling in Mobile Puzzle Games: An Empirical Study on Different Methods to Combine Player Analytics and Simulated Data [0.0]
一般的なプラクティスは、プレイヤーとコンテンツとのインタラクションによって収集されたデータからメトリクスを作成することです。これにより、コンテンツがリリースされた後にのみ見積が可能であり、将来のプレイヤーの特徴を考慮しない。本稿では,そのような条件下での難易度推定の潜在的な解を多数提示する。
論文参考訳（メタデータ） (2024-01-30T20:51:42Z)
Secrets of RLHF in Large Language Models Part II: Reward Modeling [134.97964938009588]
本稿では,データセットにおける不正確で曖昧な嗜好の影響を軽減するために,一連の新しい手法を紹介する。また、選択された応答と拒否された応答を区別する報酬モデルの有用性を高めるために、対照的な学習を導入する。
論文参考訳（メタデータ） (2024-01-11T17:56:59Z)
Has Your Pretrained Model Improved? A Multi-head Posterior Based Approach [25.927323251675386]
我々は、世界的知識の源として各エンティティに関連するメタ機能を活用し、モデルからエンティティ表現を採用する。本稿では,これらの表現とメタ機能との整合性を,事前学習モデルの評価指標として用いることを提案する。提案手法の有効性は,関係データセットを用いたモデル,大規模言語モデル,画像モデルなど,様々な領域で実証されている。
論文参考訳（メタデータ） (2024-01-02T17:08:26Z)
Are Neural Topic Models Broken? [81.15470302729638]
トピックモデルの自動評価と人的評価の関係について検討する。ニューラルトピックモデルは、確立された古典的手法と比較して、両方の点においてより悪くなる。
論文参考訳（メタデータ） (2022-10-28T14:38:50Z)
Multi-Modal Experience Inspired AI Creation [33.34566822058209]
シーケンシャルなマルチモーダル情報に基づいてテキストを生成する方法について検討する。まず,マルチモーダルアテンションネットワークを備えたマルチチャネルシーケンス・ツー・シーケンスアーキテクチャを設計する。次に、逐次入力に適したカリキュラム負サンプリング戦略を提案する。
論文参考訳（メタデータ） (2022-09-02T11:50:41Z)
On Modality Bias Recognition and Reduction [70.69194431713825]
マルチモーダル分類の文脈におけるモダリティバイアス問題について検討する。本稿では,各ラベルの特徴空間を適応的に学習するプラグアンドプレイ損失関数法を提案する。本手法は, ベースラインに比べ, 顕著な性能向上を実現している。
論文参考訳（メタデータ） (2022-02-25T13:47:09Z)
Towards Action Model Learning for Player Modeling [1.9659095632676098]
プレイヤーモデリングは、ゲームにおけるプレイヤーの振る舞いを正確に近似する計算モデルを作ろうとする。ほとんどのプレイヤーモデリング技術はドメイン知識に依存しており、ゲーム間で転送できない。本稿では,アクションモデル学習(AML)を用いて,ドメインに依存しない方法でプレーヤモデルを学習する。
論文参考訳（メタデータ） (2021-03-09T19:32:30Z)
Data-driven Koopman Operators for Model-based Shared Control of Human-Machine Systems [66.65503164312705]
本稿では,データ駆動型共有制御アルゴリズムを提案する。ユーザのインタラクションに関するダイナミクスと情報は、Koopman演算子を使用して観察から学習される。モデルに基づく共有制御は、自然な学習やユーザのみの制御パラダイムと比較して、タスクとコントロールのメトリクスを著しく改善する。
論文参考訳（メタデータ） (2020-06-12T14:14:07Z)
Sample-Efficient Model-based Actor-Critic for an Interactive Dialogue Task [27.896714528986855]
対話型対話タスクのためのモデルに基づく強化学習を提案する。一般的なアクター批判的手法に基づいて構築し、学習エージェントに学習を促す環境モデルとプランナーを追加します。この結果から,対話型タスクを模倣したシミュレーションでは,一般的なモデルフリーアルゴリズムのベースラインに比べて,70倍のサンプルを必要とすることがわかった。
論文参考訳（メタデータ） (2020-04-28T17:00:59Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。