論文の概要: Discovering User Types: Mapping User Traits by Task-Specific Behaviors
in Reinforcement Learning
- arxiv url: http://arxiv.org/abs/2307.08169v1
- Date: Sun, 16 Jul 2023 22:41:17 GMT
- ステータス: 処理完了
- システム内更新日: 2023-07-18 15:13:14.633991
- Title: Discovering User Types: Mapping User Traits by Task-Specific Behaviors
in Reinforcement Learning
- Title(参考訳): ユーザタイプの発見:強化学習におけるタスク特化行動によるユーザ特性のマッピング
- Authors: L. L. Ankile, B. S. Ham, K. Mao, E. Shin, S. Swaroop, F. Doshi-Velez,
W. Pan
- Abstract要約: ユーザ行動(政治クラス)とユーザ特性の関係について検討する。
ユーザタイプ」のブレークダウンを研究するための直感的なツールを提案する。
同じ同値クラス内の環境間で介入設計を転送することで、介入を迅速にパーソナライズすることができる。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: When assisting human users in reinforcement learning (RL), we can represent
users as RL agents and study key parameters, called \emph{user traits}, to
inform intervention design. We study the relationship between user behaviors
(policy classes) and user traits. Given an environment, we introduce an
intuitive tool for studying the breakdown of "user types": broad sets of traits
that result in the same behavior. We show that seemingly different real-world
environments admit the same set of user types and formalize this observation as
an equivalence relation defined on environments. By transferring intervention
design between environments within the same equivalence class, we can help
rapidly personalize interventions.
- Abstract(参考訳): 強化学習(RL)におけるユーザ支援では,ユーザをRLエージェントとして表現し,‘emph{user traits} と呼ばれる重要なパラメータを学習して介入設計を通知することができる。
ユーザ行動(政治クラス)とユーザ特性の関係について検討する。
環境が与えられた場合、私たちは"ユーザタイプ"の崩壊を研究するための直感的なツールを紹介します。
一見して異なる実世界の環境は同一のユーザタイプを認め、この観察を環境上で定義された同値関係として定式化する。
同じ等価クラス内の環境間で介入設計を転送することで、介入を迅速にパーソナライズすることができる。
関連論文リスト
- Visual-Geometric Collaborative Guidance for Affordance Learning [63.038406948791454]
本稿では,視覚的・幾何学的手がかりを取り入れた視覚・幾何学的協調学習ネットワークを提案する。
本手法は,客観的指標と視覚的品質の代表的なモデルより優れている。
論文 参考訳(メタデータ) (2024-10-15T07:35:51Z) - Modeling User Preferences via Brain-Computer Interfacing [54.3727087164445]
我々はBrain-Computer Interface技術を用いてユーザの好みを推測し、その注意力は視覚的コンテンツと感情的体験との関連性に相関する。
我々はこれらを,情報検索,生成モデルのパーソナライズされたステアリング,感情経験のクラウドソーシング人口推定など,関連するアプリケーションにリンクする。
論文 参考訳(メタデータ) (2024-05-15T20:41:46Z) - Invariant Causal Imitation Learning for Generalizable Policies [87.51882102248395]
Invariant Causal Learning (ICIL) を提案する。
ICILはノイズ変数の特定の表現から切り離された因果的特徴の表現を学習する。
ICILは、目に見えない環境に一般化可能な模倣ポリシーの学習に有効であることを示す。
論文 参考訳(メタデータ) (2023-11-02T16:52:36Z) - What User Behaviors Make the Differences During the Process of Visual
Analytics? [1.5285292154680246]
本研究では,ユーザ行動の包括的データ収集と時系列分類手法を用いた分析手法を提案する。
ユーザスタディでは,デスクトップと没入型2種類の可視化システムを用いて,多様な可視化タスクのユーザ行動を収集している。
この結果から,視覚分析の過程でユーザ行動の区別が可能であり,ユーザの身体行動とそれらが実行する可視化タスクとの間には強い関連性があることが判明した。
論文 参考訳(メタデータ) (2023-11-01T17:45:52Z) - SIRL: Similarity-based Implicit Representation Learning [44.71701661851492]
ユーザに対して,同じような振る舞いを問うことで,表現をチューニングできることが示される。
これにより、ロボットは、表現に進む必要のあるものと、刺激的なものとをあいまいにすることができる。
論文 参考訳(メタデータ) (2023-01-02T18:59:59Z) - Homomorphism Autoencoder -- Learning Group Structured Representations from Observed Transitions [51.71245032890532]
本研究では,世界に作用するエージェントが,それを修飾する動作と整合した感覚情報の内部表現を学習できるようにする手法を提案する。
既存の作業とは対照的に、我々のアプローチはグループの事前の知識を必要とせず、エージェントが実行可能なアクションのセットを制限しない。
論文 参考訳(メタデータ) (2022-07-25T11:22:48Z) - Relation-aware Heterogeneous Graph for User Profiling [24.076585294260816]
本稿では,ユーザ・プロファイリングにおける関係性を考慮した異種グラフ手法を提案する。
我々は、不均一なメッセージパッシングに対して、トランスフォーマー方式でクエリ、キー、値のメカニズムを採用する。
実世界の2つのeコマースデータセットの実験を行い、我々のアプローチの大幅なパフォーマンス向上を観察する。
論文 参考訳(メタデータ) (2021-10-14T06:59:30Z) - Knowledge-Enhanced Hierarchical Graph Transformer Network for
Multi-Behavior Recommendation [56.12499090935242]
本研究では,ユーザとレコメンデータシステムにおける項目間の多種類の対話パターンを探索する知識強化階層型グラフトランスフォーマネットワーク(KHGT)を提案する。
KHGTはグラフ構造化ニューラルネットワーク上に構築され、タイプ固有の振る舞い特性をキャプチャする。
KHGTは、様々な評価設定において、最先端のレコメンデーション手法よりも一貫して優れていることを示す。
論文 参考訳(メタデータ) (2021-10-08T09:44:00Z) - Learner to learner fuzzy profiles similarity using a hybrid interaction
analysis grid [0.0]
本研究は,半構造化同期通信ツールを用いて,学習者間の対話と協調の適切な環境を確立することを目的とする。
ファジィ論理を適用することで、人間の推論を形式化し、それを使う推論に非常に優れた柔軟性を与える。
教育データマイニング技術は,ErosとPCAを用いた類似性に基づくクラスタリングにより,学習者のプロファイルに対する行動のマッピングを最適化するために使用される。
論文 参考訳(メタデータ) (2021-10-01T08:01:41Z) - Hyper Meta-Path Contrastive Learning for Multi-Behavior Recommendation [61.114580368455236]
マルチビヘイビア情報によるユーザ購入予測は、現在のレコメンデーションシステムでは難しい問題である。
本稿では,ハイパーメタパスやハイパーメタグラフを構築するためのハイパーメタパスの概念を提案する。
最近のグラフコントラスト学習の成功により、異なる振る舞い間の依存関係を理解するために固定されたスキームを割り当てるのではなく、ユーザ行動パターンの埋め込みを適応的に学習する。
論文 参考訳(メタデータ) (2021-09-07T04:28:09Z) - A Framework to Counteract Suboptimal User-Behaviors in Exploratory
Learning Environments: an Application to MOOCs [1.1421942894219896]
ログ化されたインタラクションデータを使用して、どの行動パターンやアクティビティパターンをトリガーするかを学習する、データ駆動型ユーザモデリングフレームワークに重点を置いています。
本稿では,このフレームワークを探索環境の一形態であるMOOC(Massive Open Online Courses)に適用する。
論文 参考訳(メタデータ) (2021-06-14T16:16:33Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。