論文の概要: Adapting User Interfaces with Model-based Reinforcement Learning
- arxiv url: http://arxiv.org/abs/2103.06807v1
- Date: Thu, 11 Mar 2021 17:24:34 GMT
- ステータス: 処理完了
- システム内更新日: 2021-03-12 14:40:30.866281
- Title: Adapting User Interfaces with Model-based Reinforcement Learning
- Title(参考訳): モデルベース強化学習によるユーザインタフェースの適応
- Authors: Kashyap Todi, Gilles Bailly, Luis A. Leiva, Antti Oulasvirta
- Abstract要約: インターフェースへの適応には、変更がユーザに与えるポジティブな効果とネガティブな効果の両方を考慮する必要があります。
保守的な適応政策をもたらす適応的ユーザインターフェースの新たなアプローチを提案する。
- 参考スコア(独自算出の注目度): 47.469980921522115
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Adapting an interface requires taking into account both the positive and
negative effects that changes may have on the user. A carelessly picked
adaptation may impose high costs to the user -- for example, due to surprise or
relearning effort -- or "trap" the process to a suboptimal design immaturely.
However, effects on users are hard to predict as they depend on factors that
are latent and evolve over the course of interaction. We propose a novel
approach for adaptive user interfaces that yields a conservative adaptation
policy: It finds beneficial changes when there are such and avoids changes when
there are none. Our model-based reinforcement learning method plans sequences
of adaptations and consults predictive HCI models to estimate their effects. We
present empirical and simulation results from the case of adaptive menus,
showing that the method outperforms both a non-adaptive and a frequency-based
policy.
- Abstract(参考訳): インターフェースへの適応には、変更がユーザに与えるポジティブな効果とネガティブな効果の両方を考慮する必要があります。
不注意に選択された適応は、例えば、サプライズや再学習の努力のために、ユーザに高いコストを課すか、未熟な部分最適化設計にプロセスを"トラップ"する。
しかし、ユーザーへの影響は、相互作用の過程で遅滞し、進化する要因に依存するため、予測することは困難です。
保守的な適応政策をもたらす適応的ユーザインターフェースの新たなアプローチを提案する。
モデルに基づく強化学習手法は適応の順序を計画し,予測hciモデルを用いてその効果を推定する。
本稿では,適応メニューを用いた経験的,シミュレーション的な結果から,非適応性と周波数ベースのポリシーの両方に優れることを示す。
関連論文リスト
- Reinforcement Learning-Based Framework for the Intelligent Adaptation of User Interfaces [0.0]
ユーザのニーズや好みを満たすために、ソフトウェアシステムのユーザインターフェース(UI)を適用するのは、複雑な作業です。
機械学習(ML)技術の最近の進歩は、適応プロセスを支援する効果的な手段を提供するかもしれない。
本稿では,Reinforcement Learning (RL) をMLコンポーネントとして,インテリジェントユーザインタフェース適応のための参照フレームワークをインスタンス化する。
論文 参考訳(メタデータ) (2024-05-15T11:14:33Z) - Learning from Interaction: User Interface Adaptation using Reinforcement
Learning [0.0]
この論文では、生理的データを用いたRLベースのUI適応フレームワークを提案する。
このフレームワークは、ユーザインタラクションから学び、ユーザエクスペリエンス(UX)を改善するための情報適応を実現することを目的としている。
論文 参考訳(メタデータ) (2023-12-12T12:29:18Z) - AdaptSSR: Pre-training User Model with Augmentation-Adaptive
Self-Supervised Ranking [19.1857792382924]
本稿では,Augmentation-Supervised Ranking (AdaptSSR)を提案する。
我々は、暗黙的に拡張されたビュー、明示的な拡張されたビュー、および他のユーザからのビューの類似性の順序をキャプチャするために、ユーザモデルを訓練する複数のペアランキング損失を採用する。
6つの下流タスクを持つパブリックデータセットとインダストリアルデータセットの実験は、AdaptSSRの有効性を検証する。
論文 参考訳(メタデータ) (2023-10-15T02:19:28Z) - A Comparative Study on Reward Models for UI Adaptation with
Reinforcement Learning [0.6899744489931015]
強化学習は、使用状況ごとにインターフェイスをパーソナライズするために使用することができる。
それぞれのアダプティブの報酬を決定することは、UIアダプティブに対するRLの課題である。
最近の研究では、この課題に対処するための報酬モデルの使用について検討されているが、このタイプのモデルに関する実証的な証拠はない。
論文 参考訳(メタデータ) (2023-08-26T18:31:16Z) - Latent User Intent Modeling for Sequential Recommenders [92.66888409973495]
逐次リコメンデータモデルは、プラットフォーム上での氏のインタラクション履歴に基づいて、ユーザが次に対話する可能性のあるアイテムを予測することを学習する。
しかし、ほとんどのシーケンシャルなレコメンデータは、ユーザの意図に対する高いレベルの理解を欠いている。
したがって、インテントモデリングはユーザー理解と長期ユーザーエクスペリエンスの最適化に不可欠である。
論文 参考訳(メタデータ) (2022-11-17T19:00:24Z) - Computational Adaptation of XR Interfaces Through Interaction Simulation [4.6193503399184275]
本稿では,ユーザエクスペリエンスとパフォーマンスの向上を目的として,XRインタフェースを適応するための計算手法について論じる。
メニュー選択タスクに適用した新しいモデルでは,認知的コストと運動的コストの両方を考慮してユーザインタラクションをシミュレートする。
論文 参考訳(メタデータ) (2022-04-19T23:37:07Z) - Generative Adversarial Reward Learning for Generalized Behavior Tendency
Inference [71.11416263370823]
ユーザの行動嗜好モデルのための生成的逆強化学習を提案する。
我々のモデルは,差別的アクター批判ネットワークとWasserstein GANに基づいて,ユーザの行動から報酬を自動的に学習することができる。
論文 参考訳(メタデータ) (2021-05-03T13:14:25Z) - Adaptive Inertia: Disentangling the Effects of Adaptive Learning Rate
and Momentum [97.84312669132716]
我々は,アダム力学の適応学習率とモメンタムがサドルポイントエスケープおよびフラットミニマ選択に与える影響を解消する。
提案手法は,SGD法や従来の適応勾配法よりも大幅に一般化可能であることを示す。
論文 参考訳(メタデータ) (2020-06-29T05:21:02Z) - Learning Compliance Adaptation in Contact-Rich Manipulation [81.40695846555955]
本稿では,コンタクトリッチタスクに必要な力プロファイルの予測モデルを学習するための新しいアプローチを提案する。
このアプローチは、双方向Gated Recurrent Units (Bi-GRU) に基づく異常検出と適応力/インピーダンス制御を組み合わせたものである。
論文 参考訳(メタデータ) (2020-05-01T05:23:34Z) - Logarithmic Regret Bound in Partially Observable Linear Dynamical
Systems [91.43582419264763]
部分的に観測可能な線形力学系におけるシステム同定と適応制御の問題について検討する。
開ループ系と閉ループ系の両方において有限時間保証付きの最初のモデル推定法を提案する。
AdaptOnは、未知の部分観測可能な線形力学系の適応制御において、$textpolylogleft(Tright)$ regretを達成する最初のアルゴリズムであることを示す。
論文 参考訳(メタデータ) (2020-03-25T06:00:33Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。