Fugu-MT 論文翻訳(概要): Adapting User Interfaces with Model-based Reinforcement Learning

論文の概要: Adapting User Interfaces with Model-based Reinforcement Learning

arxiv url: http://arxiv.org/abs/2103.06807v1
Date: Thu, 11 Mar 2021 17:24:34 GMT
ステータス: 翻訳完了
システム内更新日: 2021-03-12 14:40:30.866281
Title: Adapting User Interfaces with Model-based Reinforcement Learning
Title（参考訳）: モデルベース強化学習によるユーザインタフェースの適応
Authors: Kashyap Todi, Gilles Bailly, Luis A. Leiva, Antti Oulasvirta
Abstract要約: インターフェースへの適応には、変更がユーザに与えるポジティブな効果とネガティブな効果の両方を考慮する必要があります。保守的な適応政策をもたらす適応的ユーザインターフェースの新たなアプローチを提案する。
参考スコア（独自算出の注目度）: 47.469980921522115
License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
Abstract: Adapting an interface requires taking into account both the positive and negative effects that changes may have on the user. A carelessly picked adaptation may impose high costs to the user -- for example, due to surprise or relearning effort -- or "trap" the process to a suboptimal design immaturely. However, effects on users are hard to predict as they depend on factors that are latent and evolve over the course of interaction. We propose a novel approach for adaptive user interfaces that yields a conservative adaptation policy: It finds beneficial changes when there are such and avoids changes when there are none. Our model-based reinforcement learning method plans sequences of adaptations and consults predictive HCI models to estimate their effects. We present empirical and simulation results from the case of adaptive menus, showing that the method outperforms both a non-adaptive and a frequency-based policy.
Abstract（参考訳）: インターフェースへの適応には、変更がユーザに与えるポジティブな効果とネガティブな効果の両方を考慮する必要があります。不注意に選択された適応は、例えば、サプライズや再学習の努力のために、ユーザに高いコストを課すか、未熟な部分最適化設計にプロセスを"トラップ"する。しかし、ユーザーへの影響は、相互作用の過程で遅滞し、進化する要因に依存するため、予測することは困難です。保守的な適応政策をもたらす適応的ユーザインターフェースの新たなアプローチを提案する。モデルに基づく強化学習手法は適応の順序を計画し,予測hciモデルを用いてその効果を推定する。本稿では,適応メニューを用いた経験的,シミュレーション的な結果から,非適応性と周波数ベースのポリシーの両方に優れることを示す。

関連論文リスト

One Adapts to Any: Meta Reward Modeling for Personalized LLM Alignment [55.86333374784959]
これらの制約に対処するには、データの適合からユーザの好みを学習し、嗜好適応のプロセスを学ぶためのパラダイムシフトが必要である、と我々は主張する。メタ学習問題としてパーソナライズされた報酬モデルを変更するメタリワードモデリング(MRM)を提案する。 MRMはパーソナライズを強化し、ユーザの堅牢性を向上し、ベースラインを一貫して上回ることを示す。
論文参考訳（メタデータ） (2026-01-26T17:55:52Z)
Fints: Efficient Inference-Time Personalization for LLMs with Fine-Grained Instance-Tailored Steering [49.212940215720884]
本稿では,ユーザデータからサンプルレベルの干渉を生成し,モデルの前方通過に注入してパーソナライズするステアリングフレームワークを提案する。本手法は,対話モードやコンテキスト長の異なる環境において,ロバスト性を保ちながら,高速シフト環境におけるパーソナライズ性能を著しく向上させる。
論文参考訳（メタデータ） (2025-10-31T06:01:04Z)
Pre-training for Recommendation Unlearning [14.514770044236375]
UnlearnRecはモデルに依存しない事前学習パラダイムであり、効率的な未学習操作のためのシステムを準備している。本手法は,再学習手法に比べて10倍以上の高速化を実現した。
論文参考訳（メタデータ） (2025-05-28T17:57:11Z)
Integrating Human Feedback into a Reinforcement Learning-Based Framework for Adaptive User Interfaces [0.0]
強化学習(Reinforcement Learning, RL)は、複雑でシーケンシャルな適応課題に対処するための有望なアプローチとして登場した。 RLベースの適応ユーザインタフェース適応フレームワークを,個人化されたフィードバックをリーンプロセスに直接組み込むことで拡張する。当社のアプローチでは、各ユーザに対して独自のRLエージェントをトレーニングし、個人が自身のRLエージェントのポリシーを積極的に形成できるようにする。
論文参考訳（メタデータ） (2025-04-29T14:00:22Z)
Adaptive Conformal Inference by Betting [51.272991377903274]
データ生成プロセスについて仮定することなく適応型共形推論の問題を考察する。適応型共形推論のための既存のアプローチは、オンライン勾配勾配の変種を用いたピンボール損失の最適化に基づいている。本稿では,パラメータフリーなオンライン凸最適化手法を利用した適応型共形推論手法を提案する。
論文参考訳（メタデータ） (2024-12-26T18:42:08Z)
Reinforcement Learning-Based Framework for the Intelligent Adaptation of User Interfaces [0.0]
ユーザのニーズや好みを満たすために、ソフトウェアシステムのユーザインターフェース(UI)を適用するのは、複雑な作業です。機械学習(ML)技術の最近の進歩は、適応プロセスを支援する効果的な手段を提供するかもしれない。本稿では,Reinforcement Learning (RL) をMLコンポーネントとして,インテリジェントユーザインタフェース適応のための参照フレームワークをインスタンス化する。
論文参考訳（メタデータ） (2024-05-15T11:14:33Z)
Learning from Interaction: User Interface Adaptation using Reinforcement Learning [0.0]
この論文では、生理的データを用いたRLベースのUI適応フレームワークを提案する。このフレームワークは、ユーザインタラクションから学び、ユーザエクスペリエンス(UX)を改善するための情報適応を実現することを目的としている。
論文参考訳（メタデータ） (2023-12-12T12:29:18Z)
AdaptSSR: Pre-training User Model with Augmentation-Adaptive Self-Supervised Ranking [19.1857792382924]
本稿では,Augmentation-Supervised Ranking (AdaptSSR)を提案する。我々は、暗黙的に拡張されたビュー、明示的な拡張されたビュー、および他のユーザからのビューの類似性の順序をキャプチャするために、ユーザモデルを訓練する複数のペアランキング損失を採用する。 6つの下流タスクを持つパブリックデータセットとインダストリアルデータセットの実験は、AdaptSSRの有効性を検証する。
論文参考訳（メタデータ） (2023-10-15T02:19:28Z)
A Comparative Study on Reward Models for UI Adaptation with Reinforcement Learning [0.6899744489931015]
強化学習は、使用状況ごとにインターフェイスをパーソナライズするために使用することができる。それぞれのアダプティブの報酬を決定することは、UIアダプティブに対するRLの課題である。最近の研究では、この課題に対処するための報酬モデルの使用について検討されているが、このタイプのモデルに関する実証的な証拠はない。
論文参考訳（メタデータ） (2023-08-26T18:31:16Z)
Latent User Intent Modeling for Sequential Recommenders [92.66888409973495]
逐次リコメンデータモデルは、プラットフォーム上での氏のインタラクション履歴に基づいて、ユーザが次に対話する可能性のあるアイテムを予測することを学習する。しかし、ほとんどのシーケンシャルなレコメンデータは、ユーザの意図に対する高いレベルの理解を欠いている。したがって、インテントモデリングはユーザー理解と長期ユーザーエクスペリエンスの最適化に不可欠である。
論文参考訳（メタデータ） (2022-11-17T19:00:24Z)
Computational Adaptation of XR Interfaces Through Interaction Simulation [4.6193503399184275]
本稿では,ユーザエクスペリエンスとパフォーマンスの向上を目的として,XRインタフェースを適応するための計算手法について論じる。メニュー選択タスクに適用した新しいモデルでは,認知的コストと運動的コストの両方を考慮してユーザインタラクションをシミュレートする。
論文参考訳（メタデータ） (2022-04-19T23:37:07Z)
Generative Adversarial Reward Learning for Generalized Behavior Tendency Inference [71.11416263370823]
ユーザの行動嗜好モデルのための生成的逆強化学習を提案する。我々のモデルは,差別的アクター批判ネットワークとWasserstein GANに基づいて,ユーザの行動から報酬を自動的に学習することができる。
論文参考訳（メタデータ） (2021-05-03T13:14:25Z)
Adaptive Inertia: Disentangling the Effects of Adaptive Learning Rate and Momentum [97.84312669132716]
我々は,アダム力学の適応学習率とモメンタムがサドルポイントエスケープおよびフラットミニマ選択に与える影響を解消する。提案手法は,SGD法や従来の適応勾配法よりも大幅に一般化可能であることを示す。
論文参考訳（メタデータ） (2020-06-29T05:21:02Z)
Learning Compliance Adaptation in Contact-Rich Manipulation [81.40695846555955]
本稿では,コンタクトリッチタスクに必要な力プロファイルの予測モデルを学習するための新しいアプローチを提案する。このアプローチは、双方向Gated Recurrent Units (Bi-GRU) に基づく異常検出と適応力/インピーダンス制御を組み合わせたものである。
論文参考訳（メタデータ） (2020-05-01T05:23:34Z)
Logarithmic Regret Bound in Partially Observable Linear Dynamical Systems [91.43582419264763]
部分的に観測可能な線形力学系におけるシステム同定と適応制御の問題について検討する。開ループ系と閉ループ系の両方において有限時間保証付きの最初のモデル推定法を提案する。 AdaptOnは、未知の部分観測可能な線形力学系の適応制御において、$textpolylogleft(Tright)$ regretを達成する最初のアルゴリズムであることを示す。
論文参考訳（メタデータ） (2020-03-25T06:00:33Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。