論文の概要: Robot Behavior Personalization from Sparse User Feedback
- arxiv url: http://arxiv.org/abs/2410.19219v1
- Date: Fri, 25 Oct 2024 00:08:38 GMT
- ステータス: 翻訳完了
- システム内更新日: 2024-10-28 13:36:00.336135
- Title: Robot Behavior Personalization from Sparse User Feedback
- Title(参考訳): スパースフィードバックによるロボット行動のパーソナライズ
- Authors: Maithili Patel, Sonia Chernova,
- Abstract要約: 抽象概念(TAACo)フレームワークを用いたタスク適応を作成する。
TAACoは、任意のタスクでユーザの望ましい支援方法を予測することができる。
予測精度において,TAACoはGPT-4の16%,ルールベースシステムでは54%を上回った。
- 参考スコア(独自算出の注目度): 7.51373397483077
- License:
- Abstract: As service robots become more general-purpose, they will need to adapt to their users' preferences over a large set of all possible tasks that they can perform. This includes preferences regarding which actions the users prefer to delegate to robots as opposed to doing themselves. Existing personalization approaches require task-specific data for each user. To handle diversity across all household tasks and users, and nuances in user preferences across tasks, we propose to learn a task adaptation function independently, which can be used in tandem with any universal robot policy to customize robot behavior. We create Task Adaptation using Abstract Concepts (TAACo) framework. TAACo can learn to predict the user's preferred manner of assistance with any given task, by mediating reasoning through a representation composed of abstract concepts built based on user feedback. TAACo can generalize to an open set of household tasks from small amount of user feedback and explain its inferences through intuitive concepts. We evaluate our model on a dataset we collected of 5 people's preferences, and show that TAACo outperforms GPT-4 by 16% and a rule-based system by 54%, on prediction accuracy, with 40 samples of user feedback.
- Abstract(参考訳): サービスロボットがより汎用的になると、実行可能なすべてのタスクの大規模なセットよりも、ユーザの好みに適応する必要がある。
これには、ユーザが自分自身ではなく、どのアクションをロボットに委譲するかという好みが含まれる。
既存のパーソナライズアプローチでは、各ユーザごとにタスク固有のデータが必要である。
そこで本研究では,ロボットの動作をカスタマイズするための汎用的なロボットポリシーと組み合わせて,タスク適応関数を独立して学習することを提案する。
抽象概念(TAACo)フレームワークを用いたタスク適応を作成する。
TAACoは、ユーザのフィードバックに基づいて構築された抽象概念からなる表現を通して推論を仲介することにより、任意のタスクでユーザの望ましい支援方法を予測することができる。
TAACoは、少数のユーザフィードバックから、オープンな家庭用タスクセットに一般化し、直感的な概念を通じて推論を説明することができる。
我々は,5人の嗜好を収集したデータセットを用いてモデルを評価し,TAACoがGPT-4の16%,ルールベースシステムが54%,ユーザのフィードバックの40サンプルで予測精度に優れていたことを示す。
関連論文リスト
- Improving User Experience in Preference-Based Optimization of Reward Functions for Assistive Robots [5.523009758632668]
CMA-ES-IGは、ユーザの嗜好学習プロセスの経験を優先することを示す。
我々は,本アルゴリズムが,身体的,社会的なロボット作業にまたがる従来のアプローチよりも直感的であることを示す。
論文 参考訳(メタデータ) (2024-11-17T21:52:58Z) - DegustaBot: Zero-Shot Visual Preference Estimation for Personalized Multi-Object Rearrangement [53.86523017756224]
本稿では,視覚的嗜好学習のためのアルゴリズムであるDegustaBotを提案する。
我々は、シミュレーション表設定タスクにおいて、自然主義的個人的嗜好の大規模なデータセットを収集する。
私たちのモデルの予測の50%は、少なくとも20%の人々に受け入れられる可能性が高いことが分かりました。
論文 参考訳(メタデータ) (2024-07-11T21:28:02Z) - Enhancing Supermarket Robot Interaction: A Multi-Level LLM Conversational Interface for Handling Diverse Customer Intents [46.623273455512106]
本稿では,スーパーマーケットロボットのためのマルチレベルLLMインタフェースの設計と評価について述べる。
本手法を, GPT-4 Turbo を用いた特殊な GPT モデルと比較する。
パフォーマンス,ユーザ満足度,ユーザエージェントパートナーシップ,自己イメージ向上の4分野において,統計的に有意な改善が見られた。
論文 参考訳(メタデータ) (2024-06-16T19:13:01Z) - Tell Me More! Towards Implicit User Intention Understanding of Language
Model Driven Agents [110.25679611755962]
現在の言語モデル駆動エージェントは、しばしば効果的なユーザ参加のメカニズムを欠いている。
Intention-in-Interaction (IN3) は明示的なクエリを通してユーザの暗黙の意図を検査するための新しいベンチマークである。
私たちは、タスクの曖昧さを積極的に評価し、ユーザの意図を問う強力なモデルであるMistral-Interactを経験的に訓練し、それらを実行可能な目標へと洗練させます。
論文 参考訳(メタデータ) (2024-02-14T14:36:30Z) - Personalized Language Modeling from Personalized Human Feedback [49.344833339240566]
人間のフィードバックからの強化学習(Reinforcement Learning from Human Feedback, RLHF)は、人間の好みに合わせて大きな言語モデルを微調整するために一般的に用いられる。
本研究では,パーソナライズされた言語モデルを構築する手法を開発することにより,この問題に対処することを目的とする。
論文 参考訳(メタデータ) (2024-02-06T04:18:58Z) - Sequence-aware item recommendations for multiply repeated user-item
interactions [0.0]
項目推薦のタスクにおいて時間次元を誘導するレコメンデータシステムを設計する。
推薦を行うために、各ユーザに対するアイテムインタラクションのシーケンスを検討する。
本手法は,小売環境におけるユーザとユーザ間のインタラクションを高精度に予測する試みである。
論文 参考訳(メタデータ) (2023-04-02T17:06:07Z) - Personalizing Task-oriented Dialog Systems via Zero-shot Generalizable
Reward Function [19.652303125864204]
タスク指向対話システムをパーソナライズするための新しいフレームワークであるP-ToDを提案する。
P-ToDは、トレーニング済みのGPT-2をバックボーンモデルとして使用し、3つのフェーズで動作する。
我々の新しい報酬関数は、見当たらないプロファイルであっても生成した応答の質を定量化できる。
論文 参考訳(メタデータ) (2023-03-24T04:33:40Z) - Assisting Human Decisions in Document Matching [52.79491990823573]
我々は,意思決定者のパフォーマンスを向上する支援情報の種類を評価するためのプロキシマッチングタスクを考案した。
ブラックボックスモデルによる説明を提供することで,マッチング作業におけるユーザの精度が低下することが判明した。
一方,タスク固有のデシラタに密接に対応するように設計されたカスタムメソッドは,ユーザのパフォーマンス向上に有効であることが判明した。
論文 参考訳(メタデータ) (2023-02-16T17:45:20Z) - Eliciting User Preferences for Personalized Multi-Objective Decision
Making through Comparative Feedback [76.7007545844273]
目的に対して異なるユーザの好みに対応する多目的意思決定フレームワークを提案する。
我々のモデルは、ベクトル値の報酬関数を持つマルコフ決定プロセスで構成され、各ユーザが未知の選好ベクトルを持つ。
少数の比較クエリを用いて,ユーザに対してほぼ最適なポリシを求めるアルゴリズムを提案する。
論文 参考訳(メタデータ) (2023-02-07T23:58:19Z) - Proactive Detractor Detection Framework Based on Message-Wise Sentiment
Analysis Over Customer Support Interactions [60.87845704495664]
本稿では、チャットベースのカスタマーサポートのインタラクションにのみ依存して、個々のユーザの推薦決定を予測するフレームワークを提案する。
ケーススタディでは、ラテンアメリカの大手電子商取引会社の金融分野における16.4kのユーザ数と48.7kの顧客サポートに関する会話を分析した。
以上の結果から,CS会話のメッセージワイドな感情進化のみに基づいて,ユーザが製品やサービスを推薦する可能性を予測することが可能であることが示唆された。
論文 参考訳(メタデータ) (2022-11-08T00:43:36Z) - Towards Personalized Explanation of Robot Path Planning via User
Feedback [1.7231251035416644]
本稿では,ユーザフィードバックによるロボット経路計画のパーソナライズされた説明を生成するシステムを提案する。
このシステムは、ユーザのインタラクションを通じて、任意の好みの競合を検出し、解決することができる。
論文 参考訳(メタデータ) (2020-11-01T15:10:43Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。