論文の概要: Improving through Interaction: Searching Behavioral Representation Spaces with CMA-ES-IG
- arxiv url: http://arxiv.org/abs/2603.09011v1
- Date: Mon, 09 Mar 2026 23:00:42 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-03-11 15:25:23.890102
- Title: Improving through Interaction: Searching Behavioral Representation Spaces with CMA-ES-IG
- Title(参考訳): インタラクションによる改善:CMA-ES-IGによる行動表現空間の探索
- Authors: Nathaniel Dennler, Zhonghao Shi, Yiran Tao, Andreea Bobu, Stefanos Nikolaidis, Maja Matarić,
- Abstract要約: 本研究では,ロボットの動作のランク付けを通じて,非専門家の好みを学習するための直感的な手法を提案する。
CMA-ES-IGは、ユーザエクスペリエンスの考慮事項を優先学習プロセスに明示的に組み込む。
より高次元の嗜好空間に効果的にスケールし、高次元問題に対する計算的トラクタビリティを維持し、ノイズや一貫性のないユーザフィードバックに対して堅牢である。
- 参考スコア(独自算出の注目度): 9.51762789049331
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Robots that interact with humans must adapt to individual users' preferences to operate effectively in human-centered environments. An intuitive and effective technique to learn non-expert users' preferences is through rankings of robot behaviors, e.g., trajectories, gestures, or voices. Existing techniques primarily focus on generating queries that optimize preference learning outcomes, such as sample efficiency or final preference estimation accuracy. However, the focus on outcome overlooks key user expectations in the process of providing these rankings, which can negatively impact users' adoption of robotic systems. This work proposes the Covariance Matrix Adaptation Evolution Strategies with Information Gain (CMA-ES-IG) algorithm. CMA-ES-IG explicitly incorporates user experience considerations into the preference learning process by suggesting perceptually distinct and informative trajectories for users to rank. We demonstrate these benefits through both simulated studies and real-robot experiments. CMA-ES-IG, compared to state-of-the-art alternatives, (1) scales more effectively to higher-dimensional preference spaces, (2) maintains computational tractability for high-dimensional problems, (3) is robust to noisy or inconsistent user feedback, and (4) is preferred by non-expert users in identifying their preferred robot behaviors. This project's code is available at github.com/interaction-lab/CMA-ES-IG
- Abstract(参考訳): 人間と対話するロボットは、人間中心の環境で効果的に動作するために、個々のユーザの好みに適応する必要がある。
非専門家の好みを学習するための直感的で効果的なテクニックは、ロボットの行動、例えば軌道、ジェスチャー、音声のランク付けである。
既存の手法は主に、サンプル効率や最終選好推定精度などの選好学習結果を最適化するクエリを生成することに重点を置いている。
しかし、これらのランキングの提供プロセスにおいて、成果へのフォーカスは、ユーザのロボットシステム導入に悪影響を及ぼす可能性がある、重要なユーザの期待を覆している。
本研究では,情報ゲインを用いた共分散行列適応進化戦略(CMA-ES-IG)を提案する。
CMA-ES-IGは、ユーザがランク付けする知覚的、情報的軌跡を提示することにより、ユーザー体験の考慮事項を嗜好学習プロセスに明示的に組み込む。
シミュレーション実験と実ロボット実験の両方を通してこれらの利点を実証する。
CMA-ES-IGは、最先端の代替品と比較して、(1)高次元の嗜好空間により効果的にスケールし、(2)高次元問題に対する計算的トラクタビリティを維持し、(3)ノイズや一貫性のないユーザフィードバックに頑健であり、(4)非専門家のロボットの振る舞いを識別するのに好まれる。
このプロジェクトのコードはgithub.com/interaction-lab/CMA-ES-IGで入手できる。
関連論文リスト
- Modeling and Optimizing User Preferences in AI Copilots: A Comprehensive Survey and Taxonomy [5.985777189633703]
AIコパイロは、複雑でコンテキストに富んだタスクでユーザを支援するように設計された、AI駆動システムの新世代を表す。
このパーソナライゼーションの中心は、好みの最適化である。システムの個々のユーザの好みを検出し、解釈し、調整する能力である。
この調査は、AIコパイロにおけるユーザの嗜好がどのように運用されているかを調べる。
論文 参考訳(メタデータ) (2025-05-28T02:52:39Z) - Search-Based Interaction For Conversation Recommendation via Generative Reward Model Based Simulated User [117.82681846559909]
会話レコメンデーションシステム(CRS)は、マルチターンインタラクションを使用してユーザの好みを捉え、パーソナライズされたレコメンデーションを提供する。
本稿では,CRSと自動インタラクションを行うための生成報酬モデルに基づくシミュレーションユーザGRSUを提案する。
論文 参考訳(メタデータ) (2025-04-29T06:37:30Z) - Improving User Experience in Preference-Based Optimization of Reward Functions for Assistive Robots [5.523009758632668]
CMA-ES-IGは、ユーザの嗜好学習プロセスの経験を優先することを示す。
我々は,本アルゴリズムが,身体的,社会的なロボット作業にまたがる従来のアプローチよりも直感的であることを示す。
論文 参考訳(メタデータ) (2024-11-17T21:52:58Z) - Real Evaluations Tractability using Continuous Goal-Directed Actions in
Smart City Applications [3.1158660854608824]
継続的目標指向アクション(CGDA)は、環境から抽出できるあらゆる機能の変更としてアクションをエンコードする。
現在の戦略では、シミュレーションで評価を行い、最終的な関節軌道を実際のロボットに転送する。
EAを用いた評価を減らすための2つの異なるアプローチが提案され、比較された。
論文 参考訳(メタデータ) (2024-02-01T15:38:21Z) - What Matters to You? Towards Visual Representation Alignment for Robot
Learning [81.30964736676103]
人のために運用する場合、ロボットはエンドユーザーの好みに合わせて報酬を最適化する必要がある。
本稿では、視覚的表現アライメント問題を解決するためのRAPL(Representation-Aligned Preference-based Learning)を提案する。
論文 参考訳(メタデータ) (2023-10-11T23:04:07Z) - Optimizing Algorithms From Pairwise User Preferences [23.87058308494074]
ペアワイズユーザの好みに基づいて,アルゴリズムパラメータの高次元設定を最適化するために,SortCMAを導入する。
本手法は,地上の真実を示さずに市販の深度センサをチューニングし,ロボットのソーシャルナビゲーションに応用する。
論文 参考訳(メタデータ) (2023-08-08T20:36:59Z) - Meta-Wrapper: Differentiable Wrapping Operator for User Interest
Selection in CTR Prediction [97.99938802797377]
クリックスルー率(CTR)予測は、ユーザーが商品をクリックする確率を予測することを目的としており、リコメンデーションシステムにおいてますます重要になっている。
近年,ユーザの行動からユーザの興味を自動的に抽出する深層学習モデルが大きな成功を収めている。
そこで我々は,メタラッパー(Meta-Wrapper)と呼ばれるラッパー手法の枠組みに基づく新しい手法を提案する。
論文 参考訳(メタデータ) (2022-06-28T03:28:15Z) - Data-driven Koopman Operators for Model-based Shared Control of
Human-Machine Systems [66.65503164312705]
本稿では,データ駆動型共有制御アルゴリズムを提案する。
ユーザのインタラクションに関するダイナミクスと情報は、Koopman演算子を使用して観察から学習される。
モデルに基づく共有制御は、自然な学習やユーザのみの制御パラダイムと比較して、タスクとコントロールのメトリクスを著しく改善する。
論文 参考訳(メタデータ) (2020-06-12T14:14:07Z) - Mining Implicit Entity Preference from User-Item Interaction Data for
Knowledge Graph Completion via Adversarial Learning [82.46332224556257]
本稿では,知識グラフ補完タスクにおけるユーザインタラクションデータを活用することで,新たな逆学習手法を提案する。
我々のジェネレータはユーザインタラクションデータから分離されており、識別器の性能を向上させるのに役立ちます。
利用者の暗黙の実体的嗜好を発見するために,グラフニューラルネットワークに基づく精巧な協調学習アルゴリズムを設計する。
論文 参考訳(メタデータ) (2020-03-28T05:47:33Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。