論文の概要: Human Preference-Based Learning for High-dimensional Optimization of
Exoskeleton Walking Gaits
- arxiv url: http://arxiv.org/abs/2003.06495v2
- Date: Sat, 8 Aug 2020 16:56:22 GMT
- ステータス: 処理完了
- システム内更新日: 2022-12-24 02:23:35.038627
- Title: Human Preference-Based Learning for High-dimensional Optimization of
Exoskeleton Walking Gaits
- Title(参考訳): 人選学習による外骨格歩行の高次元最適化
- Authors: Maegan Tucker, Myra Cheng, Ellen Novoseller, Richard Cheng, Yisong
Yue, Joel W. Burdick, and Aaron D. Ames
- Abstract要約: この研究は、LineCoSparという、高次元でユーザの好みを学習するヒューマン・イン・ザ・ループの好みベースのフレームワークを提示する。
シミュレーションと人為的試行において,LineCoSparは高次元の選好最適化のためのサンプル効率のよい手法であることを実証的に検証した。
この結果はエキソ骨格の歩行合成に影響を及ぼし,臨床応用と患者のリハビリテーションに有効である。
- 参考スコア(独自算出の注目度): 55.59198568303196
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Optimizing lower-body exoskeleton walking gaits for user comfort requires
understanding users' preferences over a high-dimensional gait parameter space.
However, existing preference-based learning methods have only explored
low-dimensional domains due to computational limitations. To learn user
preferences in high dimensions, this work presents LineCoSpar, a
human-in-the-loop preference-based framework that enables optimization over
many parameters by iteratively exploring one-dimensional subspaces.
Additionally, this work identifies gait attributes that characterize broader
preferences across users. In simulations and human trials, we empirically
verify that LineCoSpar is a sample-efficient approach for high-dimensional
preference optimization. Our analysis of the experimental data reveals a
correspondence between human preferences and objective measures of dynamicity,
while also highlighting differences in the utility functions underlying
individual users' gait preferences. This result has implications for
exoskeleton gait synthesis, an active field with applications to clinical use
and patient rehabilitation.
- Abstract(参考訳): 低体外骨格歩行を利用者の快適性に最適化するには,高次元歩行パラメータ空間上でのユーザの嗜好を理解する必要がある。
しかし,従来の嗜好に基づく学習手法は,計算量制限のため,低次元領域のみを探索している。
ユーザ嗜好を高次元で学習するために、LineCoSparは1次元のサブスペースを反復的に探索することで、多くのパラメータを最適化する。
さらに、本研究では、ユーザ間の幅広い好みを特徴付けるゲイト属性を識別する。
シミュレーションと人為的試行において,LineCoSparは高次元の選好最適化のためのサンプル効率のよい手法であることを実証的に検証した。
実験データから,人間の嗜好と動的性の客観的尺度との対応性を明らかにするとともに,個人の歩行嗜好に基づく実用機能の違いを明らかにする。
この結果はエキソ骨格の歩行合成に影響を及ぼし,臨床応用と患者のリハビリテーションに有効である。
関連論文リスト
- MotionRL: Align Text-to-Motion Generation to Human Preferences with Multi-Reward Reinforcement Learning [99.09906827676748]
我々は、テキスト・ツー・モーション生成タスクを最適化するために、Multi-Reward Reinforcement Learning(RL)を利用する最初のアプローチであるMotionRLを紹介する。
我々の新しいアプローチは、人間の知覚モデルに関する知識以前の人間の嗜好に基づいて、強化学習を用いて運動生成体を微調整する。
さらに、MotionRLは、テキストのアテンデンス、モーションクオリティ、人間の好みの最適性を近似する、新しい多目的最適化戦略を導入している。
論文 参考訳(メタデータ) (2024-10-09T03:27:14Z) - Aligning Large Language Models with Self-generated Preference Data [72.99676237703099]
大規模言語モデル(LLM)と人間の嗜好との整合性を高める新しいフレームワークを提案する。
私たちのキーとなるアイデアは、小さな(種)データの中で人間の事前知識を活用することです。
本稿では,ノイズ認識型選好学習アルゴリズムを導入し,生成した選好データにおける品質低下のリスクを軽減する。
論文 参考訳(メタデータ) (2024-06-06T18:01:02Z) - Adaptive Preference Scaling for Reinforcement Learning with Human Feedback [103.36048042664768]
人間からのフィードバックからの強化学習(RLHF)は、AIシステムと人間の価値を合わせるための一般的なアプローチである。
本稿では,分散ロバスト最適化(DRO)に基づく適応的優先損失を提案する。
提案手法は多用途であり,様々な選好最適化フレームワークに容易に適用可能である。
論文 参考訳(メタデータ) (2024-06-04T20:33:22Z) - Enhanced Bayesian Optimization via Preferential Modeling of Abstract
Properties [49.351577714596544]
本研究では,非測定抽象特性に関する専門家の嗜好を代理モデルに組み込むための,人間とAIの協調型ベイズフレームワークを提案する。
優先判断において、誤った/誤解を招く専門家バイアスを処理できる効率的な戦略を提供する。
論文 参考訳(メタデータ) (2024-02-27T09:23:13Z) - Cost-Sensitive Best Subset Selection for Logistic Regression: A
Mixed-Integer Conic Optimization Perspective [3.1468618177952785]
機械学習の主な課題は、透過的な予測を行うための最適なサブセットへの入力を削減できる解釈可能なモデルを設計することである。
混合整数コニック最適化の観点から,ロジスティック回帰のための最適特徴選択法を提案する。
これにより、異なる最適基数と予算制約のある特徴選択手順を体系的に評価できる。
論文 参考訳(メタデータ) (2023-10-09T07:13:40Z) - Good practices for Bayesian Optimization of high dimensional structured
spaces [15.488642552157131]
高次元構造データセットにおけるベイズ最適化のための異なる探索空間設計の選択の効果について検討する。
遅延空間における最適化境界を自動的に定義する新しい手法を評価します。
我々は実践者に推薦する。
論文 参考訳(メタデータ) (2020-12-31T07:00:39Z) - ROIAL: Region of Interest Active Learning for Characterizing Exoskeleton
Gait Preference Landscapes [64.87637128500889]
興味あるアクティブラーニング(ROIAL)フレームワークの領域は、関心のある領域を通じて、各ユーザの基盤となるユーティリティ関数を積極的に学習する。
ROIALは、絶対的な数値スコアよりも信頼性の高いフィードバックメカニズムである順序と選好のフィードバックから学習する。
以上の結果から,限られた人為的試行から歩行実用景観を回復できる可能性が示唆された。
論文 参考訳(メタデータ) (2020-11-09T22:45:58Z) - Projective Preferential Bayesian Optimization [12.431251769382888]
本研究では,高次元空間におけるユーザの好みを学習するためのベイズ最適化手法を提案する。
我々のフレームワークは、高次元のブラックボックス関数のグローバル最小値を見つけることができる。
論文 参考訳(メタデータ) (2020-02-08T08:29:23Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。