論文の概要: Low-Burden LLM-Based Preference Learning: Personalizing Assistive Robots from Natural Language Feedback for Users with Paralysis
- arxiv url: http://arxiv.org/abs/2604.01463v1
- Date: Wed, 01 Apr 2026 23:17:10 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-04-03 14:21:10.09996
- Title: Low-Burden LLM-Based Preference Learning: Personalizing Assistive Robots from Natural Language Feedback for Users with Paralysis
- Title(参考訳): 低バーデンLDMによる推論学習: 自然言語フィードバックから学習支援ロボットをパーソナライズ
- Authors: Keshav Shankar, Dan Ding, Wei Gao,
- Abstract要約: 本研究では,非構造化自然言語フィードバックを直接決定論的ロボット制御ポリシーに変換するフレームワークを提案する。
我々のパイプラインは、Occupational Therapy Practice Framework(OTPF)に基盤を置くLarge Language Models(LLM)を使用している。
麻痺者10名を対象に, 模擬食事準備試験において本システムの有効性を検証した。
- 参考スコア(独自算出の注目度): 6.057783527611029
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Physically Assistive Robots (PARs) require personalized behaviors to ensure user safety and comfort. However, traditional preference learning methods, like exhaustive pairwise comparisons, cause severe physical and cognitive fatigue for users with profound motor impairments. To solve this, we propose a low-burden, offline framework that translates unstructured natural language feedback directly into deterministic robotic control policies. To safely bridge the gap between ambiguous human speech and robotic code, our pipeline uses Large Language Models (LLMs) grounded in the Occupational Therapy Practice Framework (OTPF). This clinical reasoning decodes subjective user reactions into explicit physical and psychological needs, which are then mapped into transparent decision trees. Before deployment, an automated "LLM-as-a-Judge" verifies the code's structural safety. We validated this system in a simulated meal preparation study with 10 adults with paralysis. Results show our natural language approach significantly reduces user workload compared to traditional baselines. Additionally, independent clinical experts confirmed the generated policies are safe and accurately reflect user preferences.
- Abstract(参考訳): 物理的支援ロボット(PAR)は、ユーザーの安全と快適さを確保するためにパーソナライズされた行動を必要とする。
しかし、徹底的なペアワイズ比較のような従来の嗜好学習手法は、重度運動障害を持つユーザに対して、身体的および認知的疲労を引き起こす。
そこで本研究では,非構造化自然言語フィードバックを直接決定論的ロボット制御ポリシーに変換する,低バーデン・オフラインフレームワークを提案する。
我々のパイプラインは、あいまいな人間のスピーチとロボットコードのギャップを安全に埋めるために、Occupational Therapy Practice Framework(OTPF)に基盤を置くLarge Language Models(LLMs)を使用します。
この臨床推論は、主観的ユーザ反応を明示的な物理的および心理的要求にデコードし、それを透明な決定木にマッピングする。
デプロイ前に、自動化された"LLM-as-a-Judge"がコードの構造的安全性を検証する。
麻痺者10名を対象に, 模擬食事準備試験において本システムの有効性を検証した。
その結果、私たちの自然言語アプローチは従来のベースラインに比べて、ユーザの作業量を大幅に削減します。
さらに、独立した臨床専門家は、生成されたポリシーは安全であり、ユーザーの好みを正確に反映していることを確認した。
関連論文リスト
- Interpreting Context-Aware Human Preferences for Multi-Objective Robot Navigation [6.15445073348032]
本稿では,ロボットがコンテキストに依存したナビゲーションの好みを理解し,適用できるようにするパイプラインを提案する。
Vision-Language Model (VLM)は、搭載された視覚観測から構造化された環境コンテキストを抽出する。
大規模言語モデル(LLM)は、自然言語のユーザフィードバックを解釈可能なコンテキスト依存の行動規則に変換する。
好み翻訳モジュールは、コンテキスト情報と格納されたルールを数値的な好みベクトルにマッピングする。
論文 参考訳(メタデータ) (2026-03-18T09:14:05Z) - EEG-Based Brain-LLM Interface for Human Preference Aligned Generation [24.23256869192603]
脳-LLMインターフェースを構築し,脳波信号を用いて画像生成モデルをテスト時にガイドする。
実験では、脳波がユーザの満足度を予測することを示し、神経活動がリアルタイムの嗜好推定に関する情報を運ぶことを示唆している。
論文 参考訳(メタデータ) (2026-03-03T19:00:11Z) - Bidirectional Human-Robot Communication for Physical Human-Robot Interaction [13.222878560524896]
BRIDGEは、物理的支援における双方向の人間ロボット通信システムである。
提案手法では,自然言語を用いてロボットの計画軌道をリアルタイムで修正することができる。
本システムでは, ユーザに対して, 結果の変化の確認や, 明確な疑問の呈示など, 言葉によるフィードバックを提供する。
論文 参考訳(メタデータ) (2026-01-15T19:01:02Z) - Personalized Reasoning: Just-In-Time Personalization and Why LLMs Fail At It [81.50711040539566]
現在の大規模言語モデル(LLM)開発は、タスク解決と優先順位調整を別の課題として扱う。
静的ベンチマークを対話型パーソナライズタスクに変換する評価手法であるPreFDISCOを紹介する。
我々のフレームワークは、ユーザコンテキストに応じて、同じ質問が異なる推論チェーンを必要とするシナリオを作成します。
論文 参考訳(メタデータ) (2025-09-30T18:55:28Z) - Mitigating Harmful Erraticism in LLMs Through Dialectical Behavior Therapy Based De-Escalation Strategies [0.0]
本稿では、人間の心理的原理、特に治療的モダリティに根ざした枠組みが、より堅牢で持続可能なソリューションを提供することができると仮定する。
人間の脳を模倣するAIのシミュレーションニューラルネットワークに類似して、弁証行動療法(DBT)の原則を適用することを提案する。
論文 参考訳(メタデータ) (2025-09-06T11:20:15Z) - Towards Empathetic Conversational Recommender Systems [77.53167131692]
本稿では,共感型会話レコメンデータ(ECR)フレームワークを提案する。
ECRには、感情対応アイテムレコメンデーションと感情対応応答生成という、2つの主要なモジュールが含まれている。
ReDialデータセットの実験は、推奨精度を高め、ユーザの満足度を向上させる上で、我々のフレームワークの有効性を検証する。
論文 参考訳(メタデータ) (2024-08-30T15:43:07Z) - Aligning Large Language Models from Self-Reference AI Feedback with one General Principle [61.105703857868775]
13B Llama2-Chatで高品質なフィードバックを提供できる自己参照型AIフィードバックフレームワークを提案する。
具体的には、まずAIがユーザーの指示に反応し、それに基づいて他の回答に対する批判を参照として生成する。
最後に、批判に応じて、どの回答が人間の好みに合うかを判断する。
論文 参考訳(メタデータ) (2024-06-17T03:51:46Z) - Tuning-Free Accountable Intervention for LLM Deployment -- A
Metacognitive Approach [55.613461060997004]
大規模言語モデル(LLM)は、自然言語処理タスクの幅広い領域にわたる変換的進歩を触媒している。
我々は,自己認識型誤り識別と訂正機能を備えたLLMを実現するために,textbfCLEARと呼ばれる革新的なテキストメタ認知手法を提案する。
論文 参考訳(メタデータ) (2024-03-08T19:18:53Z) - "No, to the Right" -- Online Language Corrections for Robotic
Manipulation via Shared Autonomy [70.45420918526926]
LILACは、実行中に自然言語の修正をオンラインで実施し、適応するためのフレームワークである。
LILACは人間とロボットを個別にターンテイクする代わりに、人間とロボットの間にエージェンシーを分割する。
提案手法は,タスク完了率が高く,ユーザによって主観的に好まれることを示す。
論文 参考訳(メタデータ) (2023-01-06T15:03:27Z) - Personalized Rehabilitation Robotics based on Online Learning Control [62.6606062732021]
本稿では,各ユーザに対して実行時の制御力をパーソナライズ可能な,新しいオンライン学習制御アーキテクチャを提案する。
提案手法を,学習コントローラがパーソナライズされた制御を提供するとともに,安全な相互作用力も得られる実験ユーザスタディで評価した。
論文 参考訳(メタデータ) (2021-10-01T15:28:44Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。