論文の概要: TacStyle: Personalizing Tactile Robot Policies using Structured Behavior Representations
- arxiv url: http://arxiv.org/abs/2606.14862v1
- Date: Fri, 12 Jun 2026 18:04:28 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-06-16 16:21:32.34639
- Title: TacStyle: Personalizing Tactile Robot Policies using Structured Behavior Representations
- Title(参考訳): TacStyle:構造化行動表現を用いた触覚ロボットポリシーのパーソナライズ
- Authors: Kevin Robledo, Matías I. Torres Galaz, Kumar Dixhant Rai, Shelly Sara Ulman, Tasmia Tasrin, Heramb Nemlekar,
- Abstract要約: 自然言語は人間が好みを伝えるための直感的な方法を提供する。
言語条件ロボット政策の最近の進歩は、ロボットが言語プロンプトを使ってどのタスクを実行するかを決定することに成功していることを示している。
直感的に構造化された潜在空間からロボットの動作を選択することで、ユーザの好みにより正確に適応できることを示す。
- 参考スコア(独自算出の注目度): 0.9253666753150972
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Robotic systems that assist humans should be capable of adapting their behaviors to individual user preferences. For instance, users may want a robot arm to adjust the amount of force it applies while folding their laundry or cleaning furniture. Natural language provides an intuitive way for humans to communicate such preferences. Recent progress in language-conditioned robot policies has shown that robots can successfully use language prompts to determine what task to perform. However, extending the same approach to realize how the task should be performed requires detailed labels describing the preferences or styles of trajectories in the task data. Not only is collecting such annotations challenging, but conditioning directly on these labels may also fail to provide fine-grained control over a continuous range of behaviors. For example, it can be difficult to convey the exact force that a robot must apply through abstract instructions like "apply a bit more pressure than before". Therefore, in this work, we propose using language to reason over preferred behaviors instead of directly generating them. We first learn a structured latent representation that organizes user preferences according to differences in the corresponding trajectories. Then, given a preference prompt, we use a foundation model to interpret this latent space and choose a value that produces the desired behavior. Through both simulation and real-world experiments, we show that selecting robot behaviors from an intuitively structured latent space enables more precise adaptation to user preferences while requiring significantly fewer preference labels than language-conditioned policies.
- Abstract(参考訳): 人間を支援するロボットシステムは、個々のユーザの好みに合わせて行動を調整する能力を持つべきである。
例えば、ロボットアームが洗濯物を折ったり家具を掃除したりしながら、適用される力を調整したい場合もあります。
自然言語は、人間がそのような好みを伝えるための直感的な方法を提供する。
言語条件ロボット政策の最近の進歩は、ロボットが言語プロンプトを使ってどのタスクを実行するかを決定することに成功していることを示している。
しかし、タスクがどのように実行されるべきかを理解するために同じアプローチを拡張するには、タスクデータ内の軌道の好みやスタイルを記述する詳細なラベルが必要である。
このようなアノテーションの収集は難しいだけでなく、これらのラベルを直接条件付けしても、連続した動作範囲に対するきめ細かい制御ができない可能性がある。
例えば、ロボットが「以前よりも少し圧力を増す」という抽象的な指示を通じて適用しなければならない正確な力を伝えることは困難である。
そこで本研究では,これらを直接生成するのではなく,言語を用いて好みの振る舞いを推論する手法を提案する。
まず,対応する軌道の差に応じてユーザの嗜好を整理する構造化潜在表現を学習する。
そして、好みのプロンプトが与えられた場合、この潜在空間を解釈するために基礎モデルを使用し、所望の振る舞いを生成する値を選択する。
シミュレーションと実世界の両方の実験を通して、直感的に構造化された潜伏空間からロボットの行動を選択することは、言語条件のポリシーよりもはるかに少ない嗜好ラベルを必要としながら、ユーザの嗜好により正確に適応できることを示す。
関連論文リスト
- Promptable Behaviors: Personalizing Multi-Objective Rewards from Human
Preferences [53.353022588751585]
本稿では,ロボットエージェントの多種多様な嗜好に対する効率的なパーソナライズを促進する新しいフレームワークであるPromptable Behaviorsを紹介する。
我々は、異なるタイプの相互作用を活用することによって、人間の嗜好を推測する3つの異なる方法を紹介した。
本稿では,ProcTHOR と Robothor のナビゲーションタスクをパーソナライズしたオブジェクトゴールナビゲーションおよびエスケープナビゲーションタスクにおいて,提案手法の評価を行う。
論文 参考訳(メタデータ) (2023-12-14T21:00:56Z) - TidyBot: Personalized Robot Assistance with Large Language Models [46.629932362863386]
重要な課題は、各オブジェクトを置く適切な場所を決定することです。
ある人は引き出しにシャツを保管することを好むかもしれないし、別の人は棚にシャツを保管することを好むかもしれない。
ロボットは、言語に基づく計画と知覚を、大規模言語モデルの数発の要約能力と組み合わせることができることを示す。
論文 参考訳(メタデータ) (2023-05-09T17:52:59Z) - "No, to the Right" -- Online Language Corrections for Robotic
Manipulation via Shared Autonomy [70.45420918526926]
LILACは、実行中に自然言語の修正をオンラインで実施し、適応するためのフレームワークである。
LILACは人間とロボットを個別にターンテイクする代わりに、人間とロボットの間にエージェンシーを分割する。
提案手法は,タスク完了率が高く,ユーザによって主観的に好まれることを示す。
論文 参考訳(メタデータ) (2023-01-06T15:03:27Z) - Correcting Robot Plans with Natural Language Feedback [88.92824527743105]
ロボットの修正のための表現的かつ柔軟なツールとして自然言語を探索する。
これらの変換により、ユーザは目標を正し、ロボットの動きを更新し、計画上のエラーから回復できる。
本手法により,シミュレーション環境や実環境において,複数の制約を合成し,未知のシーン,オブジェクト,文に一般化することが可能となる。
論文 参考訳(メタデータ) (2022-04-11T15:22:43Z) - Do As I Can, Not As I Say: Grounding Language in Robotic Affordances [119.29555551279155]
大規模な言語モデルは、世界に関する豊富な意味知識を符号化することができる。
このような知識は、自然言語で表現された高レベルで時間的に拡張された命令を動作させようとするロボットにとって極めて有用である。
低レベルのスキルを大規模言語モデルと組み合わせることで,言語モデルが複雑かつ時間的に拡張された命令を実行する手順について高いレベルの知識を提供することを示す。
論文 参考訳(メタデータ) (2022-04-04T17:57:11Z) - Reshaping Robot Trajectories Using Natural Language Commands: A Study of
Multi-Modal Data Alignment Using Transformers [33.7939079214046]
我々は、人間とロボットのコラボレーションのための柔軟な言語ベースのインタフェースを提供する。
我々は、ユーザコマンドをエンコードする大規模言語モデルの分野における最近の進歩を生かしている。
言語コマンドによって修正されたロボット軌跡を含むデータセット上で、模倣学習を用いてモデルを訓練する。
論文 参考訳(メタデータ) (2022-03-25T01:36:56Z) - Learning Language-Conditioned Robot Behavior from Offline Data and
Crowd-Sourced Annotation [80.29069988090912]
本研究では,ロボットインタラクションの大規模なオフラインデータセットから視覚に基づく操作タスクを学習する問題について検討する。
クラウドソースの自然言語ラベルを用いたオフラインロボットデータセットの活用を提案する。
提案手法は目標画像仕様と言語条件付き模倣技術の両方を25%以上上回っていることがわかった。
論文 参考訳(メタデータ) (2021-09-02T17:42:13Z) - Translating Natural Language Instructions to Computer Programs for Robot
Manipulation [0.6629765271909505]
自然言語命令をPython関数に翻訳し、オブジェクト検出器の出力にアクセスしてシーンをクエリすることを提案する。
提案手法は,ロボットの動作を直接予測するニューラルネットワークの訓練よりも優れた性能を示す。
論文 参考訳(メタデータ) (2020-12-26T07:57:55Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。