論文の概要: FARPLS: A Feature-Augmented Robot Trajectory Preference Labeling System
to Assist Human Labelers' Preference Elicitation
- arxiv url: http://arxiv.org/abs/2403.06267v1
- Date: Sun, 10 Mar 2024 17:07:20 GMT
- ステータス: 処理完了
- システム内更新日: 2024-03-13 06:48:35.928400
- Title: FARPLS: A Feature-Augmented Robot Trajectory Preference Labeling System
to Assist Human Labelers' Preference Elicitation
- Title(参考訳): FARPLS:人間ラベル作成者の選好評価を支援する機能強化型ロボット軌道選好ラベルシステム
- Authors: Hanfang Lyu, Yuanchen Bai, Xin Liang, Ujaan Das, Chuhan Shi, Leiliang
Gong, Yingchi Li, Mingfei Sun, Ming Ge, Xiaojuan Ma
- Abstract要約: 優先度に基づく学習は、ロボットタスクの目的と人間の価値を一致させることを目的としている。
従来の比較に基づく選好ラベリングシステムは、ビデオに記録された複雑な軌跡間の重要な違いをダイジェストし、識別するラベラーをほとんどサポートしない。
FARPLSは、人間にとって重要な様々なタスク機能における潜在的なアウトリーチを強調し、容易にレビューと比較のために対応する動画を抽出する。
また、ユーザの親しみ、軌道対の難しさ、不一致度に応じてラベリング順序を動的に調整する。
- 参考スコア(独自算出の注目度): 26.06959875347643
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Preference-based learning aims to align robot task objectives with human
values. One of the most common methods to infer human preferences is by
pairwise comparisons of robot task trajectories. Traditional comparison-based
preference labeling systems seldom support labelers to digest and identify
critical differences between complex trajectories recorded in videos. Our
formative study (N = 12) suggests that individuals may overlook non-salient
task features and establish biased preference criteria during their preference
elicitation process because of partial observations. In addition, they may
experience mental fatigue when given many pairs to compare, causing their label
quality to deteriorate. To mitigate these issues, we propose FARPLS, a
Feature-Augmented Robot trajectory Preference Labeling System. FARPLS
highlights potential outliers in a wide variety of task features that matter to
humans and extracts the corresponding video keyframes for easy review and
comparison. It also dynamically adjusts the labeling order according to users'
familiarities, difficulties of the trajectory pair, and level of disagreements.
At the same time, the system monitors labelers' consistency and provides
feedback on labeling progress to keep labelers engaged. A between-subjects
study (N = 42, 105 pairs of robot pick-and-place trajectories per person) shows
that FARPLS can help users establish preference criteria more easily and notice
more relevant details in the presented trajectories than the conventional
interface. FARPLS also improves labeling consistency and engagement, mitigating
challenges in preference elicitation without raising cognitive loads
significantly
- Abstract(参考訳): 好みに基づく学習は、ロボットのタスクの目的を人間の価値観に合わせることを目的としている。
人間の嗜好を推測する最も一般的な方法の1つは、ロボットタスク軌跡のペアワイズ比較である。
従来の比較に基づく選好ラベリングシステムは、ビデオに記録された複雑な軌跡間の重要な違いをダイジェストし識別するためのラベルをほとんどサポートしない。
定式化研究 (N = 12) は, 個人が非塩分性タスクの特徴を軽視し, 偏りのある選好基準を確立することを示唆している。
さらに、多くのペアを比較すると精神的な疲労を経験し、ラベルの品質が悪化する。
そこで本研究では,ロボットの軌跡選択ラベリングシステムであるfarplsを提案する。
FARPLSは、人間にとって重要な様々なタスク機能における潜在的なアウトリーチを強調し、容易にレビューと比較のために対応するビデオキーフレームを抽出する。
また、ユーザの親しみ、軌道ペアの難しさ、不一致のレベルに応じて、ラベリング順序を動的に調整する。
同時に、システムはラベルの一貫性を監視し、ラベルの進行状況に関するフィードバックを提供する。
between-subjects study (n = 42, 105 pairs of robot pick-and-place trajectories per person) によれば、farplsはユーザーがより簡単に好みの基準を定め、提示された軌道の詳細を従来のインタフェースよりも分かりやすくすることができる。
FARPLSはまたラベルの一貫性とエンゲージメントを改善し、認知負荷を著しく増加させることなく、嗜好誘発における課題を軽減する
関連論文リスト
- Self-Training with Pseudo-Label Scorer for Aspect Sentiment Quad Prediction [54.23208041792073]
Aspect Sentiment Quad Prediction (ASQP) は、与えられたレビューに対して全てのクワッド(アスペクト項、アスペクトカテゴリー、意見項、感情極性)を予測することを目的としている。
ASQPタスクにおける重要な課題はラベル付きデータの不足であり、既存のメソッドのパフォーマンスを制限している。
そこで我々は,擬似ラベルスコアラーを用いた自己学習フレームワークを提案し,レビューと擬似ラベルの一致をスコアラーが評価する。
論文 参考訳(メタデータ) (2024-06-26T05:30:21Z) - Large language models can accurately predict searcher preferences [12.134907765184572]
本稿では,ラベルの品質向上のための代替手法を提案する。
実際のユーザーからの注意深いフィードバックが受けられる。これは定義上、高品質のファースト・パーティ・ゴールド・データだ。
大規模な言語モデルは、人間のラベルラーと同じくらいの精度で有効であることがわかった。
論文 参考訳(メタデータ) (2023-09-19T13:55:39Z) - PEARL: Zero-shot Cross-task Preference Alignment and Robust Reward Learning for Robotic Manipulation [29.88058548320708]
ゼロショット型クロスタスク選好アライメントとロバスト・リワード学習(PEARL)を提案する。
PEARLは、ターゲットタスクの人間ラベルなしで、クロスタスクの嗜好伝達からポリシーを学習する。
Meta-World と Robomimic のロボット操作タスクに関する実証的な結果から,我々の手法はタスク間で好みラベルを正確に転送し,適切なポリシーを学習できることを示した。
論文 参考訳(メタデータ) (2023-06-06T12:07:50Z) - Eliciting and Learning with Soft Labels from Every Annotator [31.10635260890126]
個々のアノテータからソフトラベルを効率よく抽出することに注力する。
ラベルによる学習は,従来の手法と同等のモデル性能を達成できることを実証する。
論文 参考訳(メタデータ) (2022-07-02T12:03:00Z) - Contrastive Test-Time Adaptation [83.73506803142693]
本稿では,自己指導型コントラスト学習を活用して特徴学習を支援する新しい手法を提案する。
擬似ラベルをオンラインで作成し、ターゲットのフィーチャースペースに最も近い隣人の間でソフト投票によってそれらを洗練します。
我々の手法であるAdaContrastは、主要なベンチマーク上で最先端のパフォーマンスを達成する。
論文 参考訳(メタデータ) (2022-04-21T19:17:22Z) - Unbiased Pairwise Learning to Rank in Recommender Systems [4.058828240864671]
アルゴリズムをランク付けする偏見のない学習は、候補をアピールし、既に単一の分類ラベルを持つ多くのアプリケーションに適用されている。
本稿では,この課題に対処するための新しい非バイアス付きLTRアルゴリズムを提案する。
パブリックベンチマークデータセットと内部ライブトラフィックを用いた実験結果から,分類ラベルと連続ラベルのいずれにおいても提案手法の優れた結果が得られた。
論文 参考訳(メタデータ) (2021-11-25T06:04:59Z) - Fine-grained Entity Typing via Label Reasoning [41.05579329042479]
本稿では,細粒度なエンティティラベルを逐次推論するemphLabel Reasoning Network(LRN)を提案する。
実験により、LRNは標準的な超微粒なエンティティ型ベンチマークで最先端のパフォーマンスを達成することが示された。
論文 参考訳(メタデータ) (2021-09-13T07:08:47Z) - Disentangling Sampling and Labeling Bias for Learning in Large-Output
Spaces [64.23172847182109]
異なる負のサンプリングスキームが支配的ラベルと稀なラベルで暗黙的にトレードオフパフォーマンスを示す。
すべてのラベルのサブセットで作業することで生じるサンプリングバイアスと、ラベルの不均衡に起因するデータ固有のラベルバイアスの両方に明示的に対処する統一された手段を提供する。
論文 参考訳(メタデータ) (2021-05-12T15:40:13Z) - SPL-MLL: Selecting Predictable Landmarks for Multi-Label Learning [87.27700889147144]
我々は、入力(予測可能)に応じて予測しやすく、他の可能なラベル(表現可能)をうまく回復できるランドマークとして、ラベルの小さなサブセットを選択することを提案する。
我々は,ADM(Alternating Direction Method)を用いてこの問題を解決する。実世界のデータセットに関する実証研究により,本手法が他の最先端手法よりも優れた分類性能を実現することを示す。
論文 参考訳(メタデータ) (2020-08-16T11:07:44Z) - ConsNet: Learning Consistency Graph for Zero-Shot Human-Object
Interaction Detection [101.56529337489417]
画像中のHuman, Action, Object>の形のHOIインスタンスを検出・認識することを目的としたHuman-Object Interaction (HOI) Detectionの問題点を考察する。
我々は、オブジェクト、アクション、インタラクション間の多レベルコンパレンシーは、稀な、あるいは以前には見られなかったHOIのセマンティック表現を生成するための強力な手がかりであると主張している。
提案モデルでは,人-対象のペアの視覚的特徴とHOIラベルの単語埋め込みを入力とし,それらを視覚-意味的関節埋め込み空間にマッピングし,類似度を計測して検出結果を得る。
論文 参考訳(メタデータ) (2020-08-14T09:11:18Z) - Interaction Matching for Long-Tail Multi-Label Classification [57.262792333593644]
既存のマルチラベル分類モデルにおいて,制約に対処するためのエレガントで効果的なアプローチを提案する。
ソフトなn-gram相互作用マッチングを実行することで、ラベルと自然言語記述をマッチングする。
論文 参考訳(メタデータ) (2020-05-18T15:27:55Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。