論文の概要: DegustaBot: Zero-Shot Visual Preference Estimation for Personalized Multi-Object Rearrangement
- arxiv url: http://arxiv.org/abs/2407.08876v1
- Date: Thu, 11 Jul 2024 21:28:02 GMT
- ステータス: 処理完了
- システム内更新日: 2024-07-16 01:26:19.096586
- Title: DegustaBot: Zero-Shot Visual Preference Estimation for Personalized Multi-Object Rearrangement
- Title(参考訳): DegustaBot: パーソナライズされた多目的再構成のためのゼロショット視覚的嗜好推定
- Authors: Benjamin A. Newman, Pranay Gupta, Kris Kitani, Yonatan Bisk, Henny Admoni, Chris Paxton,
- Abstract要約: 本稿では,視覚的嗜好学習のためのアルゴリズムであるDegustaBotを提案する。
我々は、シミュレーション表設定タスクにおいて、自然主義的個人的嗜好の大規模なデータセットを収集する。
私たちのモデルの予測の50%は、少なくとも20%の人々に受け入れられる可能性が高いことが分かりました。
- 参考スコア(独自算出の注目度): 53.86523017756224
- License: http://creativecommons.org/licenses/by-sa/4.0/
- Abstract: De gustibus non est disputandum ("there is no accounting for others' tastes") is a common Latin maxim describing how many solutions in life are determined by people's personal preferences. Many household tasks, in particular, can only be considered fully successful when they account for personal preferences such as the visual aesthetic of the scene. For example, setting a table could be optimized by arranging utensils according to traditional rules of Western table setting decorum, without considering the color, shape, or material of each object, but this may not be a completely satisfying solution for a given person. Toward this end, we present DegustaBot, an algorithm for visual preference learning that solves household multi-object rearrangement tasks according to personal preference. To do this, we use internet-scale pre-trained vision-and-language foundation models (VLMs) with novel zero-shot visual prompting techniques. To evaluate our method, we collect a large dataset of naturalistic personal preferences in a simulated table-setting task, and conduct a user study in order to develop two novel metrics for determining success based on personal preference. This is a challenging problem and we find that 50% of our model's predictions are likely to be found acceptable by at least 20% of people.
- Abstract(参考訳): デ・グスティブス(De gustibus non est disputandum、他人の好みを説明できない)は、人々の個人的な嗜好によって、人生における何つの解が決定されるかを記述する一般的なラテン語の格言である。
特に、多くの家庭のタスクは、シーンの視覚的美学のような個人の好みを考慮に入れれば、完全に成功するとしか考えられない。
例えば、テーブルの設定は、各物体の色、形、素材を考慮せずに、西洋のテーブル設定デコラムの伝統的な規則に従って道具を配置することで最適化できるが、これは特定の人にとって完全に満足できる解決策ではないかもしれない。
そこで本研究では,視覚的嗜好学習のためのアルゴリズムであるDegustaBotを提案する。
そこで我々は、新しいゼロショットビジュアルプロンプト技術を用いて、インターネットスケールで事前学習された視覚・言語基礎モデル(VLM)を使用する。
提案手法を評価するため,模擬表設定タスクにおいて,自然主義的個人嗜好のデータセットを大量に収集し,個人選好に基づいて成功を決定するための2つの新しい指標を開発するためにユーザスタディを実施する。
これは難しい問題であり、私たちのモデルの予測の50%は、少なくとも20%の人が受け入れられる可能性が高いことに気付きます。
関連論文リスト
- ComPO: Community Preferences for Language Model Personalization [122.54846260663922]
ComPOは、言語モデルにおける好みの最適化をパーソナライズする手法である。
ComPRedはRedditからコミュニティレベルの好みを持った質問応答データセットです。
論文 参考訳(メタデータ) (2024-10-21T14:02:40Z) - An incremental preference elicitation-based approach to learning potentially non-monotonic preferences in multi-criteria sorting [53.36437745983783]
まず最適化モデルを構築し,非単調な選好をモデル化する。
本稿では,情報量測定手法と質問選択戦略を考案し,各イテレーションにおいて最も情報に富む選択肢を特定する。
2つのインクリメンタルな選好に基づくアルゴリズムは、潜在的に単調な選好を学習するために開発された。
論文 参考訳(メタデータ) (2024-09-04T14:36:20Z) - Scaling Up Personalized Image Aesthetic Assessment via Task Vector Customization [37.66059382315255]
本稿では,画像の審美性評価や画質評価に手軽に利用できるデータベースを活用する,ユニークなアプローチを提案する。
各データベースの特徴を表すタスクベクトルの最適な組み合わせを決定することにより、個人向けにパーソナライズされたモデルを作成することに成功した。
論文 参考訳(メタデータ) (2024-07-09T18:42:41Z) - Personalized Language Modeling from Personalized Human Feedback [49.344833339240566]
人間のフィードバックからの強化学習(Reinforcement Learning from Human Feedback, RLHF)は、人間の好みに合わせて大きな言語モデルを微調整するために一般的に用いられる。
本研究では,パーソナライズされた言語モデルを構築する手法を開発することにより,この問題に対処することを目的とする。
論文 参考訳(メタデータ) (2024-02-06T04:18:58Z) - Everyone Deserves A Reward: Learning Customized Human Preferences [25.28261194665836]
リワードモデル(RM)は、対話品質を改善するために、大きな言語モデルと人間の好みを合わせるのに不可欠である。
そこで我々は3段階のRM学習手法を提案し,その効果を一般嗜好データセットとDSPセットの両方で実証的に検証した。
我々は、カスタマイズされたRMをトレーニングしながら、一般的な好みの能力をよりよく保存する方法をいくつか見出す。
論文 参考訳(メタデータ) (2023-09-06T16:03:59Z) - TidyBot: Personalized Robot Assistance with Large Language Models [46.629932362863386]
重要な課題は、各オブジェクトを置く適切な場所を決定することです。
ある人は引き出しにシャツを保管することを好むかもしれないし、別の人は棚にシャツを保管することを好むかもしれない。
ロボットは、言語に基づく計画と知覚を、大規模言語モデルの数発の要約能力と組み合わせることができることを示す。
論文 参考訳(メタデータ) (2023-05-09T17:52:59Z) - Eliciting User Preferences for Personalized Multi-Objective Decision
Making through Comparative Feedback [76.7007545844273]
目的に対して異なるユーザの好みに対応する多目的意思決定フレームワークを提案する。
我々のモデルは、ベクトル値の報酬関数を持つマルコフ決定プロセスで構成され、各ユーザが未知の選好ベクトルを持つ。
少数の比較クエリを用いて,ユーザに対してほぼ最適なポリシを求めるアルゴリズムを提案する。
論文 参考訳(メタデータ) (2023-02-07T23:58:19Z) - One for All: Simultaneous Metric and Preference Learning over Multiple
Users [17.083305162005136]
回答者の群集からの同時選好とメートル法学習について検討した。
我々のモデルは、群衆のアイテム類似性の一般的な尺度を特徴付ける距離メートル法を共同で学習する。
我々は、シミュレーションデータと色嗜好判定のデータセットの両方で、モデルの性能を実証する。
論文 参考訳(メタデータ) (2022-07-07T22:47:13Z) - My House, My Rules: Learning Tidying Preferences with Graph Neural
Networks [8.57914821832517]
グラフニューラルネットワーク層を用いた新しい変分オートエンコーダアーキテクチャNeatNetを提案する。
ユーザから低次元の潜在嗜好ベクトルを抽出し,シーンの配置を観察する。
任意のオブジェクトセットが与えられた場合、このベクトルを使用して、ユーザの空間的嗜好に合わせて調整されたアレンジを生成することができる。
論文 参考訳(メタデータ) (2021-11-04T19:17:19Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。