論文の概要: Synapse: Learning Preferential Concepts from Visual Demonstrations
- arxiv url: http://arxiv.org/abs/2403.16689v2
- Date: Tue, 7 May 2024 02:47:55 GMT
- ステータス: 処理完了
- システム内更新日: 2024-05-08 19:13:23.595645
- Title: Synapse: Learning Preferential Concepts from Visual Demonstrations
- Title(参考訳): Synapse: 視覚的デモから優先概念を学ぶ
- Authors: Sadanand Modak, Noah Patton, Isil Dillig, Joydeep Biswas,
- Abstract要約: 本稿では,視覚的入力からユーザ固有の嗜好を学習することを目的とした,嗜好学習の課題に対処する。
事実概念の学習に類似しているにもかかわらず、嗜好学習はその主観的な性質と個人固有のトレーニングデータの質のために根本的に難しい問題である。
この問題は、限定的なデモンストレーションから優先概念を効率的に学習するために設計された、ニューロシンボリックなアプローチであるSynapseと呼ばれる新しいフレームワークを用いて解決する。
- 参考スコア(独自算出の注目度): 12.32357362675109
- License: http://creativecommons.org/licenses/by-sa/4.0/
- Abstract: This paper addresses the problem of preference learning, which aims to learn user-specific preferences (e.g., "good parking spot", "convenient drop-off location") from visual input. Despite its similarity to learning factual concepts (e.g., "red cube"), preference learning is a fundamentally harder problem due to its subjective nature and the paucity of person-specific training data. We address this problem using a new framework called Synapse, which is a neuro-symbolic approach designed to efficiently learn preferential concepts from limited demonstrations. Synapse represents preferences as neuro-symbolic programs in a domain-specific language (DSL) that operates over images, and leverages a novel combination of visual parsing, large language models, and program synthesis to learn programs representing individual preferences. We evaluate Synapse through extensive experimentation including a user case study focusing on mobility-related concepts in mobile robotics and autonomous driving. Our evaluation demonstrates that Synapse significantly outperforms existing baselines as well as its own ablations. The code and other details can be found on the project website https://amrl.cs.utexas.edu/synapse .
- Abstract(参考訳): 本稿では、視覚的入力からユーザ固有の嗜好(例えば「良い駐車場所」、「便利な降車場所」など)を学習することを目的とした嗜好学習の課題に対処する。
現実的な概念(例えば「赤い立方体」)の学習に類似しているにもかかわらず、嗜好学習は主観的な性質と個人固有の訓練データのあいまいさのため、根本的に難しい問題である。
この問題は、限定的なデモンストレーションから優先概念を効率的に学習するために設計された、ニューロシンボリックなアプローチであるSynapseと呼ばれる新しいフレームワークを用いて解決する。
Synapseは、画像上で操作するドメイン特化言語(DSL)において、好みをニューロシンボリックなプログラムとして表現し、視覚解析、大規模言語モデル、プログラム合成という新しい組み合わせを活用して、個々の好みを表すプログラムを学ぶ。
モバイルロボティクスと自律運転におけるモビリティ関連概念に着目したユーザケーススタディを含む,広範な実験によるSynapseの評価を行った。
評価の結果,Synapseは既存のベースラインと独自の改善点を著しく上回っていることがわかった。
コードやその他の詳細はプロジェクトのWebサイト https://amrl.cs.utexas.edu/synapse で見ることができる。
関連論文リスト
- Rethinking Diverse Human Preference Learning through Principal Component Analysis [22.123631189289963]
本稿では,二項比較から多種多様な人間の嗜好を抽出する新しいアプローチであるデコンプリート・リワード・モデル(DRM)を紹介する。
我々の重要な洞察は、人間の好みをベクトルとして表現し、主成分分析(PCA)を用いて分析することである。
DRMは、意味のある好みの次元(例えば、有用性、安全性、ユーモア)を効果的に抽出し、追加のトレーニングなしで新規ユーザーに適応する。
論文 参考訳(メタデータ) (2025-02-18T18:55:26Z) - Few-shot Steerable Alignment: Adapting Rewards and LLM Policies with Neural Processes [50.544186914115045]
大きな言語モデル(LLM)は、日々のアプリケーションにますます組み込まれています。
個人ユーザの多様な嗜好との整合性を確保することは、重要な課題となっている。
数発のステアライメントのための新しいフレームワークを提案する。
論文 参考訳(メタデータ) (2024-12-18T16:14:59Z) - Personalizing Reinforcement Learning from Human Feedback with Variational Preference Learning [12.742158403867002]
ヒューマンフィードバックからの強化学習は、基礎モデルを人間の価値観や好みに合わせるための強力なパラダイムである。
現在のRLHF技術は、多様な集団における個人の嗜好の自然に生じる相違を説明できない。
マルチモーダルなRLHF手法のクラスを開発し,多元的アライメントの必要性に対処する。
論文 参考訳(メタデータ) (2024-08-19T15:18:30Z) - Data-Centric Human Preference Optimization with Rationales [23.243583332894737]
人間のフィードバックからの強化学習は、言語モデルを人間の好みに合わせる上で重要な役割を担っている。
この作業は、データ中心のアプローチによる好み学習の改善に重点を移す。
我々は、選択の背景にある理由を説明する機械生成論理を用いて、既存の嗜好データセットを豊かにすることを提案する。
論文 参考訳(メタデータ) (2024-07-19T17:27:52Z) - Modeling User Preferences via Brain-Computer Interfacing [54.3727087164445]
我々はBrain-Computer Interface技術を用いてユーザの好みを推測し、その注意力は視覚的コンテンツと感情的体験との関連性に相関する。
我々はこれらを,情報検索,生成モデルのパーソナライズされたステアリング,感情経験のクラウドソーシング人口推定など,関連するアプリケーションにリンクする。
論文 参考訳(メタデータ) (2024-05-15T20:41:46Z) - A tutorial on learning from preferences and choices with Gaussian Processes [0.7234862895932991]
このチュートリアルは、既存の文献の特定のギャップに対処する新しいGPベースのモデルを導入しながら、確立された研究の上に構築されている。
このフレームワークは、ランダムなユーティリティモデル、識別の限界、およびオブジェクトとラベルの両方に矛盾するユーティリティを持つシナリオを含む嗜好学習モデルの構築を可能にする。
論文 参考訳(メタデータ) (2024-03-18T13:40:48Z) - Bayesian Preference Elicitation with Language Models [82.58230273253939]
本稿では,BOEDを用いて情報的質問の選択を案内するフレームワークOPENと,特徴抽出のためのLMを紹介する。
ユーザスタディでは,OPEN が既存の LM- や BOED をベースとした選好手法よりも優れていることが判明した。
論文 参考訳(メタデータ) (2024-03-08T18:57:52Z) - Towards Scalable Adaptive Learning with Graph Neural Networks and
Reinforcement Learning [0.0]
学習経路のパーソナライズに関する問題に対して,フレキシブルでスケーラブルなアプローチを導入する。
我々のモデルはグラフニューラルネットワークに基づく逐次レコメンデーションシステムである。
以上の結果から,小規模データ体制における適切なレコメンデーションを学習できることが示唆された。
論文 参考訳(メタデータ) (2023-05-10T18:16:04Z) - Deep networks for system identification: a Survey [56.34005280792013]
システム識別は、入力出力データから動的システムの数学的記述を学習する。
同定されたモデルの主な目的は、以前の観測から新しいデータを予測することである。
我々は、フィードフォワード、畳み込み、リカレントネットワークなどの文献で一般的に採用されているアーキテクチャについて論じる。
論文 参考訳(メタデータ) (2023-01-30T12:38:31Z) - Preliminary study on using vector quantization latent spaces for TTS/VC
systems with consistent performance [55.10864476206503]
本稿では,潜在言語埋め込みをモデル化するための量子化ベクトルの利用について検討する。
トレーニングにおいて、潜伏空間上の異なるポリシーを強制することにより、潜伏言語埋め込みを得ることができる。
実験の結果,ベクトル量子化法で構築した音声クローニングシステムは,知覚的評価の点でわずかに劣化していることがわかった。
論文 参考訳(メタデータ) (2021-06-25T07:51:35Z) - Symbiotic Adversarial Learning for Attribute-based Person Search [86.7506832053208]
本稿では,共生学習の枠組みとして,共生学習の基盤に2つのGANを配置する。
具体的には、2種類の生成的敵ネットワークがトレーニングプロセスを通して協調的に学習する。
論文 参考訳(メタデータ) (2020-07-19T07:24:45Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。