論文の概要: Continual Learning for Grounded Instruction Generation by Observing
Human Following Behavior
- arxiv url: http://arxiv.org/abs/2108.04812v1
- Date: Tue, 10 Aug 2021 17:53:44 GMT
- ステータス: 処理完了
- システム内更新日: 2021-08-11 14:35:38.494801
- Title: Continual Learning for Grounded Instruction Generation by Observing
Human Following Behavior
- Title(参考訳): 人間追従行動観察によるグラウンドドインストラクション生成のための連続学習
- Authors: Noriyuki Kojima, Alane Suhr, Yoav Artzi
- Abstract要約: 自然言語命令生成のための連続学習について研究する。
我々は,自然言語を用いてタスクを人間に委譲する,協調的なシナリオに焦点をあてる。
我々は,この信号を用いて,文脈的バンディット学習による命令生成能力を向上させる方法を示す。
- 参考スコア(独自算出の注目度): 22.425417134985747
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: We study continual learning for natural language instruction generation, by
observing human users' instruction execution. We focus on a collaborative
scenario, where the system both acts and delegates tasks to human users using
natural language. We compare user execution of generated instructions to the
original system intent as an indication to the system's success communicating
its intent. We show how to use this signal to improve the system's ability to
generate instructions via contextual bandit learning. In interaction with real
users, our system demonstrates dramatic improvements in its ability to generate
language over time.
- Abstract(参考訳): 人間の指示実行を観察し,自然言語命令生成のための連続学習について検討した。
我々は,自然言語を用いてタスクの動作と委譲を行う,協調的なシナリオに注目した。
生成した命令のユーザ実行を,その意図を伝えるシステムの成功を示す指標として,元のシステム意図と比較する。
我々は,この信号を用いて,文脈的バンディット学習による命令生成能力を向上させる方法を示す。
実際のユーザと対話することで,時間とともに言語を生成する能力が劇的に向上することを示す。
関連論文リスト
- Spatially-Aware Speaker for Vision-and-Language Navigation Instruction Generation [8.931633531104021]
SAS(Spatially-Aware Speaker)は、環境の構造的知識と意味的知識の両方を用いてよりリッチな命令を生成する命令生成装置である。
提案手法は,既存の命令生成モデルより優れ,標準指標を用いて評価する。
論文 参考訳(メタデータ) (2024-09-09T13:12:11Z) - Prototype of a robotic system to assist the learning process of English
language with text-generation through DNN [0.0]
本稿では,英語の自己学習を支援するヒューマノイドロボットシステムのプロトタイプについて紹介する。
学習者は、ユーザの英語レベルに応じてテキストを生成するグラフィカルユーザインタフェースを用いてシステムと対話する。
論文 参考訳(メタデータ) (2023-09-20T08:39:51Z) - Bootstrapping Adaptive Human-Machine Interfaces with Offline
Reinforcement Learning [82.91837418721182]
適応インターフェイスは、ユーザがシーケンシャルな意思決定タスクを実行するのに役立つ。
近年のヒューマン・イン・ザ・ループ・機械学習の進歩により、ユーザとの対話によってこのようなシステムが改善されている。
本稿では,生のコマンド信号をアクションにマッピングするインタフェースを訓練するための強化学習アルゴリズムを提案する。
論文 参考訳(メタデータ) (2023-09-07T16:52:27Z) - Learning to Model the World with Language [100.76069091703505]
人間と対話し、世界で行動するためには、エージェントは人々が使用する言語の範囲を理解し、それを視覚の世界に関連付ける必要がある。
私たちのキーとなるアイデアは、エージェントが将来を予測するのに役立つ信号として、このような多様な言語を解釈すべきである、ということです。
我々は、将来のテキストや画像表現を予測するマルチモーダル世界モデルを学ぶエージェントであるDynalangでこれをインスタンス化する。
論文 参考訳(メタデータ) (2023-07-31T17:57:49Z) - Contrastive Language, Action, and State Pre-training for Robot Learning [1.1000499414131326]
本稿では,ロボット学習における下流作業を支援するために,言語,行動,状態情報を共有埋め込み空間に統一する手法を提案する。
提案手法であるCLASP(Contrastive Language, Action, and State Pre-training)は,CLIPの定式化を拡張し,分散学習を取り入れ,振る舞いテキストアライメントにおける固有の複雑さと一対多の関係を捉える。
本手法は,ゼロショットテキストビヘイビア検索,未知のロボット動作のキャプション,言語条件の強化学習に先立って動作を学習する,といった下流作業に有効であることを示す。
論文 参考訳(メタデータ) (2023-04-21T07:19:33Z) - PADL: Language-Directed Physics-Based Character Control [66.517142635815]
本稿では,文字が行うべきハイレベルなタスクと低レベルなスキルを指定するために,ユーザが自然言語コマンドを発行できるようにするPADLを提案する。
我々は,シミュレーションされたヒューマノイドキャラクタを効果的に誘導し,多種多様な複雑な運動能力を実現するために,本フレームワークを適用した。
論文 参考訳(メタデータ) (2023-01-31T18:59:22Z) - Using Chatbots to Teach Languages [43.866863322607216]
我々のシステムは、ユーザの言語能力に即時に適応できる。
ユーザが誤りから学ぶのに役立つ自動文法エラーフィードバックを提供する。
我々の次のステップは、強化学習アルゴリズムを用いてユーザープロファイル情報に適応させることです。
論文 参考訳(メタデータ) (2022-07-31T07:01:35Z) - Grounding Hindsight Instructions in Multi-Goal Reinforcement Learning
for Robotics [14.863872352905629]
本稿では,自然言語の目標表現に対するスパース報酬を用いたロボット強化学習に焦点を当てた。
まず,専門家のフィードバックを生かした後向きの指示再生機構を提案する。
次に,言語的後見命令を生成するセク2seqモデルを提案する。
論文 参考訳(メタデータ) (2022-04-08T22:01:36Z) - GenNI: Human-AI Collaboration for Data-Backed Text Generation [102.08127062293111]
Table2Textシステムは、機械学習を利用した構造化データに基づいてテキスト出力を生成する。
GenNI (Generation Negotiation Interface) は、対話型ビジュアルシステムである。
論文 参考訳(メタデータ) (2021-10-19T18:07:07Z) - Learning Adaptive Language Interfaces through Decomposition [89.21937539950966]
本稿では,分解による新しいハイレベルな抽象化を学習するニューラルセマンティック解析システムを提案する。
ユーザは、新しい振る舞いを記述する高レベルな発話を低レベルなステップに分解することで、対話的にシステムを教える。
論文 参考訳(メタデータ) (2020-10-11T08:27:07Z) - On the interaction between supervision and self-play in emergent
communication [82.290338507106]
本研究は,2つのカテゴリの学習信号と,サンプル効率の向上を目標とする学習信号の関係について検討する。
人間のデータに基づく教師付き学習による初等訓練エージェントが,自己演奏が会話に優れていることが判明した。
論文 参考訳(メタデータ) (2020-02-04T02:35:19Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。