論文の概要: Using Natural Language and Program Abstractions to Instill Human
Inductive Biases in Machines
- arxiv url: http://arxiv.org/abs/2205.11558v1
- Date: Mon, 23 May 2022 18:17:58 GMT
- ステータス: 処理完了
- システム内更新日: 2022-05-29 10:01:23.193710
- Title: Using Natural Language and Program Abstractions to Instill Human
Inductive Biases in Machines
- Title(参考訳): 自然言語とプログラム抽象化を用いて機械に人間の帰納バイアスを注入する
- Authors: Sreejan Kumar, Carlos G. Correa, Ishita Dasgupta, Raja Marjieh,
Michael Y. Hu, Robert D. Hawkins, Nathaniel D. Daw, Jonathan D. Cohen,
Karthik Narasimhan, Thomas L. Griffiths
- Abstract要約: メタラーニングによって訓練されたエージェントは、人間とは全く異なる戦略をとる可能性がある。
これらのエージェントを自然言語のタスク記述から表現を予測し、そのようなタスクを生成するために誘導されるプログラムから学習することで、人間のような帰納的バイアスに導かれることを示す。
- 参考スコア(独自算出の注目度): 27.79626958016208
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Strong inductive biases are a key component of human intelligence, allowing
people to quickly learn a variety of tasks. Although meta-learning has emerged
as an approach for endowing neural networks with useful inductive biases,
agents trained by meta-learning may acquire very different strategies from
humans. We show that co-training these agents on predicting representations
from natural language task descriptions and from programs induced to generate
such tasks guides them toward human-like inductive biases. Human-generated
language descriptions and program induction with library learning both result
in more human-like behavior in downstream meta-reinforcement learning agents
than less abstract controls (synthetic language descriptions, program induction
without library learning), suggesting that the abstraction supported by these
representations is key.
- Abstract(参考訳): 強い帰納バイアスは人間の知性の重要な要素であり、様々なタスクを素早く学習することができる。
メタラーニングは、ニューラルネットワークに有用な誘導バイアスを与えるアプローチとして登場したが、メタラーニングによって訓練されたエージェントは、人間とは全く異なる戦略を取得する可能性がある。
これらのエージェントを自然言語のタスク記述から表現を予測し、そのようなタスクを生成するプログラムから学習することで、人間のような帰納的バイアスへと導くことを示す。
人為的な言語記述とライブラリ学習を伴うプログラム誘導は、抽象的な制御(合成言語記述、ライブラリ学習のないプログラムインダクション)よりも下流のメタ強化学習エージェントにおいて、より人間的な振る舞いをもたらす。
関連論文リスト
- Learning with Language-Guided State Abstractions [58.199148890064826]
高次元観測空間における一般化可能なポリシー学習は、よく設計された状態表現によって促進される。
我々の手法であるLGAは、自然言語の監視と言語モデルからの背景知識を組み合わせて、目に見えないタスクに適した状態表現を自動構築する。
シミュレーションされたロボットタスクの実験では、LGAは人間によって設計されたものと同様の状態抽象化をもたらすが、そのほんの少しの時間で得られる。
論文 参考訳(メタデータ) (2024-02-28T23:57:04Z) - Visual Grounding Helps Learn Word Meanings in Low-Data Regimes [53.7168869241458]
現代のニューラル言語モデル(LM)は、人間の文の生成と理解をモデル化するための強力なツールである。
しかし、これらの結果を得るためには、LMは明らかに非人間的な方法で訓練されなければならない。
より自然主義的に訓練されたモデルは、より人間らしい言語学習を示すのか?
本稿では,言語習得における重要なサブタスクである単語学習の文脈において,この問題を考察する。
論文 参考訳(メタデータ) (2023-10-20T03:33:36Z) - "No, to the Right" -- Online Language Corrections for Robotic
Manipulation via Shared Autonomy [70.45420918526926]
LILACは、実行中に自然言語の修正をオンラインで実施し、適応するためのフレームワークである。
LILACは人間とロボットを個別にターンテイクする代わりに、人間とロボットの間にエージェンシーを分割する。
提案手法は,タスク完了率が高く,ユーザによって主観的に好まれることを示す。
論文 参考訳(メタデータ) (2023-01-06T15:03:27Z) - Language Models as Inductive Reasoners [125.99461874008703]
本稿では,帰納的推論のための新しいパラダイム(タスク)を提案し,自然言語の事実から自然言語規則を誘導する。
タスクのための1.2kルールファクトペアを含むデータセットDEERを作成し,ルールと事実を自然言語で記述する。
我々は、事前訓練された言語モデルが自然言語の事実から自然言語規則をいかに誘導できるかを、初めてかつ包括的な分析を行う。
論文 参考訳(メタデータ) (2022-12-21T11:12:14Z) - What Artificial Neural Networks Can Tell Us About Human Language
Acquisition [47.761188531404066]
自然言語処理のための機械学習の急速な進歩は、人間がどのように言語を学ぶかについての議論を変革する可能性がある。
計算モデルによる学習可能性の関連性を高めるためには,人間に対して大きな優位性を持たず,モデル学習者を訓練する必要がある。
論文 参考訳(メタデータ) (2022-08-17T00:12:37Z) - Multitasking Inhibits Semantic Drift [46.71462510028727]
潜在言語政策(LLP)における学習のダイナミクスについて検討する。
LLPは長距離強化学習の課題を解くことができる。
これまでの研究では、LPPトレーニングは意味的ドリフトの傾向が見られた。
論文 参考訳(メタデータ) (2021-04-15T03:42:17Z) - Ask Your Humans: Using Human Instructions to Improve Generalization in
Reinforcement Learning [32.82030512053361]
本研究では、自然言語の指示や行動軌跡の形で、ステップバイステップの人間の実演を行うことを提案する。
人間のデモは、最も複雑なタスクを解決するのに役立ちます。
また、自然言語を組み込むことで、ゼロショット設定で未確認のタスクを一般化できることがわかった。
論文 参考訳(メタデータ) (2020-11-01T14:39:46Z) - Language-Conditioned Imitation Learning for Robot Manipulation Tasks [39.40937105264774]
本研究では,非構造化自然言語を模倣学習に組み込む手法を提案する。
訓練時には、専門家は、基礎となる意図を説明するために、言語記述とともにデモンストレーションを行うことができる。
トレーニングプロセスはこれらの2つのモードを相互に関連付け、言語、知覚、動きの相関を符号化する。
結果として得られた言語条件のvisuomotorポリシーは、実行時に新しいヒューマンコマンドと命令で条件付けできる。
論文 参考訳(メタデータ) (2020-10-22T21:49:08Z) - Human Instruction-Following with Deep Reinforcement Learning via
Transfer-Learning from Text [12.88819706338837]
近年の研究では、ニューラルネットワークベースのエージェントが強化学習によって訓練され、シミュレートされた世界で言語のようなコマンドを実行することが説明されている。
本稿では,人間の指示に頑健な深層RLを用いた指示追従エージェントの訓練方法を提案する。
論文 参考訳(メタデータ) (2020-05-19T12:16:58Z) - On the interaction between supervision and self-play in emergent
communication [82.290338507106]
本研究は,2つのカテゴリの学習信号と,サンプル効率の向上を目標とする学習信号の関係について検討する。
人間のデータに基づく教師付き学習による初等訓練エージェントが,自己演奏が会話に優れていることが判明した。
論文 参考訳(メタデータ) (2020-02-04T02:35:19Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。