論文の概要: Disentangling Abstraction from Statistical Pattern Matching in Human and
Machine Learning
- arxiv url: http://arxiv.org/abs/2204.01437v1
- Date: Mon, 4 Apr 2022 12:42:36 GMT
- ステータス: 処理完了
- システム内更新日: 2022-04-05 21:44:14.775383
- Title: Disentangling Abstraction from Statistical Pattern Matching in Human and
Machine Learning
- Title(参考訳): 人間と機械学習における統計的パターンマッチングからの抽象化
- Authors: Sreejan Kumar, Ishita Dasgupta, Raja Marjieh, Nathaniel D. Daw,
Jonathan D. Cohen, Thomas L. Griffiths
- Abstract要約: メタ強化学習パラダイムにおける人間とエージェントのパフォーマンスを比較した。
人間はメタメトリタスクよりも抽象的なタスクが得意であることが分かりました。
この研究は、人間と機械学習の違いを特徴づける基盤を提供する。
- 参考スコア(独自算出の注目度): 14.789708642768968
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: The ability to acquire abstract knowledge is a hallmark of human intelligence
and is believed by many to be one of the core differences between humans and
neural network models. Agents can be endowed with an inductive bias towards
abstraction through meta-learning, where they are trained on a distribution of
tasks that share some abstract structure that can be learned and applied.
However, because neural networks are hard to interpret, it can be difficult to
tell whether agents have learned the underlying abstraction, or alternatively
statistical patterns that are characteristic of that abstraction. In this work,
we compare the performance of humans and agents in a meta-reinforcement
learning paradigm in which tasks are generated from abstract rules. We define a
novel methodology for building "task metamers" that closely match the
statistics of the abstract tasks but use a different underlying generative
process, and evaluate performance on both abstract and metamer tasks. In our
first set of experiments, we found that humans perform better at abstract tasks
than metamer tasks whereas a widely-used meta-reinforcement learning agent
performs worse on the abstract tasks than the matched metamers. In a second set
of experiments, we base the tasks on abstractions derived directly from
empirically identified human priors. We utilize the same procedure to generate
corresponding metamer tasks, and see the same double dissociation between
humans and agents. This work provides a foundation for characterizing
differences between humans and machine learning that can be used in future work
towards developing machines with human-like behavior.
- Abstract(参考訳): 抽象的な知識を得る能力は人間の知能の目印であり、多くの人が人間とニューラルネットワークモデルの主な違いの1つだと信じている。
エージェントにはメタラーニングを通じて抽象化に対する帰納的バイアスが与えられ、学習と適用が可能な抽象構造を共有するタスクの分散についてトレーニングされる。
しかし、ニューラルネットワークは解釈が難しいため、エージェントが基盤となる抽象化を学んだかどうか、あるいはその抽象化の特徴である統計的パターンを判断することは困難である。
本研究では,タスクが抽象的なルールから生成されるメタ強化学習パラダイムにおいて,人間とエージェントのパフォーマンスを比較する。
抽象タスクの統計と密接に一致するが、異なる生成プロセスを用いる「タスクメタマー」を構築するための新しい方法論を定義し、抽象タスクとメタマータスクの両方のパフォーマンスを評価する。
最初の実験では,ヒトはメタメアのタスクよりも抽象的なタスクが優れているのに対して,広く使われているメタ強化学習エージェントは一致したメタメアよりも抽象的なタスクが優れていることがわかった。
第2の実験では、経験的に特定された人間の優先順位から直接導かれた抽象概念に基づいてタスクをベースとする。
我々は、同じ手順を用いて、対応するメタマータスクを生成し、人間とエージェントの二重解離を見る。
この研究は、人間と機械学習の違いを特徴付ける基礎を提供し、人間のような振る舞いを持つ機械の開発に将来の研究に使用できる。
関連論文リスト
- Offline Imitation Learning Through Graph Search and Retrieval [57.57306578140857]
模倣学習は、ロボットが操作スキルを取得するための強力な機械学習アルゴリズムである。
本稿では,グラフ検索と検索により,最適下実験から学習する,シンプルで効果的なアルゴリズムGSRを提案する。
GSRは、ベースラインに比べて10%から30%高い成功率、30%以上の熟練を達成できる。
論文 参考訳(メタデータ) (2024-07-22T06:12:21Z) - Self-Improving Robots: End-to-End Autonomous Visuomotor Reinforcement
Learning [54.636562516974884]
模倣と強化学習において、人間の監督コストは、ロボットが訓練できるデータの量を制限する。
本研究では,自己改善型ロボットシステムのための新しい設計手法であるMEDAL++を提案する。
ロボットは、タスクの実施と解除の両方を学ぶことで、自律的にタスクを練習し、同時にデモンストレーションから報酬関数を推論する。
論文 参考訳(メタデータ) (2023-03-02T18:51:38Z) - Learning Reward Functions for Robotic Manipulation by Observing Humans [92.30657414416527]
我々は、ロボット操作ポリシーのタスク非依存報酬関数を学習するために、幅広い操作タスクを解く人間のラベル付きビデオを使用する。
学習された報酬は、タイムコントラストの目的を用いて学習した埋め込み空間におけるゴールまでの距離に基づいている。
論文 参考訳(メタデータ) (2022-11-16T16:26:48Z) - Using Natural Language and Program Abstractions to Instill Human
Inductive Biases in Machines [27.79626958016208]
メタラーニングによって訓練されたエージェントは、人間とは全く異なる戦略をとる可能性がある。
これらのエージェントを自然言語のタスク記述から表現を予測し、そのようなタスクを生成するために誘導されるプログラムから学習することで、人間のような帰納的バイアスに導かれることを示す。
論文 参考訳(メタデータ) (2022-05-23T18:17:58Z) - Emergence of Machine Language: Towards Symbolic Intelligence with Neural
Networks [73.94290462239061]
本稿では、ニューラルネットワークを用いてシンボルとコネクショナリズムの原理を組み合わせることで、離散表現を導出することを提案する。
対話型環境とタスクを設計することにより、機械が自発的で柔軟でセマンティックな言語を生成できることを実証した。
論文 参考訳(メタデータ) (2022-01-14T14:54:58Z) - Combining Learning from Human Feedback and Knowledge Engineering to
Solve Hierarchical Tasks in Minecraft [1.858151490268935]
我々は2021年のNeurIPS Competition MineRL BASALT Challenge: Learning from Human Feedback in Minecraftで優勝し、最も人間らしいエージェントを受賞したソリューションを提示する。
我々のアプローチは、利用可能な人間の実演データを用いて、ナビゲーションのための模倣学習ポリシーを訓練する。
我々は、このハイブリッドインテリジェンスアプローチを、エンドツーエンドの機械学習と純粋にエンジニアリングされたソリューションの両方と比較し、人間の評価者によって判断される。
論文 参考訳(メタデータ) (2021-12-07T04:12:23Z) - Distribution Matching for Heterogeneous Multi-Task Learning: a
Large-scale Face Study [75.42182503265056]
マルチタスク学習は、共有学習アルゴリズムによって複数のタスクを共同で学習する方法論として登場した。
我々は異種mtlに対処し,検出,分類,回帰問題を同時に解決する。
大規模な顔分析のための最初のフレームワークであるFaceBehaviorNetを構築し、すべての顔行動タスクを共同で学習する。
論文 参考訳(メタデータ) (2021-05-08T22:26:52Z) - Learning Human Rewards by Inferring Their Latent Intelligence Levels in
Multi-Agent Games: A Theory-of-Mind Approach with Application to Driving Data [18.750834997334664]
我々は、人間は有理論的であり、他人の意思決定過程を推論する際に異なる知能レベルを持っていると論じる。
学習中の人間の潜在知能レベルを推論する,新しいマルチエージェント逆強化学習フレームワークを提案する。
論文 参考訳(メタデータ) (2021-03-07T07:48:31Z) - Meta-Learning of Structured Task Distributions in Humans and Machines [15.34209852089588]
メタラーニングの評価は依然として課題であり、メタラーニングが実際にタスク内に埋め込まれた構造を使っているかどうかを見逃すことができる。
我々は,モデルなし強化学習で訓練されたリカレントネットワークである標準的なメタ学習エージェントを訓練し,それを人間のパフォーマンスと比較する。
エージェントはNullタスク分布において優れているのに対し、構造化されたタスク分布では人間の方が優れている二重解離が見つかる。
論文 参考訳(メタデータ) (2020-10-05T20:18:10Z) - Machine Common Sense [77.34726150561087]
機械の常識は、人工知能(AI)において広範で潜在的に無拘束な問題のままである
本稿では、対人インタラクションのようなドメインに焦点を当てたコモンセンス推論のモデル化の側面について論じる。
論文 参考訳(メタデータ) (2020-06-15T13:59:47Z) - Transforming task representations to perform novel tasks [12.008469282323492]
知性の重要な側面は、直接の経験(ゼロショット)なしで新しいタスクに適応できる能力である。
本稿では,従来のタスクとの関係に基づいて,新しいタスクに適応するための一般的な計算フレームワークを提案する。
論文 参考訳(メタデータ) (2020-05-08T23:41:57Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。