論文の概要: How to Learn and Represent Abstractions: An Investigation using Symbolic
Alchemy
- arxiv url: http://arxiv.org/abs/2112.08360v1
- Date: Tue, 14 Dec 2021 19:35:20 GMT
- ステータス: 処理完了
- システム内更新日: 2021-12-18 11:56:13.722848
- Title: How to Learn and Represent Abstractions: An Investigation using Symbolic
Alchemy
- Title(参考訳): 抽象概念の学習と表現方法:シンボリック・錬金術を用いた検討
- Authors: Badr AlKhamissi, Akshay Srinivasan, Zeb-Kurth Nelson, Sam Ritter
- Abstract要約: シンボリック・錬金術は、興味深い抽象化を含むのに十分な新しいメタ学習環境であるが、きめ細かい分析を抽出できるほどシンプルである。
本研究では,Symbolic Alchemyを用いて,深部RLエージェントが様々な種類の抽象化を学習できるようにする設計選択を行う。
本稿では,脳内の抽象変数の表現をよりよく理解するために,メタRLとAlchemyを使用する次のステップについて論じる。
- 参考スコア(独自算出の注目度): 0.491574468325115
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Alchemy is a new meta-learning environment rich enough to contain interesting
abstractions, yet simple enough to make fine-grained analysis tractable.
Further, Alchemy provides an optional symbolic interface that enables meta-RL
research without a large compute budget. In this work, we take the first steps
toward using Symbolic Alchemy to identify design choices that enable deep-RL
agents to learn various types of abstraction. Then, using a variety of
behavioral and introspective analyses we investigate how our trained agents use
and represent abstract task variables, and find intriguing connections to the
neuroscience of abstraction. We conclude by discussing the next steps for using
meta-RL and Alchemy to better understand the representation of abstract
variables in the brain.
- Abstract(参考訳): Alchemyは、興味深い抽象化を含むのに十分な新しいメタ学習環境であるが、きめ細かい分析を抽出できるほどシンプルである。
さらに、alchemyは、大きな計算予算なしでメタrl研究を可能にするオプションのシンボリックインターフェースを提供する。
本研究では,Symbolic Alchemyを用いて,深部RLエージェントが様々な種類の抽象化を学習できるようにする設計選択を行う。
そして, 様々な行動分析, 内省的分析を用いて, 我々の訓練されたエージェントが, 抽象的タスク変数をどのように使用し, 表現しているかを調べ, 抽象の神経科学と興味深い関係を見出す。
本稿では,脳内の抽象変数の表現をよりよく理解するために,メタRLとAlchemyを使用する次のステップについて論じる。
関連論文リスト
- VisualPredicator: Learning Abstract World Models with Neuro-Symbolic Predicates for Robot Planning [86.59849798539312]
本稿では,記号的・神経的知識表現の強みを組み合わせた一階抽象言語Neuro-Symbolic Predicatesを提案する。
提案手法は, サンプルの複雑さの向上, 分布外一般化の強化, 解釈可能性の向上を実現する。
論文 参考訳(メタデータ) (2024-10-30T16:11:05Z) - How to Handle Sketch-Abstraction in Sketch-Based Image Retrieval? [120.49126407479717]
スケッチの抽象化を様々なレベルで処理できるスケッチベース画像検索フレームワークを提案する。
粒度レベルの抽象理解のために、検索モデルはすべての抽象レベルを等しく扱ってはならないと規定する。
私たちのAcc.@qの損失は、評価がいかに厳格であるかという点で、スケッチが焦点を絞りたり壊したりできます。
論文 参考訳(メタデータ) (2024-03-11T23:08:29Z) - AbsPyramid: Benchmarking the Abstraction Ability of Language Models with a Unified Entailment Graph [62.685920585838616]
抽象能力は人間の知性において必須であり、言語モデルでは未探索のままである。
本稿では、抽象知識の221Kテキスト記述を統一したエンテーメントグラフであるAbsPyramidを提案する。
論文 参考訳(メタデータ) (2023-11-15T18:11:23Z) - Symbolic Visual Reinforcement Learning: A Scalable Framework with
Object-Level Abstraction and Differentiable Expression Search [63.3745291252038]
DiffSESは、離散的なシンボルポリシーを発見する新しいシンボリック学習手法である。
生のピクセルレベルの入力の代わりにオブジェクトレベルの抽象化を使用することで、DiffSESはシンボリック表現の単純さとスケーラビリティの利点を活用することができる。
我々の実験は、DiffSESが最先端のシンボルRL法よりもシンプルでスケーラブルなシンボリックポリシーを生成することができることを示した。
論文 参考訳(メタデータ) (2022-12-30T17:50:54Z) - Noisy Symbolic Abstractions for Deep RL: A case study with Reward
Machines [23.15484341058261]
報酬関数がReward Machinesによってキャプチャされたシンボル言語で指定された場合、RLを介してポリシーを生成する方法について検討する。
雑音の象徴的な抽象概念を用いて、リワードマシンにおけるポリシー学習の問題を定式化する。
論文 参考訳(メタデータ) (2022-11-20T08:13:48Z) - Disentangling Abstraction from Statistical Pattern Matching in Human and
Machine Learning [14.789708642768968]
メタ強化学習パラダイムにおける人間とエージェントのパフォーマンスを比較した。
人間はメタメトリタスクよりも抽象的なタスクが得意であることが分かりました。
この研究は、人間と機械学習の違いを特徴づける基盤を提供する。
論文 参考訳(メタデータ) (2022-04-04T12:42:36Z) - Alchemy: A structured task distribution for meta-reinforcement learning [52.75769317355963]
本稿では,構造的リッチネスと構造的透明性を組み合わせたメタRL研究のための新しいベンチマークを提案する。
Alchemyは3Dビデオゲームで、エピソードからエピソードまで手続き的に再サンプリングされる潜伏した因果構造を含んでいる。
本稿では,アルケミーの強力なRL剤について検討し,その1つについて詳細な分析を行った。
論文 参考訳(メタデータ) (2021-02-04T23:40:44Z) - Learning Abstract Models for Strategic Exploration and Fast Reward
Transfer [85.19766065886422]
我々は,抽象状態のマルコフ決定過程(MDP)を正確に学習し,複雑なエラーを避ける。
本手法は,最も難易度の高い3つのアーケード学習環境ゲームにおいて,強力な結果をもたらす。
学習した抽象MDPを新しい報酬関数に再利用することができ、スクラッチから訓練されたモデルフリーメソッドよりも1000倍少ないサンプルで高い報酬が得られる。
論文 参考訳(メタデータ) (2020-07-12T03:33:50Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。