論文の概要: Decomposing the Prediction Problem; Autonomous Navigation by neoRL
Agents
- arxiv url: http://arxiv.org/abs/2106.15868v1
- Date: Wed, 30 Jun 2021 07:57:36 GMT
- ステータス: 処理完了
- システム内更新日: 2021-07-01 15:25:03.039649
- Title: Decomposing the Prediction Problem; Autonomous Navigation by neoRL
Agents
- Title(参考訳): 予測問題の分解;neorlエージェントによる自律ナビゲーション
- Authors: Per R. Leikanger
- Abstract要約: 世界をナビゲートすることは、あらゆる生物にとって基本的な能力である。
NRES-Oriented RL (neoRL) エージェントが理論的な発見を検証する前にどのように可能かを示す。
- 参考スコア(独自算出の注目度): 0.0
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Navigating the world is a fundamental ability for any living entity.
Accomplishing the same degree of freedom in technology has proven to be
difficult. The brain is the only known mechanism capable of voluntary
navigation, making neuroscience our best source of inspiration toward autonomy.
Assuming that state representation is key, we explore the difference in how the
brain and the machine represent the navigational state. Where Reinforcement
Learning (RL) requires a monolithic state representation in accordance with the
Markov property, Neural Representation of Euclidean Space (NRES) reflects
navigational state via distributed activation patterns. We show how
NRES-Oriented RL (neoRL) agents are possible before verifying our theoretical
findings by experiments. Ultimately, neoRL agents are capable of behavior
synthesis across state spaces -- allowing for decomposition of the problem into
smaller spaces, alleviating the curse of dimensionality.
- Abstract(参考訳): 世界を旅することはあらゆる生物にとって基本的な能力である。
同じ自由度を技術に適合させるのは難しいことが証明されている。
脳は自発的なナビゲーションが可能な唯一のメカニズムであり、神経科学を自律性へのインスピレーションの源としています。
その状態表現が重要であると仮定すると、脳と機械がどのようにナビゲーション状態を表すかの差を探索する。
Reinforcement Learning (RL) はマルコフの性質に応じてモノリシックな状態表現を必要とするが、ニューラル表現(Neural Representation of Euclidean Space)は、分散アクティベーションパターンを介してナビゲーション状態を反映する。
nres指向のrl (neorl) エージェントが実験により理論的知見を検証できることを示す。
最終的に、neorlエージェントは状態空間をまたいだ動作合成が可能であり、問題のより小さな空間への分解を可能にし、次元の呪いを緩和する。
関連論文リスト
- Artificial Kuramoto Oscillatory Neurons [65.16453738828672]
しきい値単位の動的代替として人工内蔵ニューロン(AKOrN)を導入する。
このアイデアは、幅広いタスクにまたがってパフォーマンス改善をもたらすことを示しています。
これらの経験的結果は、神経表現の最も基本的なレベルにおいて、私たちの仮定の重要性を示していると信じている。
論文 参考訳(メタデータ) (2024-10-17T17:47:54Z) - ReLUs Are Sufficient for Learning Implicit Neural Representations [17.786058035763254]
暗黙的神経表現学習におけるReLUアクティベーション関数の使用について再考する。
2次B-スプラインウェーブレットにインスパイアされ、ディープニューラルネットワーク(DNN)の各層にReLUニューロンに一連の簡単な制約を組み込む。
我々は、一般的な信念とは対照的に、ReLUニューロンのみからなるDNNに基づいて最先端のINRを学習できることを実証した。
論文 参考訳(メタデータ) (2024-06-04T17:51:08Z) - METRA: Scalable Unsupervised RL with Metric-Aware Abstraction [69.90741082762646]
Metric-Aware Abstraction (METRA)は、教師なし強化学習の新たな目標である。
潜在空間のあらゆる方向に移動することを学ぶことで、METRAは様々な振る舞いの抽出可能な集合を得る。
複雑なピクセルベースの環境においても,METRAは様々な有用な振る舞いを発見できることを示す。
論文 参考訳(メタデータ) (2023-10-13T06:43:11Z) - Emergence of Maps in the Memories of Blind Navigation Agents [68.41901534985575]
動物ナビゲーション研究は、生物が環境の空間的表現(地図)を構築、維持する、という仮説を定めている。
私たちはマシン、具体的には人工知能(AI)ナビゲーションエージェントが、暗黙の(あるいは「メンタル」な)マップを構築しているかどうか尋ねる。
動物ナビゲーションとは異なり、エージェントの知覚システムを司法的に設計し、学習パラダイムを制御して代替ナビゲーション機構を無効化することができる。
論文 参考訳(メタデータ) (2023-01-30T20:09:39Z) - Guaranteed Discovery of Controllable Latent States with Multi-Step
Inverse Models [51.754160866582005]
エージェント制御可能な状態探索アルゴリズム(AC-State)
アルゴリズムは多段階の逆モデル(遠方の観測から行動を予測する)と情報ボトルネックから構成される。
本稿では,3つの領域において制御可能な潜伏状態の発見を実証する。ロボットアームの局所化,他のエージェントとともに迷路を探索し,Matterportハウスシミュレーターをナビゲートする。
論文 参考訳(メタデータ) (2022-07-17T17:06:52Z) - Neuro-Nav: A Library for Neurally-Plausible Reinforcement Learning [2.060642030400714]
神経可塑性強化学習のためのオープンソースライブラリNeuro-Navを提案する。
Neuro-Navは、標準環境とRLアルゴリズムのセットを提供する。
このツールキットは認知科学とRL文学の両方にわたる多くの研究から、関連する知見を再現することを示した。
論文 参考訳(メタデータ) (2022-06-06T16:33:36Z) - Towards neoRL networks; the emergence of purposive graphs [0.0]
AIをパーポープするためのNeoRLフレームワークは、認識マップをエミュレートした潜在学習を実装している。
エージェントの報酬の期待は、考慮された空間で学習された投射として表現され、ネオRLエージェントはパーポーブな振る舞いを抽出することができる。
パーポーブネットワークが支配するネオRLエージェントは、学習中にユークリッド空間をリアルタイムでナビゲートすることができる。
論文 参考訳(メタデータ) (2022-02-25T11:19:05Z) - Navigating Conceptual Space; A new take on Artificial General
Intelligence [0.0]
高次元ユークリッド空間における自律ナビゲーションを実現するために,ネオRLナビゲーションが有効かどうかを検討する。
我々は,NeoRL学習がAIにおけるRLよりも生物学的学習に類似していることに気付き,エミュレートされた認知への道として概念空間のNeoRLナビゲーションを提案する。
論文 参考訳(メタデータ) (2022-02-19T17:16:22Z) - Learning Continuous Chaotic Attractors with a Reservoir Computer [0.0]
我々は1000ニューロンのRNNをトレーニングし、動的アトラクションメモリの分離例から連続的動的アトラクションメモリを抽象化する。
RCを安定な極限サイクルまたはカオス的なローレンツ引力の孤立およびシフトした例で訓練することにより、RCは、余剰のリャプノフ指数が 0 に等しいように、引力の連続性を学ぶ。
論文 参考訳(メタデータ) (2021-10-16T18:07:27Z) - Exploratory State Representation Learning [63.942632088208505]
本稿では,XSRL(eXploratory State Representation Learning)と呼ばれる新しい手法を提案する。
一方、コンパクトな状態表現と、その表現から不可解な情報を除去するために使用される状態遷移推定器を共同で学習する。
一方、逆モデルを継続的に訓練し、このモデルの予測誤差に$k$-stepの学習促進ボーナスを加え、発見ポリシーの目的を形成する。
論文 参考訳(メタデータ) (2021-09-28T10:11:07Z) - Abstract Spatial-Temporal Reasoning via Probabilistic Abduction and
Execution [97.50813120600026]
時空間推論は人工知能(AI)の課題である
最近の研究は、この種の抽象的推論タスクに焦点を当てている -- Raven's Progressive Matrices (RPM)
ニューロシンボリックな確率的アブダクションと実行学習者(PrAE)を提案する。
論文 参考訳(メタデータ) (2021-03-26T02:42:18Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。