論文の概要: Achieving mouse-level strategic evasion performance using real-time
computational planning
- arxiv url: http://arxiv.org/abs/2211.02700v1
- Date: Fri, 4 Nov 2022 18:34:36 GMT
- ステータス: 処理完了
- システム内更新日: 2022-11-08 18:04:50.042616
- Title: Achieving mouse-level strategic evasion performance using real-time
computational planning
- Title(参考訳): リアルタイム計算計画を用いたマウスレベル戦略回避性能の実現
- Authors: German Espinosa, Gabrielle E. Wink, Alexander T. Lai, Daniel A.
Dombeck and Malcolm A. MacIver
- Abstract要約: 計画とは、脳が想像し、予測可能な未来を成立させる特別な能力である。
我々は,動物の生態が空間計画の価値をどのように支配するかという研究に基づいて,より効率的な生物学的に着想を得た計画アルゴリズムであるTLPPOを開発した。
TLPPOを用いたリアルタイムエージェントの性能とライブマウスの性能を比較し,ロボット捕食者を避けることを課題とする。
- 参考スコア(独自算出の注目度): 59.60094442546867
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Planning is an extraordinary ability in which the brain imagines and then
enacts evaluated possible futures. Using traditional planning models, computer
scientists have attempted to replicate this capacity with some level of success
but ultimately face a reoccurring limitation: as the plan grows in steps, the
number of different possible futures makes it intractable to determine the
right sequence of actions to reach a goal state. Based on prior theoretical
work on how the ecology of an animal governs the value of spatial planning, we
developed a more efficient biologically-inspired planning algorithm, TLPPO.
This algorithm allows us to achieve mouselevel predator evasion performance
with orders of magnitude less computation than a widespread algorithm for
planning in the situations of partial observability that typify predator-prey
interactions. We compared the performance of a real-time agent using TLPPO
against the performance of live mice, all tasked with evading a robot predator.
We anticipate these results will be helpful to planning algorithm users and
developers, as well as to areas of neuroscience where robot-animal interaction
can provide a useful approach to studying the basis of complex behaviors.
- Abstract(参考訳): 計画とは、脳が評価可能な未来を想像し、実行する、並外れた能力である。
従来の計画モデルを使用して、コンピュータ科学者はある程度の成功でこの能力の再現を試みたが、最終的には繰り返し制限に直面している。
動物生態学が空間計画の価値をどのように支配するかに関するこれまでの理論的研究に基づいて,より効率的な生物学的に着想を得た計画アルゴリズムであるTLPPOを開発した。
このアルゴリズムは,捕食者-捕食者の相互作用に代表される部分観測可能性の状況下での計画法よりも,マウスレベルの捕食者回避性能を桁違いに低い計算で実現できる。
我々は,tlppoを用いたリアルタイムエージェントの性能と,ロボット捕食者の回避に携わるマウスのパフォーマンスを比較した。
これらの結果は、アルゴリズムのユーザと開発者の計画だけでなく、ロボットと動物との相互作用が複雑な行動の基礎を研究するための有用なアプローチを提供する神経科学の領域にも役立つと予測している。
関連論文リスト
- Anticipate & Collab: Data-driven Task Anticipation and Knowledge-driven Planning for Human-robot Collaboration [13.631341660350028]
日々の生活活動において人間を支援するエージェントは、今後の課題を予測してより効果的に協力することができる。
データ駆動型手法はタスク予測、計画、関連する問題の最先端を表現しているが、これらの手法は資源不足と不透明である。
本稿では,人間とロボットのコラボレーションに向けたこれまでの取り組みを大幅に拡張するフレームワークであるDaTAPlanについて述べる。
論文 参考訳(メタデータ) (2024-04-04T16:52:48Z) - Learning Logic Specifications for Policy Guidance in POMDPs: an
Inductive Logic Programming Approach [57.788675205519986]
我々は任意の解法によって生成されるPOMDP実行から高品質なトレースを学習する。
我々は、データと時間効率のIndu Logic Programming(ILP)を利用して、解釈可能な信念に基づくポリシー仕様を生成する。
ASP(Answer Set Programming)で表現された学習は、ニューラルネットワークよりも優れた性能を示し、より少ない計算時間で最適な手作りタスクに類似していることを示す。
論文 参考訳(メタデータ) (2024-02-29T15:36:01Z) - AI planning in the imagination: High-level planning on learned abstract
search spaces [68.75684174531962]
我々は,エージェントが訓練中に学習する抽象的な検索空間において,エージェントが計画することを可能にする,PiZeroと呼ばれる新しい手法を提案する。
本研究では,旅行セールスマン問題,ソコバン問題,2048年,施設立地問題,パックマン問題など,複数の分野で評価を行った。
論文 参考訳(メタデータ) (2023-08-16T22:47:16Z) - On efficient computation in active inference [1.1470070927586016]
計算量を大幅に減らした有限時間地平線に対する新しい計画アルゴリズムを提案する。
また、新規かつ既存のアクティブな推論計画スキームに対して適切な目標分布を設定するプロセスを簡単にする。
論文 参考訳(メタデータ) (2023-07-02T07:38:56Z) - A Framework for Neurosymbolic Robot Action Planning using Large Language Models [3.0501524254444767]
本稿では,象徴的タスク計画と機械学習アプローチのギャップを埋めることを目的としたフレームワークを提案する。
大規模言語モデル(LLM)を計画ドメイン定義言語(PDDL)と互換性のあるニューロシンボリックタスクプランナーに訓練する根拠
選択されたドメインにおける予備的な結果から, (i) テストデータセットの95.5%の問題を1,000個のサンプルで解決し, (ii) 従来のシンボルプランナーよりも最大13.5%短いプランを作成し, (iii) 計画の可利用性の平均待ち時間を61.4%まで削減する。
論文 参考訳(メタデータ) (2023-03-01T11:54:22Z) - Hierarchical Imitation Learning with Vector Quantized Models [77.67190661002691]
我々は,専門家の軌跡におけるサブゴールの同定に強化学習を用いることを提案する。
同定されたサブゴールに対するベクトル量子化生成モデルを構築し,サブゴールレベルの計画を行う。
実験では、このアルゴリズムは複雑な長い水平決定問題の解法に優れ、最先端のアルゴリズムよりも優れている。
論文 参考訳(メタデータ) (2023-01-30T15:04:39Z) - It Takes Two: Learning to Plan for Human-Robot Cooperative Carrying [0.6981715773998527]
本研究では,協調型ロボットチームにおけるテーブルキャリング作業における現実的な動作計画の予測手法を提案する。
変動リカレントニューラルネットワーク(VRNN)を用いて、時間とともに人間のロボットチームの軌道の変動をモデル化する。
本モデルでは, ベースライン型集中型サンプリングベースプランナに比べて, より人間的な動きを生成できることを示す。
論文 参考訳(メタデータ) (2022-09-26T17:59:23Z) - Active Learning of Abstract Plan Feasibility [17.689758291966502]
本稿では,タスクに依存しない,好奇心を抱くロボットの探索を通じて,APF予測器を効率的に取得するための能動的学習手法を提案する。
アクティブラーニング戦略において,本システムでは,本システムでより少ないデータから学習できるように,実用不可能なサブシーケンス特性を活用して,候補計画の立案を行う。
物体が一様でない質量分布を持つ積層領域において,本システムは,400個の自己教師による相互作用において,APFモデルの実際のロボット学習を可能にすることを示す。
論文 参考訳(メタデータ) (2021-07-01T18:17:01Z) - Long-Horizon Visual Planning with Goal-Conditioned Hierarchical
Predictors [124.30562402952319]
未来に予測し、計画する能力は、世界で行動するエージェントにとって基本である。
視覚的予測と計画のための現在の学習手法は、長期的タスクでは失敗する。
本稿では,これらの制約を克服可能な視覚的予測と計画のためのフレームワークを提案する。
論文 参考訳(メタデータ) (2020-06-23T17:58:56Z) - Decentralized MCTS via Learned Teammate Models [89.24858306636816]
本稿では,モンテカルロ木探索に基づくトレーニング可能なオンライン分散計画アルゴリズムを提案する。
深層学習と畳み込みニューラルネットワークを用いて正確なポリシー近似を作成可能であることを示す。
論文 参考訳(メタデータ) (2020-03-19T13:10:20Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。