Fugu-MT 論文翻訳(概要): Inferring Hierarchical Structure in Multi-Room Maze Environments

論文の概要: Inferring Hierarchical Structure in Multi-Room Maze Environments

arxiv url: http://arxiv.org/abs/2306.13546v1
Date: Fri, 23 Jun 2023 15:15:57 GMT
ステータス: 翻訳完了
システム内更新日: 2023-06-26 12:29:41.326265
Title: Inferring Hierarchical Structure in Multi-Room Maze Environments
Title（参考訳）: マルチルーム迷路環境における階層構造の推定
Authors: Daria de Tinguy, Toon Van de Maele, Tim Verbelen, Bart Dhoedt
Abstract要約: 本稿では,画素ベースの観測から世界の構造を推定する課題に対処する階層的アクティブ推論モデルを提案する。本稿では,好奇心を駆使した探索と目標志向の行動を組み合わせた認知マップ,アロセントリック,エゴセントリックな世界モデルからなる3層階層モデルを提案する。
参考スコア（独自算出の注目度）: 4.6956495676681484
License: http://creativecommons.org/publicdomain/zero/1.0/
Abstract: Cognitive maps play a crucial role in facilitating flexible behaviour by representing spatial and conceptual relationships within an environment. The ability to learn and infer the underlying structure of the environment is crucial for effective exploration and navigation. This paper introduces a hierarchical active inference model addressing the challenge of inferring structure in the world from pixel-based observations. We propose a three-layer hierarchical model consisting of a cognitive map, an allocentric, and an egocentric world model, combining curiosity-driven exploration with goal-oriented behaviour at the different levels of reasoning from context to place to motion. This allows for efficient exploration and goal-directed search in room-structured mini-grid environments.
Abstract（参考訳）: 認知地図は、環境内の空間的および概念的関係を表現することによって柔軟な行動を促進する上で重要な役割を果たす。環境の基盤構造を学習し、推測する能力は、効率的な探索と航海に不可欠である。本稿では,画素に基づく観測から世界の構造を推測する課題に対処する階層的アクティブ推論モデルを提案する。本稿では,認知マップ,アロセンティブ,エゴセントリックな世界モデルからなる3層階層型階層モデルを提案する。これにより、部屋構成のミニグリッド環境における効率的な探索と目標指向探索が可能になる。

関連論文リスト

Agentic Reasoning for Large Language Models [122.81018455095999]
推論は推論、問題解決、意思決定の基礎となる基本的な認知プロセスである。大規模言語モデル(LLM)は、クローズドワールド設定では強力な推論能力を示すが、オープンエンドおよび動的環境では苦労する。エージェント推論は、連続的な相互作用を計画し、行動し、学習する自律的なエージェントとしてLLMを解釈することでパラダイムシフトを示す。
論文参考訳（メタデータ） (2026-01-18T18:58:23Z)
From Perception to Cognition: A Survey of Vision-Language Interactive Reasoning in Multimodal Large Language Models [66.36007274540113]
MLLM(Multimodal Large Language Models)は、物理的世界に対する深い人間的な理解と相互作用を達成するための試みである。情報取得(知覚)や推論(認知)を行う際、しばしば浅く不整合な統合を示す。この調査では、新しい統合分析フレームワーク「知覚から認知へ」を紹介した。
論文参考訳（メタデータ） (2025-09-29T18:25:40Z)
Mind Meets Space: Rethinking Agentic Spatial Intelligence from a Neuroscience-inspired Perspective [53.556348738917166]
エージェントAIの最近の進歩は、自律的なタスク実行と言語に基づく推論が可能なシステムにつながっている。人間の空間知能は、統合された多感覚知覚、空間記憶、認知マップに根ざし、非構造環境における柔軟でコンテキスト対応の意思決定を可能にする。
論文参考訳（メタデータ） (2025-09-11T05:23:22Z)
From reactive to cognitive: brain-inspired spatial intelligence for embodied agents [50.99942960312313]
Brain-inspired Space Cognition for Navigation (BSC-Nav) は、エンボディエージェントにおける構造化空間メモリの構築と活用のための統合されたフレームワークである。 BSC-Navは、エゴセントリックな軌跡と文脈的手がかりからアロセントリックな認知マップを構築し、意味的目標に沿った空間的知識を動的に回収する。
論文参考訳（メタデータ） (2025-08-24T03:20:48Z)
Neuron: Learning Context-Aware Evolving Representations for Zero-Shot Skeleton Action Recognition [64.56321246196859]
本稿では,dUalスケルトン・セマンティック・セマンティック・セマンティック・セマンティック・シンジスティック・フレームワークを提案する。まず、時空間進化型マイクロプロトタイプを構築し、動的コンテキスト認識側情報を統合する。本研究では,空間的圧縮と時間的記憶機構を導入し,空間的時間的マイクロプロトタイプの成長を導く。
論文参考訳（メタデータ） (2024-11-18T05:16:11Z)
Learning Dynamic Cognitive Map with Autonomous Navigation [8.301959009586861]
生物にインスパイアされた原理に根ざした空間をナビゲートし、マッピングするための新しい計算モデルを導入する。我々のモデルは、予測されたポーズに対する動的に拡大する認知マップをActive Inferenceフレームワークに組み込んでいる。我々のモデルは、観測と世界次元に関する事前の知識なしにこれを達成し、複雑な環境をナビゲートする際の頑丈さと有効性を裏付ける。
論文参考訳（メタデータ） (2024-11-13T08:59:53Z)
Visual-Geometric Collaborative Guidance for Affordance Learning [63.038406948791454]
本稿では,視覚的・幾何学的手がかりを取り入れた視覚・幾何学的協調学習ネットワークを提案する。本手法は,客観的指標と視覚的品質の代表的なモデルより優れている。
論文参考訳（メタデータ） (2024-10-15T07:35:51Z)
Exploring and Learning Structure: Active Inference Approach in Navigational Agents [8.301959009586861]
動物は記憶、想像力、戦略的な意思決定を効率的に利用することで優れたナビゲーション能力を示す。生物にインスパイアされた原理に根ざしたナビゲーションとマッピングのための新しい計算モデルを導入する。
論文参考訳（メタデータ） (2024-08-12T08:17:14Z)
Dynamic planning in hierarchical active inference [0.0]
人間の脳が認知決定に関連する運動軌跡を推論し、導入する能力について述べる。本研究では,アクティブ推論における動的計画の話題に焦点を当てた。
論文参考訳（メタデータ） (2024-02-18T17:32:53Z)
Detecting Any Human-Object Interaction Relationship: Universal HOI Detector with Spatial Prompt Learning on Foundation Models [55.20626448358655]
本研究では,ビジョン・ランゲージ(VL)基礎モデルと大規模言語モデル(LLM)を用いて,オープンワールド環境におけるユニバーサルインタラクション認識について検討する。我々の設計にはHO Prompt-guided Decoder (HOPD) が含まれており、基礎モデルにおける高次関係表現と画像内の様々なHOペアとの結合を容易にする。オープンカテゴリの対話認識では,対話文と解釈文の2つのタイプがサポートされている。
論文参考訳（メタデータ） (2023-11-07T08:27:32Z)
Learning Spatial and Temporal Hierarchies: Hierarchical Active Inference for navigation in Multi-Room Maze Environments [8.301959009586861]
本稿では,画素ベースの観測から世界の構造を推定する課題に対処する階層的アクティブ推論モデルを提案する。本稿では,好奇心を駆使した探索と目標志向の行動を組み合わせた認知マップ,アロセントリック,エゴセントリックな世界モデルからなる3層階層モデルを提案する。
論文参考訳（メタデータ） (2023-09-18T15:24:55Z)
Unsupervised Discriminative Embedding for Sub-Action Learning in Complex Activities [54.615003524001686]
本稿では,複雑な活動における教師なしサブアクション学習の新たなアプローチを提案する。提案手法は,視覚表現と時間表現の両方を,サブアクションを識別的に学習する潜在空間にマッピングする。視覚-時空間埋め込みと判別的潜在概念の組み合わせにより,教師なし設定でロバストな動作表現を学習できることを示す。
論文参考訳（メタデータ） (2021-04-30T20:07:27Z)
Learning to Abstract and Predict Human Actions [60.85905430007731]
ビデオにおける人間の活動の階層構造をモデル化し,行動予測におけるそのような構造の効果を実証する。イベントの部分的階層を観察し、その構造を複数の抽象化レベルで将来の予測にロールアウトすることで、人間の活動の構造を学習できる階層型ニューラルネットワークであるHierarchical-Refresher-Anticipatorを提案する。
論文参考訳（メタデータ） (2020-08-20T23:57:58Z)
Object Goal Navigation using Goal-Oriented Semantic Exploration [98.14078233526476]
本研究は,未確認環境における対象カテゴリーのインスタンスにナビゲートするオブジェクトゴールナビゲーションの問題を研究する。本稿では,表層的なセマンティックマップを構築し,効率的に環境を探索する「ゴール指向セマンティック探索」というモジュールシステムを提案する。
論文参考訳（メタデータ） (2020-07-01T17:52:32Z)
Neural Topological SLAM for Visual Navigation [112.73876869904]
意味論を生かし、近似幾何学的推論を行う空間のトポロジ的表現を設計する。本稿では,ノイズのあるアクティベーションの下でそのような表現を構築し,維持し,使用することができる教師付き学習ベースアルゴリズムについて述べる。
論文参考訳（メタデータ） (2020-05-25T17:56:29Z)
Progressive growing of self-organized hierarchical representations for exploration [22.950651316748207]
中心的な課題は、発見された構造の地図を段階的に構築するために、どのように表現を学ぶかである。永続的な表現を構築し、探索プロセスを通して破滅的な忘れ物を避けることを目的としている。第三に、エージェントの発見を粗い方法で構造化できる表現をターゲットとする。
論文参考訳（メタデータ） (2020-05-13T15:24:42Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。