論文の概要: Latent Perspective-Taking via a Schrödinger Bridge in Influence-Augmented Local Models
- arxiv url: http://arxiv.org/abs/2602.02857v1
- Date: Mon, 02 Feb 2026 22:05:23 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-03-23 08:17:41.113504
- Title: Latent Perspective-Taking via a Schrödinger Bridge in Influence-Augmented Local Models
- Title(参考訳): 影響付加型局所モデルにおけるシュレーディンガー橋による潜時視線追従
- Authors: Kevin Alcedo, Pedro U. Lima, Rachid Alami,
- Abstract要約: インフルエンサーベース抽象化に基づいて、インフルエンサー強化ローカルモデルを作成し、社会的に認識されたロボットタスクを局所力学に分解する。
このアーキテクチャにより、モデルに基づく強化学習において、エージェントが社会的に認識されたポリシーを合成できることが示される。
- 参考スコア(独自算出の注目度): 7.218497970427467
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Operating in environments alongside humans requires robots to make decisions under uncertainty. In addition to exogenous dynamics, they must reason over others' hidden mental-models and mental-states. While Interactive POMDPs and Bayesian Theory of Mind formulations are principled, exact nested-belief inference is intractable, and hand-specified models are brittle in open-world settings. We address both by learning structured mental-models and an estimator of others' mental-states. Building on the Influence-Based Abstraction, we instantiate an Influence-Augmented Local Model to decompose socially-aware robot tasks into local dynamics, social influences, and exogenous factors. We propose (a) a neuro-symbolic world model instantiating a factored, discrete Dynamic Bayesian Network, and (b) a perspective-shift operator modeled as an amortized Schrödinger Bridge over the learned local dynamics that transports factored egocentric beliefs into other-centric beliefs. We show that this architecture enables agents to synthesize socially-aware policies in model-based reinforcement learning, via decision-time mental-state planning (a Schrödinger Bridge in belief space), with preliminary results in a MiniGrid social navigation task.
- Abstract(参考訳): 人間と一緒に環境を運用するには、不確実性の下で決定を下すロボットが必要である。
外因性ダイナミクスに加えて、彼らは他人の隠れた精神モデルや精神状態について推論する必要がある。
Interactive POMDP と Bayesian Theory of Mind は原則として定式化されているが、正確なネスト・ビリーフ推論は難解であり、手特定モデルはオープンワールド環境では不安定である。
我々は、構造化された精神モデルを学ぶことと、他者の精神状態を評価することによって対処する。
インフルエンサーベース抽象化に基づいて、インフルエンサー強化ローカルモデルを作成し、社会的に認識されたロボットタスクを局所的ダイナミクス、社会的影響、外因性要因に分解する。
特集にあたって
(a)分解された離散的動的ベイズネットワークをインスタンス化するニューロシンボリック世界モデル及び
(b) 自我中心の信念を他中心の信念に伝達する学習された局所力学上のアモータライズされたシュレーディンガー橋としてモデル化されたパースペクティブシフト作用素。
このアーキテクチャにより、モデルに基づく強化学習において、エージェントは意思決定時精神状態計画(信仰空間のシュレーディンガーブリッジ)を通じて社会的に認識されたポリシーを合成することができ、MiniGridソーシャルナビゲーションタスクの予備的な結果が得られることを示す。
関連論文リスト
- Social World Model-Augmented Mechanism Design Policy Learning [58.739456918502704]
SWM-AP (Social World Model-Augmented Mechanism Design Policy Learning) を導入する。
SWM-APは,累積報酬とサンプル効率において,モデルベースおよびモデルフリーのRLベースラインよりも優れていた。
論文 参考訳(メタデータ) (2025-10-22T06:01:21Z) - WoW: Towards a World omniscient World model Through Embodied Interaction [83.43543124512719]
世界モデルの正当性的な物理的直観は、現実世界との広範囲で因果的に豊かな相互作用に基礎を置いていなければならない。
このWoWは、200万のロボットインタラクショントラジェクトリに基づいてトレーニングされた、ジェネレーティブな世界モデルである。
WoWBenchは、ビデオの物理的一貫性と因果推論に焦点を当てた新しいベンチマークである。
論文 参考訳(メタデータ) (2025-09-26T17:59:07Z) - Active Inference AI Systems for Scientific Discovery [1.450405446885067]
この観点では、進歩は抽象論、推論、経験的根拠の3つのギャップを互いに強化する。
デザイン原則は、想像空間を推論し、世界から学ぶシステムのために提案されている。
論文 参考訳(メタデータ) (2025-06-26T14:43:04Z) - Neural Brain: A Neuroscience-inspired Framework for Embodied Agents [78.61382193420914]
大規模な言語モデルのような現在のAIシステムは、いまだに解体され続けており、物理的に世界と関わりが持てない。
この課題の核心は、人間のような適応性を持つエンボディエージェントを駆動するために設計された中枢知能システムであるNeural Brain(ニューラル・ブレイン)の概念である。
本稿では,2つの基本的な課題に対処する,エンボディエージェントのニューラルブレインの統一的枠組みを提案する。
論文 参考訳(メタデータ) (2025-05-12T15:05:34Z) - Perspective-Shifted Neuro-Symbolic World Models: A Framework for Socially-Aware Robot Navigation [7.218497970427467]
ソーシャルナビゲーションのためのニューロシンボリックモデルに基づく強化学習アーキテクチャを提案する。
部分的に観察可能な環境における信念追跡の課題に対処する。
また,信念推定のための視点シフト演算子を提案する。
論文 参考訳(メタデータ) (2025-03-26T10:59:08Z) - Causal World Models by Unsupervised Deconfounding of Physical Dynamics [20.447000858907646]
世界の精神モデルで内部を想像する能力は、人間の認知にとって極めて重要である。
本稿では,相互関係の教師なしモデリングを可能にするCausal World Models(CWMs)を提案する。
強化学習タスクの複雑性サンプルの削減と、反実物的推論の改善を示します。
論文 参考訳(メタデータ) (2020-12-28T13:44:36Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。