論文の概要: Exploratory Experience Shapes the Geometry of Predictive Representations
- arxiv url: http://arxiv.org/abs/2605.27929v1
- Date: Wed, 27 May 2026 04:01:33 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-05-28 17:38:55.736375
- Title: Exploratory Experience Shapes the Geometry of Predictive Representations
- Title(参考訳): 予測表現の幾何学を形作る探索的経験
- Authors: Kseniia Shilova, Abdelrahman Sharafeldin, Advay Balakrishnan, Hannah Choi,
- Abstract要約: 木のような迷路にオンライン学習エージェントを構築し,探索と搾取のバランスを制御可能なパラメータで制御する。
このモデルは将来の迷路状態と報奨確率の両方を予測し、エージェントは探索中に期待される情報ゲインまたは搾取時に予測される報奨によって行動を選択することができる。
得られた内部予測表現がエージェントの行動機構に強く依存していることが示される。
- 参考スコア(独自算出の注目度): 0.6999740786886536
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Active sensing links behavior and learning through an action-perception loop: actions determine the observations used to update internal predictive models of perception, which subsequently guide the next actions. Predictive-coding frameworks provide a natural way to model this process, since internal representations are continuously updated to predict future observations. Here, we ask how exploratory and exploitative behavioral strategies shape these internal predictive representations. We build an online learning agent in a tree-like maze with a controllable parameter regulating the balance between exploratory and exploitative regimes. The agent updates a predictive-coding-based perception model from experience generated by its own behavior. The model predicts both future maze states and reward probability, allowing the agent to select actions either by expected information gain during exploration or by predicted reward during exploitation. We show that the resulting internal predictive representations depend strongly on the agent's behavioral regime. Exploratory agents develop representations that are more spatially organized and better preserve the structure of maze transitions in latent space. In contrast, exploitative agents learn less organized representations. We then train this predictive model on natural trajectories of water-deprived mice navigating the same maze and compare the resulting representations with those learned from agent trajectories. More exploratory mice show representational geometries that closely match those of exploratory agents, whereas mice with more restricted visitation patterns resemble reward-driven, exploitative agents. Together, these findings suggest that exploration enables predictive models to form generalized internal representations by organizing latent space around both spatial location and transition context in artificial agents and animals.
- Abstract(参考訳): アクティブセンシングは行動知覚ループを通しての行動と学習をリンクする:行動は内部の知覚の予測モデルを更新するのに使用される観察値を決定し、次に次の行動を導く。
予測コーディングフレームワークは、将来の観測を予測するために内部表現を継続的に更新するため、このプロセスをモデル化するための自然な方法を提供する。
ここでは、探索的および搾取的行動戦略が、これらの内部予測表現をどのように形成するかを問う。
木のような迷路にオンライン学習エージェントを構築し,探索と搾取のバランスを制御可能なパラメータで制御する。
エージェントは、予測符号化に基づく知覚モデルを、自身の振る舞いによって生成された経験から更新する。
このモデルは将来の迷路状態と報奨確率の両方を予測し、エージェントは探索中に期待される情報ゲインまたは搾取時に予測される報奨によって行動を選択することができる。
得られた内部予測表現がエージェントの行動機構に強く依存していることが示される。
探索的エージェントは、より空間的に整理され、潜在空間における迷路遷移の構造をよりよく保存する表現を開発する。
対照的に、搾取的エージェントは、あまり組織化されていない表現を学習する。
次に、この予測モデルを、同じ迷路をナビゲートする水不足マウスの自然軌跡に基づいて訓練し、その結果の表現とエージェント軌跡から得られた表現を比較した。
より探索的なマウスは、探索的エージェントと密に一致する表現的ジオメトリーを示し、一方、より制限された訪問パターンを持つマウスは報酬駆動の、搾取的エージェントに類似している。
これらの結果から, 人工エージェントや動物において, 空間的位置および遷移状況の周辺に潜伏した空間を整理することにより, 予測モデルによる内部表現の一般化が可能であることが示唆された。
関連論文リスト
- LatentPilot: Scene-Aware Vision-and-Language Navigation by Dreaming Ahead with Latent Visual Reasoning [51.969318585152116]
LatentPilotは、トレーニング中の将来の観察を貴重なデータソースとして利用して、アクション条件付きビジュアルダイナミクスを学習する。
そこで本稿では,フライホイール方式のトレーニング機構を提案する。これは,道路上の軌道を反復的に収集し,エージェントの行動分布に適合するようにモデルを再訓練する。
R2R-CE、RxR-CE、R2R-PEベンチマークの実験では新たなSOTA結果が得られた。
論文 参考訳(メタデータ) (2026-03-31T02:21:59Z) - Future-Interactions-Aware Trajectory Prediction via Braid Theory [4.331354753582517]
本稿では,軌道予測タスクと並行して行われる新しい補助タスクである編曲予測を提案する。
編み込み予測タスクが将来の認識意図をモデルに注入し,より正確な共同予測を実現する方法を示す。
論文 参考訳(メタデータ) (2026-03-23T14:38:15Z) - Integrating Specialized and Generic Agent Motion Prediction with Dynamic Occupancy Grid Maps [3.3894571022475066]
本研究では,将来の占有状態グリッド,車両グリッド,シーンフローグリッドを同時に予測する統合フレームワークを提案する。
我々のアプローチは、グリッド間の依存関係をキャプチャし、様々な将来予測を可能にする、カスタマイズされた相互依存損失関数に重点を置いている。
実世界の nuScenes と Woven Planet のデータセットによる評価は、動的車両や一般的な動的シーン要素の予測性能に優れていた。
論文 参考訳(メタデータ) (2026-02-08T12:13:06Z) - Current Agents Fail to Leverage World Model as Tool for Foresight [61.82522354207919]
エージェントは、行動する前に結果を予測するためにそれらを使用できます。
本稿では,現在のエージェントがそのような世界モデルを,認知力を高めるツールとして活用できるかどうかを実証的に検討する。
論文 参考訳(メタデータ) (2026-01-07T13:15:23Z) - TRACE: A Self-Improving Framework for Robot Behavior Forecasting with Vision-Language Models [1.3408365072149797]
反応剤の短期的挙動を予測することは、多くのロボットシナリオにおいて重要である。
本稿では,ツリー・オブ・ソート・ジェネレーションとドメイン・アウェア・フィードバックを結合した推論フレームワークTRACEを提案する。
我々は,地上車両シミュレーションと実世界海面車両の両面においてTRACEを検証した。
論文 参考訳(メタデータ) (2025-03-02T06:58:02Z) - EgoAgent: A Joint Predictive Agent Model in Egocentric Worlds [119.02266432167085]
EgoAgentは単一変換器内での表現、予測、動作を同時に学習する統合エージェントモデルである。
EgoAgentは、タスクをインターリーブされた状態とアクションのシーケンスとして定式化することで、これらの能力間の因果的および時間的依存関係を明示的にモデル化する。
EgoAgentの画像分類,エゴセントリックな将来の状態予測,3次元人間の動作予測といった代表的課題に対する総合的な評価は,本手法の優位性を示している。
論文 参考訳(メタデータ) (2025-02-09T11:28:57Z) - Behavior-Inspired Neural Networks for Relational Inference [6.855586051080836]
エージェント間の相互作用が時間と空間の力学系をどのように進化させるかを研究する。
最近の研究は、エージェント間の関係を、その身体行動の観察に基づいて分類することを学ぶ。
エージェントの観測可能な振る舞いと,その動作を決定する潜在カテゴリの抽象化レベルを導入する。
論文 参考訳(メタデータ) (2024-06-20T21:36:54Z) - Finding Useful Predictions by Meta-gradient Descent to Improve
Decision-making [1.384055225262046]
我々は、一般値関数として表現される予測に焦点をあてる: 将来的な信号の蓄積の時間的拡張推定。
ひとつの課題は、エージェントが意思決定をサポートする可能性のある予測を、無限に多くの予測から決定することである。
これらの予測を手動で指定するのではなく、学習することにより、エージェントは自己管理的な方法で有用な予測を特定できる。
論文 参考訳(メタデータ) (2021-11-18T20:17:07Z) - You Mostly Walk Alone: Analyzing Feature Attribution in Trajectory
Prediction [52.442129609979794]
軌道予測のための最近の深層学習手法は有望な性能を示す。
そのようなブラックボックスモデルが実際にどのモデルを予測するために使うのかは、まだ不明である。
本稿では,モデル性能に対する異なるキューの貢献度を定量化する手法を提案する。
論文 参考訳(メタデータ) (2021-10-11T14:24:15Z) - Multi-Agent Imitation Learning with Copulas [102.27052968901894]
マルチエージェント模倣学習は、観察と行動のマッピングを学習することで、デモからタスクを実行するために複数のエージェントを訓練することを目的としている。
本稿では,確率変数間の依存を捉える強力な統計ツールである copula を用いて,マルチエージェントシステムにおける相関関係と協調関係を明示的にモデル化する。
提案モデルでは,各エージェントの局所的行動パターンと,エージェント間の依存構造のみをフルにキャプチャするコプラ関数を別々に学習することができる。
論文 参考訳(メタデータ) (2021-07-10T03:49:41Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。