論文の概要: Scalable predictive processing framework for multitask caregiving robots
- arxiv url: http://arxiv.org/abs/2510.25053v1
- Date: Wed, 29 Oct 2025 00:39:09 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-10-30 15:50:44.885581
- Title: Scalable predictive processing framework for multitask caregiving robots
- Title(参考訳): マルチタスク介護ロボットのためのスケーラブルな予測処理フレームワーク
- Authors: Hayato Idei, Tamon Miyake, Tetsuya Ogata, Yuichi Yamashita,
- Abstract要約: 認知神経科学における一般的な理論は、人間の脳が階層的な予測処理によって機能することを示唆している。
本稿では,3万次元ビジュオ受容入力を直接統合可能な階層型マルチモーダルリカレントニューラルネットワークを提案する。
評価はシミュレーションに限られていたが、これらの結果は予測処理を普遍的でスケーラブルな計算原理として確立した。
- 参考スコア(独自算出の注目度): 5.192057728673088
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: The rapid aging of societies is intensifying demand for autonomous care robots; however, most existing systems are task-specific and rely on handcrafted preprocessing, limiting their ability to generalize across diverse scenarios. A prevailing theory in cognitive neuroscience proposes that the human brain operates through hierarchical predictive processing, which underlies flexible cognition and behavior by integrating multimodal sensory signals. Inspired by this principle, we introduce a hierarchical multimodal recurrent neural network grounded in predictive processing under the free-energy principle, capable of directly integrating over 30,000-dimensional visuo-proprioceptive inputs without dimensionality reduction. The model was able to learn two representative caregiving tasks, rigid-body repositioning and flexible-towel wiping, without task-specific feature engineering. We demonstrate three key properties: (i) self-organization of hierarchical latent dynamics that regulate task transitions, capture variability in uncertainty, and infer occluded states; (ii) robustness to degraded vision through visuo-proprioceptive integration; and (iii) asymmetric interference in multitask learning, where the more variable wiping task had little influence on repositioning, whereas learning the repositioning task led to a modest reduction in wiping performance, while the model maintained overall robustness. Although the evaluation was limited to simulation, these results establish predictive processing as a universal and scalable computational principle, pointing toward robust, flexible, and autonomous caregiving robots while offering theoretical insight into the human brain's ability to achieve flexible adaptation in uncertain real-world environments.
- Abstract(参考訳): 社会の急速な高齢化は、自律介護ロボットの需要を増大させているが、既存のシステムの多くはタスク固有であり、手作りの事前処理に依存しており、様々なシナリオにまたがる一般化能力を制限する。
認知神経科学における一般的な理論は、人間の脳が階層的な予測処理によって機能し、多モード感覚信号を統合することで柔軟な認知と行動の基盤となることを示唆している。
この原理に着想を得て,自由エネルギーの原理に基づいて予測処理を基礎とした階層型多モードリカレントニューラルネットワークを導入する。
モデルは、タスク固有の特徴工学を使わずに、剛体再構成とフレキシブル・タオル・ワイピングという2つの代表的な介護タスクを学習することができた。
3つの重要な特性を示します。
一 タスク遷移を規制し、不確実性の変動を捉え、閉塞状態を予測する階層的潜在力学の自己組織化
(二) 視力低下に対するビジュオ・プロプライオセプティヴな統合による堅牢性、及び
3) マルチタスク学習における非対称的干渉は, より可変なワイピングタスクが再配置にほとんど影響を与えなかったのに対し, 再配置タスクの学習は, ワイピング性能を緩やかに低下させ, モデル全体の堅牢性を維持した。
評価はシミュレーションに限られていたが、これらの結果は予測処理を普遍的でスケーラブルな計算原理として確立し、堅牢で柔軟で自律的な介護ロボットを指しながら、不確実な現実世界環境において柔軟な適応を実現する人間の脳の能力に関する理論的洞察を提供した。
関連論文リスト
- Multi-Modal Manipulation via Multi-Modal Policy Consensus [62.49978559936122]
本稿では,ロボット操作のための多様な感覚モダリティを統合するための新しいアプローチを提案する。
提案手法は,それぞれが単一の表現に特化している拡散モデルの集合にポリシーを分解する。
我々は、RLBenchにおけるシミュレーション操作タスクと、隠蔽対象のピック、手作業のスプーン再配向、パズル挿入といった実世界のタスクについて評価した。
論文 参考訳(メタデータ) (2025-09-27T19:43:04Z) - Industrial brain: a human-like autonomous neuro-symbolic cognitive decision-making system [8.351047624197255]
産業脳は人間のような自律的な認知的意思決定と計画の枠組みである。
高次のアクティビティ駆動ネットワークとCT-OODAシンボリック推論を、自律的なプランレジリエンスに統合する。
論文 参考訳(メタデータ) (2025-06-30T14:54:52Z) - Neural Brain: A Neuroscience-inspired Framework for Embodied Agents [78.61382193420914]
大規模な言語モデルのような現在のAIシステムは、いまだに解体され続けており、物理的に世界と関わりが持てない。
この課題の核心は、人間のような適応性を持つエンボディエージェントを駆動するために設計された中枢知能システムであるNeural Brain(ニューラル・ブレイン)の概念である。
本稿では,2つの基本的な課題に対処する,エンボディエージェントのニューラルブレインの統一的枠組みを提案する。
論文 参考訳(メタデータ) (2025-05-12T15:05:34Z) - Continuum-Interaction-Driven Intelligence: Human-Aligned Neural Architecture via Crystallized Reasoning and Fluid Generation [1.5800607910450124]
現在のAIシステムは、幻覚、予測不能、そして人間の意思決定と不一致といった課題に直面している。
本研究では、確率的生成(LLM)とホワイトボックスの手続き的推論(チェーン・オブ・シント)を統合し、解釈可能で、継続的な学習可能で、人間に準拠したAIシステムを構築する二チャンネルインテリジェントアーキテクチャを提案する。
論文 参考訳(メタデータ) (2025-04-12T18:15:49Z) - Imperative Learning: A Self-supervised Neuro-Symbolic Learning Framework for Robot Autonomy [31.818923556912495]
我々は,ロボット自律のための自己教師型ニューロシンボリック(NeSy)計算フレームワーク,インペラティブラーニング(IL)を導入する。
ILを2段階最適化(BLO)として定式化し、3つのモジュール間の相互学習を可能にする。
ILはロボットの自律性を大幅に向上させ、多様な領域にわたるさらなる研究を促進することを期待している。
論文 参考訳(メタデータ) (2024-06-23T12:02:17Z) - Disentangling the Causes of Plasticity Loss in Neural Networks [55.23250269007988]
可塑性の喪失は複数の独立したメカニズムに分解できることを示す。
種々の非定常学習タスクにおいて, 層正規化と重み劣化の組み合わせは, 可塑性維持に極めて有効であることを示す。
論文 参考訳(メタデータ) (2024-02-29T00:02:33Z) - Optimal input representation in neural systems at the edge of chaos [0.0]
私たちは、人工知能ニューラルネットワークを構築し、画像を分類するように訓練します。
我々は,ネットワークが臨界点付近で動作している場合に,そのようなタスクで最高の性能が得られることを見出した。
私たちは、ほぼ臨界に近い操作は、通常主張される美徳以外に、柔軟で堅牢で効率的な入力表現を可能にするという利点がある、と結論付けました。
論文 参考訳(メタデータ) (2021-07-12T19:55:03Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。