論文の概要: Towards Humanoid Robot Autonomy: A Dynamic Architecture Integrating Continuous thought Machines (CTM) and Model Context Protocol (MCP)
- arxiv url: http://arxiv.org/abs/2505.19339v1
- Date: Sun, 25 May 2025 22:12:35 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-05-27 16:58:43.060336
- Title: Towards Humanoid Robot Autonomy: A Dynamic Architecture Integrating Continuous thought Machines (CTM) and Model Context Protocol (MCP)
- Title(参考訳): 人間型ロボットの自律性に向けて:連続思考機械(CTM)とモデルコンテキストプロトコル(MCP)を統合する動的アーキテクチャ
- Authors: Libo Wang,
- Abstract要約: 本研究は,連続思考機械 (CTM) とモデルコンテキストプロトコル (MCP) を接続する動的アーキテクチャを設計する。
連続的な思考に基づくヒューマノイドロボットの自律的動的コーディングを探索し、人間のような自律行動を実現するための参照体験を提案する。
- 参考スコア(独自算出の注目度): 4.586907225774023
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: To address the gaps between the static pre-set "thinking-planning-action" of humanoid robots in unfamiliar scenarios and the highly programmed "call tool-return result" due to the lack of autonomous coding capabilities, this work designs a dynamic architecture connecting continuous thought machines (CTM) and model context protocol (MCP). It proposes a theoretical parallel solution through tick-slab and uses rank compression to achieve parameter suppression to provide a solution for achieving autonomous actions due to autonomous coding. The researcher used a simulation-based experiment using OpenAI's o4-mini-high as a tool to build the experimental environment, and introduced the extended SayCan dataset to conduct nine epochs of experiments. The experimental results show that the CTM-MCP architecture is feasible and effective through the data results of seven metrics: task success rate (TSR), execution success rate (ESR), average episode length (AEL), ROSCOE, REVEAL, proficiency self-assessment (PSA), task effectiveness (TE). In practice, it provides a reference experience for exploring the autonomous dynamic coding of humanoid robots based on continuous thinking to achieve human-like autonomous actions.
- Abstract(参考訳): 不慣れなシナリオにおけるヒューマノイドロボットの静的プレセット「思考計画」と、自律的なコーディング能力の欠如による高度にプログラムされた「コールツール・リターン結果」とのギャップに対処するため、本研究は連続思考機械(CTM)とモデルコンテキストプロトコル(MCP)を接続する動的アーキテクチャを設計する。
ダッチスラブによる理論的並列解を提案し,パラメータ抑制を実現するためにランク圧縮を用いて,自律的符号化による自律的な動作を実現するためのソリューションを提供する。
研究者はOpenAIのo4-mini-highを使ってシミュレーションベースの実験を実験環境を構築するツールとして使用し、9つのエポックな実験を行うために拡張されたSayCanデータセットを導入した。
実験の結果,CTM-MCPアーキテクチャは,タスク成功率(TSR),実行成功率(ESR),平均エピソード長(AEL),ROSCOE(ROSCOE),REVEAL(REVEAL),習熟自己評価(PSA),タスク有効性(TE)の7つの指標のデータから実現可能であることが示された。
実際に、人間のような自律的な行動を達成するための継続的な思考に基づいて、ヒューマノイドロボットの自律的動的コーディングを探索するためのリファレンス体験を提供する。
関連論文リスト
- EnerVerse-AC: Envisioning Embodied Environments with Action Condition [47.97500109323355]
EnerVerse-ACは、エージェントの予測されたアクションに基づいて将来の視覚的観察を生成するアクション条件の世界モデルである。
EVACは、多種多様なデータセットに人為的なトラジェクトリを拡張し、ポリシーテストのためのリアルでアクション条件のビデオ観察を生成する。
論文 参考訳(メタデータ) (2025-05-14T18:30:53Z) - Investigating the Effectiveness of a Socratic Chain-of-Thoughts Reasoning Method for Task Planning in Robotics, A Case Study [0.0]
本研究では,大規模言語モデル (LLM) が実世界の物理行動で複雑な空間的タスクをナビゲートできるかどうかを考察する。
我々は,Webots エンジンに擬似ティアゴロボットを組み込んだ GPT-4(Omni) をオブジェクト探索タスクに適用する。
予備的な結果は、チェーン・オブ・ソート推論と組み合わせることで、ソクラティック法が空間認識を必要とするロボットタスクのコード生成に利用できることを示している。
論文 参考訳(メタデータ) (2025-03-11T08:36:37Z) - PIVOT-R: Primitive-Driven Waypoint-Aware World Model for Robotic Manipulation [68.17081518640934]
ロボット操作のためのPrIrmitive-driVen waypOinT-aware world model(PIVOT-R)を提案する。
PIVOT-RはWAWM(Waypoint-aware World Model)と軽量アクション予測モジュールで構成される。
私たちのPIVOT-RはSeaWaveベンチマークで最先端のオープンソースモデルより優れており、4段階の命令タスクで平均19.45%の相対的な改善を実現しています。
論文 参考訳(メタデータ) (2024-10-14T11:30:18Z) - Navigating the Human Maze: Real-Time Robot Pathfinding with Generative Imitation Learning [0.0]
目標条件付き自己回帰モデルを導入し,個人間の複雑な相互作用を捉える。
このモデルは、潜在的なロボット軌道サンプルを処理し、周囲の個人の反応を予測する。
論文 参考訳(メタデータ) (2024-08-07T14:32:41Z) - Active Exploration in Bayesian Model-based Reinforcement Learning for Robot Manipulation [8.940998315746684]
ロボットアームのエンドタスクに対するモデルベース強化学習(RL)アプローチを提案する。
我々はベイズニューラルネットワークモデルを用いて、探索中に動的モデルに符号化された信念と情報の両方を確率論的に表現する。
実験により,ベイズモデルに基づくRL手法の利点が示された。
論文 参考訳(メタデータ) (2024-04-02T11:44:37Z) - Self-Improving Robots: End-to-End Autonomous Visuomotor Reinforcement
Learning [54.636562516974884]
模倣と強化学習において、人間の監督コストは、ロボットが訓練できるデータの量を制限する。
本研究では,自己改善型ロボットシステムのための新しい設計手法であるMEDAL++を提案する。
ロボットは、タスクの実施と解除の両方を学ぶことで、自律的にタスクを練習し、同時にデモンストレーションから報酬関数を推論する。
論文 参考訳(メタデータ) (2023-03-02T18:51:38Z) - Active Predicting Coding: Brain-Inspired Reinforcement Learning for
Sparse Reward Robotic Control Problems [79.07468367923619]
ニューラルジェネレーティブ・コーディング(NGC)の神経認知計算フレームワークによるロボット制御へのバックプロパゲーションフリーアプローチを提案する。
我々は、スパース報酬から動的オンライン学習を容易にする強力な予測符号化/処理回路から完全に構築されたエージェントを設計する。
提案するActPCエージェントは,スパース(外部)報酬信号に対して良好に動作し,複数の強力なバックプロップベースのRLアプローチと競合し,性能が優れていることを示す。
論文 参考訳(メタデータ) (2022-09-19T16:49:32Z) - Nonprehensile Riemannian Motion Predictive Control [57.295751294224765]
本稿では,リアル・ツー・シムの報酬分析手法を導入し,リアルなロボット・プラットフォームに対する行動の可能性を確実に予測する。
連続的なアクション空間でオブジェクトを反応的にプッシュするクローズドループコントローラを作成します。
我々は,RMPCが乱雑な環境だけでなく,乱雑な環境においても頑健であり,ベースラインよりも優れていることを観察した。
論文 参考訳(メタデータ) (2021-11-15T18:50:04Z) - Integrated Benchmarking and Design for Reproducible and Accessible
Evaluation of Robotic Agents [61.36681529571202]
本稿では,開発とベンチマークを統合した再現性ロボット研究の新しい概念について述べる。
このセットアップの中心的なコンポーネントの1つはDuckietown Autolabであり、これは比較的低コストで再現可能な標準化されたセットアップである。
本研究では,インフラを用いて実施した実験の再現性を解析し,ロボットのハードウェアや遠隔実験室間でのばらつきが低いことを示す。
論文 参考訳(メタデータ) (2020-09-09T15:31:29Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。