論文の概要: EmbodiedClaw: Conversational Workflow Execution for Embodied AI Development
- arxiv url: http://arxiv.org/abs/2604.13800v1
- Date: Wed, 15 Apr 2026 12:36:59 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-04-16 20:38:32.53286
- Title: EmbodiedClaw: Conversational Workflow Execution for Embodied AI Development
- Title(参考訳): EmbodiedClaw:Embodied AI開発のための会話型ワークフロー実行
- Authors: Xueyang Zhou, Yihan Sun, Xijie Gong, Guiyao Tie, Pan Zhou, Lichao Sun, Yongchao Chen,
- Abstract要約: Embodied AI研究は、シングルタスク、シングル環境ポリシー学習から、マルチタスク、マルチシーン、マルチモデル設定へと移行している。
本稿では,ユーザーが会話を通じて目標や制約を表現できる,AI開発のための新しいパラダイムを提案する。
EmbodiedClawは、高頻度で低コストな研究活動を実行可能なスキルに変える対話エージェントである。
- 参考スコア(独自算出の注目度): 29.75108279293246
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Embodied AI research is increasingly moving beyond single-task, single-environment policy learning toward multi-task, multi-scene, and multi-model settings. This shift substantially increases the engineering overhead and development time required for stages such as evaluation environment construction, trajectory collection, model training, and evaluation. To address this challenge, we propose a new paradigm for embodied AI development in which users express goals and constraints through conversation, and the system automatically plans and executes the development workflow. We instantiate this paradigm with EmbodiedClaw, a conversational agent that turns high-frequency, high-cost embodied research activities, including environment creation and revision, benchmark transformation, trajectory synthesis, model evaluation, and asset expansion, into executable skills. Experiments on end-to-end workflow tasks, capability-specific evaluations, human researcher studies, and ablations show that EmbodiedClaw reduces manual engineering effort while improving executability, consistency, and reproducibility. These results suggest a shift from manual toolchains to conversationally executable workflows for embodied AI development.
- Abstract(参考訳): Embodied AI研究は、シングルタスク、シングル環境ポリシー学習から、マルチタスク、マルチシーン、マルチモデル設定へと、ますます前進している。
このシフトは、評価環境の構築、軌道収集、モデルトレーニング、評価などの段階に必要なエンジニアリングオーバーヘッドと開発時間を大幅に増加させる。
この課題に対処するために、ユーザが会話を通じて目標や制約を表現し、システムが自動的に開発ワークフローを計画し実行する、AI開発のための新しいパラダイムを提案する。
EmbodiedClawは、環境生成とリビジョン、ベンチマーク変換、軌道合成、モデル評価、アセット拡張など、高頻度で高コストな研究活動を実行可能なスキルに変換する対話エージェントである。
エンドツーエンドのワークフロータスク、能力固有の評価、人間研究者の研究、そして改善の実験では、EmbodiedClawは、実行可能性、一貫性、再現性を改善しながら、手作業によるエンジニアリングの労力を削減する。
これらの結果は、手動ツールチェーンから、具体化されたAI開発のための会話実行ワークフローへの移行を示唆している。
関連論文リスト
- Automotive Engineering-Centric Agentic AI Workflow Framework [8.940446431523911]
本稿では,工学を制約付き,履歴対応のシーケンシャルな意思決定プロセスとしてモデル化する産業ビジョンフレームワークであるAgenic Engineering Intelligence(AEI)について述べる。
AEIは、エンジニアリングデータ処理とワークフローメモリ構築のためのオフラインフェーズと、ワークフロー状態の推定、検索、決定サポートのためのオンラインフェーズをリンクする。
論文 参考訳(メタデータ) (2026-04-09T04:22:18Z) - EmboCoach-Bench: Benchmarking AI Agents on Developing Embodied Robots [68.29056647487519]
Embodied AIは、高忠実度シミュレーションと大規模データ収集によって実現されている。
しかし、このスケーリング能力は、労働集約的な手作業の監視に依存しているため、いまだにボトルネックになっている。
実装ポリシーを自律的に構築するための LLM エージェントの能力を評価するベンチマークである textscEmboCoach-Bench を紹介する。
論文 参考訳(メタデータ) (2026-01-29T11:33:49Z) - Scaling Environments for LLM Agents in the Era of Learning from Interaction: A Survey [30.673419015614233]
エージェントは環境と直接対話し、強化学習を通じて経験から学ぶべきだという意見が高まりつつある。
本稿では,この反復処理をGEFループとして定式化し,環境がエージェントに挑戦するためのタスクを生成し,タスク実行中のエージェントの動作に応答して観察を返却し,その後の学習のためのロールアウトに対する評価フィードバックを提供する。
このパラダイムの下では、環境は経験的データの必須生産元として機能し、より複雑な、現実主義、対話性へのスケールの必要性を強調している。
論文 参考訳(メタデータ) (2025-11-12T12:56:25Z) - Cognitive Agents Powered by Large Language Models for Agile Software Project Management [0.0]
本稿では,大規模言語モデル(LLM)を利用した認知エージェントの大規模アジャイルフレームワーク(SAFe)への統合について検討する。
シミュレーションソフトウェア環境に仮想エージェントを配置することにより、ITプロジェクト開発における基本的な役割を果たす可能性を探る。
論文 参考訳(メタデータ) (2025-08-21T09:19:08Z) - AI Agentic Programming: A Survey of Techniques, Challenges, and Opportunities [8.086360127362815]
大規模言語モデル(LLM)ベースのコーディングエージェントは、コンパイラ、デバッガ、バージョン管理システムなどのツールを自律的に計画し、実行し、操作する。
従来のコード生成とは異なり、これらのエージェントは目標を分解し、多段階プロセスをコーディネートし、フィードバックに基づいて適応し、ソフトウェア開発のプラクティスを再構築する。
論文 参考訳(メタデータ) (2025-08-15T00:14:31Z) - Data Analysis in the Era of Generative AI [56.44807642944589]
本稿では,AIを活用したデータ分析ツールの可能性について考察する。
我々は、大規模言語とマルチモーダルモデルの出現が、データ分析ワークフローの様々な段階を強化する新しい機会を提供する方法について検討する。
次に、直感的なインタラクションを促進し、ユーザ信頼を構築し、AI支援分析ワークフローを複数のアプリにわたって合理化するための、人間中心の設計原則を調べます。
論文 参考訳(メタデータ) (2024-09-27T06:31:03Z) - The Foundations of Computational Management: A Systematic Approach to
Task Automation for the Integration of Artificial Intelligence into Existing
Workflows [55.2480439325792]
本稿では,タスク自動化の体系的アプローチである計算管理を紹介する。
この記事では、ワークフロー内でAIを実装するプロセスを開始するための、ステップバイステップの手順を3つ紹介する。
論文 参考訳(メタデータ) (2024-02-07T01:45:14Z) - Octopus: Embodied Vision-Language Programmer from Environmental Feedback [58.04529328728999]
身体視覚言語モデル(VLM)は多モード認識と推論において大きな進歩を遂げた。
このギャップを埋めるために、我々は、計画と操作を接続する媒体として実行可能なコード生成を使用する、具体化された視覚言語プログラマであるOctopusを紹介した。
Octopusは、1)エージェントの視覚的およびテキスト的タスクの目的を正確に理解し、2)複雑なアクションシーケンスを定式化し、3)実行可能なコードを生成するように設計されている。
論文 参考訳(メタデータ) (2023-10-12T17:59:58Z) - ChatDev: Communicative Agents for Software Development [84.90400377131962]
ChatDevはチャットを利用したソフトウェア開発フレームワークで、特別なエージェントがコミュニケーション方法についてガイドされる。
これらのエージェントは、統一された言語ベースのコミュニケーションを通じて、設計、コーディング、テストフェーズに積極的に貢献する。
論文 参考訳(メタデータ) (2023-07-16T02:11:34Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。