論文の概要: Agentic Design of Compositional Machines
- arxiv url: http://arxiv.org/abs/2510.14980v1
- Date: Thu, 16 Oct 2025 17:59:58 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-10-17 21:15:15.013304
- Title: Agentic Design of Compositional Machines
- Title(参考訳): 合成機械のエージェント設計
- Authors: Wenqian Zhang, Weiyang Liu, Zhen Liu,
- Abstract要約: 大規模言語モデルが機械の創出を学べるかどうかを考察する。
BesiegeFieldは、マシンビルディングゲームBesiege上に作られたテストベッドだ。
エージェントによる最先端のLCMをベンチマークし、成功に必要な重要な機能を特定します。
- 参考スコア(独自算出の注目度): 26.167638081496914
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: The design of complex machines stands as both a marker of human intelligence and a foundation of engineering practice. Given recent advances in large language models (LLMs), we ask whether they, too, can learn to create. We approach this question through the lens of compositional machine design: a task in which machines are assembled from standardized components to meet functional demands like locomotion or manipulation in a simulated physical environment. To support this investigation, we introduce BesiegeField, a testbed built on the machine-building game Besiege, which enables part-based construction, physical simulation and reward-driven evaluation. Using BesiegeField, we benchmark state-of-the-art LLMs with agentic workflows and identify key capabilities required for success, including spatial reasoning, strategic assembly, and instruction-following. As current open-source models fall short, we explore reinforcement learning (RL) as a path to improvement: we curate a cold-start dataset, conduct RL finetuning experiments, and highlight open challenges at the intersection of language, machine design, and physical reasoning.
- Abstract(参考訳): 複雑な機械の設計は、人間の知性のマーカーであり、エンジニアリングの実践の基礎である。
大規模言語モデル(LLMs)の最近の進歩を考えると、それらも作成を学べるかどうかを問う。
本研究では, 機械を標準部品から組み立てて, 物理環境における移動や操作などの機能的要求を満たすタスクである構成機械設計のレンズを用いて, この疑問に対処する。
この調査を支援するために,BesiegeFieldを紹介した。Besiegeは,マシン構築ゲームBesiege上に構築されたテストベッドで,部品ベース構築,物理シミュレーション,報酬駆動評価を可能にする。
BesiegeFieldを用いてエージェントワークフローで最先端のLLMをベンチマークし、空間推論、戦略的アセンブリ、命令追従といった成功に必要な重要な機能を特定する。
コールドスタートデータセットをキュレートし、RL微調整実験を実施し、言語、マシンデザイン、物理的推論の交差点におけるオープンな課題を強調します。
関連論文リスト
- Large Language Models as Natural Selector for Embodied Soft Robot Design [5.023206838671049]
本稿では,大規模言語モデルがソフトロボット設計の表現を学習できるかどうかを評価する新しいベンチマークであるRoboCrafter-QAを紹介する。
実験の結果,これらのモデルが設計表現を学習する上で有望な能力を示す一方で,微妙な性能差を持つ設計の微妙な区別に苦慮していることが判明した。
論文 参考訳(メタデータ) (2025-03-04T03:55:10Z) - Specifications: The missing link to making the development of LLM systems an engineering discipline [65.10077876035417]
我々は、構造化出力、プロセスの監督、テストタイム計算など、これまでの分野の進歩について論じる。
モジュール型かつ信頼性の高いLCMシステムの開発に向けた研究の今後の方向性について概説する。
論文 参考訳(メタデータ) (2024-11-25T07:48:31Z) - On the Exploration of LM-Based Soft Modular Robot Design [26.847859137653487]
大規模言語モデル(LLM)は、現実世界の知識をモデル化する上で有望な能力を示した。
本稿では,LLMを用いてソフトモジュールロボットの設計を支援する可能性について検討する。
本モデルは,一方向・二方向・階段移動機能を有するソフトモジュールロボットの設計において,優れた評価性能を発揮する。
論文 参考訳(メタデータ) (2024-11-01T04:03:05Z) - DrEureka: Language Model Guided Sim-To-Real Transfer [64.14314476811806]
シミュレーションで学んだ政策を現実世界に伝達することは、ロボットのスキルを大規模に獲得する上で有望な戦略である。
本稿では,Large Language Models (LLMs) を用いてシム・トゥ・リアル設計の自動化と高速化を行う。
本手法では,ヨガボールの上を歩行する四足歩行や四足歩行など,新しいロボットタスクを解くことができる。
論文 参考訳(メタデータ) (2024-06-04T04:53:05Z) - DEAP: Design Space Exploration for DNN Accelerator Parallelism [0.0]
大規模言語モデル(LLM)はますます複雑で、訓練やサービスにも強力になっています。
本稿では、ハードウェアとソフトウェアの共同設計がどのように連携し、カスタマイズされたハードウェアシステムを構築するかを示す。
論文 参考訳(メタデータ) (2023-12-24T02:43:01Z) - Toward General-Purpose Robots via Foundation Models: A Survey and Meta-Analysis [82.59451639072073]
汎用ロボットはどんな環境でも、どんな物体でもシームレスに動作し、様々なスキルを使って様々なタスクをこなす。
コミュニティとしては、特定のタスク用に設計し、特定のデータセットでトレーニングし、特定の環境にデプロイすることで、ほとんどのロボットシステムを制約してきました。
ウェブスケールで大規模で大容量の事前学習型モデルの優れたオープンセット性能とコンテンツ生成能力に感銘を受けて,本調査は,汎用ロボティクスに基礎モデルを適用する方法について検討した。
論文 参考訳(メタデータ) (2023-12-14T10:02:55Z) - Octopus: Embodied Vision-Language Programmer from Environmental Feedback [58.04529328728999]
身体視覚言語モデル(VLM)は多モード認識と推論において大きな進歩を遂げた。
このギャップを埋めるために、我々は、計画と操作を接続する媒体として実行可能なコード生成を使用する、具体化された視覚言語プログラマであるOctopusを紹介した。
Octopusは、1)エージェントの視覚的およびテキスト的タスクの目的を正確に理解し、2)複雑なアクションシーケンスを定式化し、3)実行可能なコードを生成するように設計されている。
論文 参考訳(メタデータ) (2023-10-12T17:59:58Z) - Designing Machine Learning Toolboxes: Concepts, Principles and Patterns [0.0]
AIモデリングツールボックスの設計における重要なパターンについて概説する。
我々の分析では、既存のツールボックスの設計だけでなく、新しいツールボックスの開発も説明できます。
論文 参考訳(メタデータ) (2021-01-13T08:55:15Z) - CausalWorld: A Robotic Manipulation Benchmark for Causal Structure and
Transfer Learning [138.40338621974954]
CausalWorldは、ロボット操作環境における因果構造と伝達学習のベンチマークである。
タスクは、ブロックのセットから3D形状を構築することで構成される。
論文 参考訳(メタデータ) (2020-10-08T23:01:13Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。