論文の概要: From Idea to Co-Creation: A Planner-Actor-Critic Framework for Agent Augmented 3D Modeling
- arxiv url: http://arxiv.org/abs/2601.05016v1
- Date: Thu, 08 Jan 2026 15:18:12 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-01-09 17:01:53.248919
- Title: From Idea to Co-Creation: A Planner-Actor-Critic Framework for Agent Augmented 3D Modeling
- Title(参考訳): アイデアからコクレーションへ:エージェント強化3次元モデリングのためのプランナー・アクター・クライブフレームワーク
- Authors: Jin Gao, Saichandu Juluri,
- Abstract要約: 本稿では,アクター・クリティカル・アーキテクチャを,マルチエージェント・セルフリフレクションとヒューマン・イン・ザ・ループ・イン・ループ・イン・ループ(Human-in-the-loop)による創造的な3Dモデリングに拡張するフレームワークを提案する。
この設計では、Plannerはモデリングステップをコーディネートし、アクターはそれらを実行し、批判は反復的なフィードバックを提供する。
- 参考スコア(独自算出の注目度): 13.750761293338854
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: We present a framework that extends the Actor-Critic architecture to creative 3D modeling through multi-agent self-reflection and human-in-the-loop supervision. While existing approaches rely on single-prompt agents that directly execute modeling commands via tools like Blender MCP, our approach introduces a Planner-Actor-Critic architecture. In this design, the Planner coordinates modeling steps, the Actor executes them, and the Critic provides iterative feedback, while human users act as supervisors and advisors throughout the process. Through systematic comparison between single-prompt modeling and our reflective multi-agent approach, we demonstrate improvements in geometric accuracy, aesthetic quality, and task completion rates across diverse 3D modeling scenarios. Our evaluation reveals that critic-guided reflection, combined with human supervisory input, reduces modeling errors and increases complexity and quality of the result compared to direct single-prompt execution. This work establishes that structured agent self-reflection, when augmented by human oversight and advisory guidance, produces higher-quality 3D models while maintaining efficient workflow integration through real-time Blender synchronization.
- Abstract(参考訳): 本稿では,アクター・クリティカル・アーキテクチャを,マルチエージェント・セルフリフレクションとヒューマン・イン・ザ・ループ・イン・ループ・イン・ループ・イン・サスペクションを通じて,創造的な3Dモデリングに拡張するフレームワークを提案する。
既存のアプローチでは、Blender MCPのようなツールを介して直接モデリングコマンドを実行する単一プロンプトエージェントに依存していますが、我々のアプローチではPlanner-Actor-Criticアーキテクチャを導入しています。
この設計では、Plannerはモデリングステップをコーディネートし、アクターはそれらを実行し、批判は反復的なフィードバックを提供する。
単一プロンプトモデルと反射型マルチエージェント手法の体系的比較により, 多様な3次元モデリングシナリオにおける幾何学的精度, 審美的品質, タスク完了率の改善が示された。
評価の結果,批判誘導反射と人間の監督的入力が組み合わさって,モデル誤差を低減し,直接単発実行と比較して複雑さと品質を増大させることがわかった。
この研究は、構造化エージェントの自己回帰が、人間の監視とアドバイザリガイダンスによって強化されると、より高品質な3Dモデルが生成され、リアルタイムブレンダー同期による効率的なワークフロー統合が維持されることを示す。
関連論文リスト
- Agent2World: Learning to Generate Symbolic World Models via Adaptive Multi-Agent Feedback [51.22403664895878]
Agent2Worldは、強力な推論時ワールドモデル生成を実現するツール拡張マルチエージェントフレームワークである。
また、マルチエージェントフィードバックの生成を基盤にすることで、教師付き微調整のためのデータエンジンとしても機能する。
論文 参考訳(メタデータ) (2025-12-26T18:54:14Z) - ARTDECO: Towards Efficient and High-Fidelity On-the-Fly 3D Reconstruction with Structured Scene Representation [44.75113949778924]
ARTDECOは、フィードフォワードモデルの効率とSLAMベースのパイプラインの信頼性を組み合わせた統合フレームワークである。
ARTDECOはSLAMに匹敵するインタラクティブな性能、フィードフォワードシステムに類似した堅牢性、シーンごとの最適化に近い再現品質を提供する。
論文 参考訳(メタデータ) (2025-10-09T17:57:38Z) - A Multidisciplinary Design and Optimization (MDO) Agent Driven by Large Language Models [7.509742996975501]
大規模言語モデル(LLM)によって駆動されるマルチディシプリナ・デザイン・最適化(MDO)エージェントを提案する。
エージェントは、(i)自然言語駆動パラメトリックモデリング、(ii)知識基底概念化のための検索拡張生成(RAG)、(iii)パフォーマンス検証と最適化のためのエンジニアリングソフトウェアのインテリジェントなオーケストレーションという3つのコア機能を編成することで、エンドツーエンドのワークフローを半自動化する。
論文 参考訳(メタデータ) (2025-10-06T01:26:55Z) - Human-in-the-Loop: Quantitative Evaluation of 3D Models Generation by Large Language Models [0.0]
本稿では,大規模言語モデルの生成した3次元モデルの定量的評価のためのループ・フレームワークの人間について紹介する。
本稿では, 体積精度, 表面アライメント, 次元忠実度, トポロジ的複雑度など, 類似度と複雑性の総合的な指標スイートを提案する。
本研究は,コードレベルが完璧に再構築され,意味的豊かさが向上し,生成精度が向上したことを示す。
論文 参考訳(メタデータ) (2025-09-06T11:04:15Z) - Unifying Correspondence, Pose and NeRF for Pose-Free Novel View Synthesis from Stereo Pairs [57.492124844326206]
この研究は、3次元視覚における挑戦的で先駆的な課題であるステレオペアからのポーズレスノベルビュー合成の課題に踏み込んだ。
我々の革新的なフレームワークは、これまでとは違って、シームレスに2D対応マッチング、カメラポーズ推定、NeRFレンダリングを統合し、これらのタスクの相乗的強化を促進します。
論文 参考訳(メタデータ) (2023-12-12T13:22:44Z) - 3D-GPT: Procedural 3D Modeling with Large Language Models [47.72968643115063]
命令駆動3Dモデリングのための大規模言語モデル(LLM)を利用するフレームワークである3D-GPTを紹介する。
3D-GPTは、3Dモデリングタスクをアクセス可能なセグメントに分割し、各タスクにアプエージェントを割り当てる。
我々の実証調査では、3D-GPTが解釈し、指示を実行し、信頼性の高い結果を提供するだけでなく、人間デザイナーと効果的に協力することを確認した。
論文 参考訳(メタデータ) (2023-10-19T17:41:48Z) - PaMIR: Parametric Model-Conditioned Implicit Representation for
Image-based Human Reconstruction [67.08350202974434]
本研究では,パラメトリックボディモデルと自由形深部暗黙関数を組み合わせたパラメトリックモデル記述型暗黙表現(PaMIR)を提案する。
本手法は, 挑戦的なポーズや衣料品のタイプにおいて, 画像に基づく3次元再構築のための最先端性能を実現する。
論文 参考訳(メタデータ) (2020-07-08T02:26:19Z) - Kinematic-Structure-Preserved Representation for Unsupervised 3D Human
Pose Estimation [58.72192168935338]
大規模インスタディオデータセットの監視を用いて開発された人間のポーズ推定モデルの一般化可能性については疑問が残る。
本稿では,2対あるいは2対の弱い監督者によって抑制されない,新しいキネマティック構造保存型非教師付き3次元ポーズ推定フレームワークを提案する。
提案モデルでは,前方運動学,カメラ投影,空間マップ変換という3つの連続的な微分可能変換を用いる。
論文 参考訳(メタデータ) (2020-06-24T23:56:33Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。