論文の概要: FurniMAS: Language-Guided Furniture Decoration using Multi-Agent System
- arxiv url: http://arxiv.org/abs/2507.04770v1
- Date: Mon, 07 Jul 2025 08:45:08 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-07-08 15:46:35.338001
- Title: FurniMAS: Language-Guided Furniture Decoration using Multi-Agent System
- Title(参考訳): FurniMAS:マルチエージェントシステムを用いた言語ガイド型家具装飾
- Authors: Toan Nguyen, Tri Le, Quang Nguyen, Anh Nguyen,
- Abstract要約: 家具の自動装飾システムFurniMASを提案する。
作業用デスクやテレビスタンドなどの家庭用家具品や人為的なプロンプトが与えられた場合,本システムでは,適切なスタイルや材料を用いて,関連資産を提案する。
FurniMASはLLMベースと非LLMエージェントのハイブリッドチームを編成し、それぞれが典型的な装飾プロジェクトにおいて異なる役割を担っている。
- 参考スコア(独自算出の注目度): 3.4031992938624693
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Furniture decoration is an important task in various industrial applications. However, achieving a high-quality decorative result is often time-consuming and requires specialized artistic expertise. To tackle these challenges, we explore how multi-agent systems can assist in automating the decoration process. We propose FurniMAS, a multi-agent system for automatic furniture decoration. Specifically, given a human prompt and a household furniture item such as a working desk or a TV stand, our system suggests relevant assets with appropriate styles and materials, and arranges them on the item, ensuring the decorative result meets functionality, aesthetic, and ambiance preferences. FurniMAS assembles a hybrid team of LLM-based and non-LLM agents, each fulfilling distinct roles in a typical decoration project. These agents collaborate through communication, logical reasoning, and validation to transform the requirements into the final outcome. Extensive experiments demonstrate that our FurniMAS significantly outperforms other baselines in generating high-quality 3D decor.
- Abstract(参考訳): 家具装飾は様々な産業用途において重要な課題である。
しかし、高品質な装飾的な結果を達成するには、しばしば時間がかかり、専門的な芸術的専門知識が必要である。
これらの課題に対処するために,マルチエージェントシステムによる装飾プロセスの自動化について検討する。
家具の自動装飾システムFurniMASを提案する。
具体的には,ヒトのプロンプトや作業机やテレビスタンドなどの家庭用家具について,適切なスタイルや素材で関連資産を提示し,それらを商品に配置し,装飾結果が機能性,美観,環境嗜好に合致することを保証する。
FurniMASはLLMベースと非LLMエージェントのハイブリッドチームを編成し、それぞれが典型的な装飾プロジェクトにおいて異なる役割を担っている。
これらのエージェントはコミュニケーション、論理的推論、検証を通じて協力し、要件を最終的な結果に変換する。
大規模な実験により、FurniMASは高品質な3Dデコーを発生させることで、他のベースラインを著しく上回ります。
関連論文リスト
- Multi-SpatialMLLM: Multi-Frame Spatial Understanding with Multi-Modal Large Language Models [70.41727912081463]
マルチモーダル大言語モデル(MLLM)は視覚タスクにおいて急速に進歩しているが、空間的理解は単一画像に限られている。
本研究では, 深度知覚, 視覚対応, 動的知覚を統合することで, MLLMを頑健なマルチフレーム空間理解と組み合わせる枠組みを提案する。
我々のモデルであるMulti-SpatialMLLMは、ベースラインやプロプライエタリシステムよりも大幅に向上し、スケーラブルで一般化可能なマルチフレーム推論を実証する。
論文 参考訳(メタデータ) (2025-05-22T17:59:39Z) - WorldCraft: Photo-Realistic 3D World Creation and Customization via LLM Agents [67.31920821192323]
大規模言語モデル(LLM)エージェントがプロシージャ生成を利用してオブジェクトを集約したシーンを生成するシステムであるWorldCraftを紹介する。
本フレームワークでは,コーディネータエージェントが全体の処理を管理し,シーン作成を完了させるために2つの特殊なLLMエージェントと連携する。
パイプラインには軌道制御エージェントが組み込まれており、ユーザはシーンをアニメーション化し、自然言語による対話を通じてカメラを操作することができる。
論文 参考訳(メタデータ) (2025-02-21T17:18:30Z) - LLM-based Multi-Agent Systems: Techniques and Business Perspectives [26.74974842247119]
マルチモーダル (multi-modal) な大規模言語モデルの時代において、ほとんどの操作プロセスは LLM エージェントを使って再構成および再生することができる。
発達の自然なトレンドとして、呼び出しツールは自律的なエージェントになりつつあるため、完全なインテリジェントシステムはLLMベースのマルチエージェントシステム(LaMAS)であることが判明した。
従来の単一LLMエージェントシステムと比較して、LaMASは、動的タスク分解と有機的特殊化の利点、システム変更の柔軟性の向上、および、各エンティティに対する収益化の実現可能性を有する。
論文 参考訳(メタデータ) (2024-11-21T11:36:29Z) - LLM-Agent-UMF: LLM-based Agent Unified Modeling Framework for Seamless Integration of Multi Active/Passive Core-Agents [0.0]
LLM-Agent-UMF(LLM-Agent-UMF)に基づく新しいエージェント統一モデリングフレームワークを提案する。
我々のフレームワークはLLMエージェントの異なるコンポーネントを区別し、LLMとツールを新しい要素であるコアエージェントから分離する。
我々は,13の最先端エージェントに適用し,それらの機能との整合性を実証することによって,我々の枠組みを評価する。
論文 参考訳(メタデータ) (2024-09-17T17:54:17Z) - An Interactive Agent Foundation Model [49.77861810045509]
本稿では,AIエージェントを訓練するための新しいマルチタスクエージェントトレーニングパラダイムを用いた対話型エージェント基礎モデルを提案する。
トレーニングパラダイムは、視覚マスク付きオートエンコーダ、言語モデリング、次世代の予測など、多様な事前学習戦略を統一する。
私たちは、ロボティクス、ゲームAI、ヘルスケアという3つの異なる領域でフレームワークのパフォーマンスを実演します。
論文 参考訳(メタデータ) (2024-02-08T18:58:02Z) - SPHINX: The Joint Mixing of Weights, Tasks, and Visual Embeddings for
Multi-modal Large Language Models [86.478087039015]
モデル重み、チューニングタスク、視覚埋め込みを併用した多目的多モード大言語モデル(MLLM)を提案する。
提案したジョイントミキシングに基づいて,高解像度画像のきめ細かい外観をより正確に捉えるための効率的な手法を提案する。
今後のMLLM研究におけるジョイントミキシングの探求に光を当てることを願っている。
論文 参考訳(メタデータ) (2023-11-13T18:59:47Z) - Recommender AI Agent: Integrating Large Language Models for Interactive
Recommendations [53.76682562935373]
我々は,LLMを脳として,レコメンダモデルをツールとして使用する,textbfInteRecAgentという効率的なフレームワークを紹介した。
InteRecAgentは会話レコメンデーションシステムとして満足度を達成し、汎用LLMよりも優れる。
論文 参考訳(メタデータ) (2023-08-31T07:36:44Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。