論文の概要: ComfyUI-Copilot: An Intelligent Assistant for Automated Workflow Development
- arxiv url: http://arxiv.org/abs/2506.05010v1
- Date: Thu, 05 Jun 2025 13:20:50 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-06-06 21:53:49.724232
- Title: ComfyUI-Copilot: An Intelligent Assistant for Automated Workflow Development
- Title(参考訳): ComfyUI-Copilot: 自動化ワークフロー開発のためのインテリジェントアシスタント
- Authors: Zhenran Xu, Xue Yang, Yiyu Wang, Qingli Hu, Zijiao Wu, Longyue Wang, Weihua Luo, Kaifu Zhang, Baotian Hu, Min Zhang,
- Abstract要約: ComfyUI-CopilotはComfyUI用の大規模な言語モデル駆動プラグインである。
インテリジェントなノードとモデルレコメンデーションとワンクリックワークフローの自動構築を提供する。
オフラインの定量的評価とオンラインユーザフィードバックによるComfyUI-Copilotの有効性を検証する。
- 参考スコア(独自算出の注目度): 45.78818581469798
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: We introduce ComfyUI-Copilot, a large language model-powered plugin designed to enhance the usability and efficiency of ComfyUI, an open-source platform for AI-driven art creation. Despite its flexibility and user-friendly interface, ComfyUI can present challenges to newcomers, including limited documentation, model misconfigurations, and the complexity of workflow design. ComfyUI-Copilot addresses these challenges by offering intelligent node and model recommendations, along with automated one-click workflow construction. At its core, the system employs a hierarchical multi-agent framework comprising a central assistant agent for task delegation and specialized worker agents for different usages, supported by our curated ComfyUI knowledge bases to streamline debugging and deployment. We validate the effectiveness of ComfyUI-Copilot through both offline quantitative evaluations and online user feedback, showing that it accurately recommends nodes and accelerates workflow development. Additionally, use cases illustrate that ComfyUI-Copilot lowers entry barriers for beginners and enhances workflow efficiency for experienced users. The ComfyUI-Copilot installation package and a demo video are available at https://github.com/AIDC-AI/ComfyUI-Copilot.
- Abstract(参考訳): 我々は、AI駆動アート作成のためのオープンソースのプラットフォームであるComfyUIのユーザビリティと効率を高めるために設計された、大規模な言語モデル駆動プラグインであるComfyUI-Copilotを紹介した。
柔軟性とユーザフレンドリなインターフェースにもかかわらず、ComfyUIはドキュメントの限定、モデルのミスコンフィグレーション、ワークフロー設計の複雑さといった課題を新参者に提示することができる。
ComfyUI-Copilotは、インテリジェントなノードとモデルレコメンデーションを提供することによって、これらの課題に対処する。
その中核となるのは、タスクデリゲートのための中央アシスタントエージェントと、異なる用途のための特別なワーカーエージェントからなる階層的なマルチエージェントフレームワークで、デバッグとデプロイメントの合理化を図っているComfyUIナレッジベースによってサポートされています。
オフライン定量評価とオンラインユーザフィードバックの両方を用いて,ComfyUI-Copilotの有効性を検証する。
さらにユースケースは、ComfyUI-Copilotが初心者の参入障壁を低くし、経験豊富なユーザのワークフロー効率を向上することを示している。
ComfyUI-Copilotインストールパッケージとデモビデオはhttps://github.com/AIDC-AI/ComfyUI-Copilotで公開されている。
関連論文リスト
- AgentCPM-GUI: Building Mobile-Use Agents with Reinforcement Fine-Tuning [82.42421823672954]
AgentCPM-GUIは、堅牢で効率的なオンデバイスGUIインタラクションのために構築されている。
私たちのトレーニングパイプラインには、知覚を高めるためのグラウンドアウェア事前トレーニングが含まれています。
AgentCPM-GUIは5つの公開ベンチマークで最先端のパフォーマンスを達成する。
論文 参考訳(メタデータ) (2025-06-02T07:30:29Z) - Modeling and Optimizing User Preferences in AI Copilots: A Comprehensive Survey and Taxonomy [5.985777189633703]
AIコパイロは、複雑でコンテキストに富んだタスクでユーザを支援するように設計された、AI駆動システムの新世代を表す。
このパーソナライゼーションの中心は、好みの最適化である。システムの個々のユーザの好みを検出し、解釈し、調整する能力である。
この調査は、AIコパイロにおけるユーザの嗜好がどのように運用されているかを調べる。
論文 参考訳(メタデータ) (2025-05-28T02:52:39Z) - Do It For Me vs. Do It With Me: Investigating User Perceptions of Different Paradigms of Automation in Copilots for Feature-Rich Software [9.881955481813465]
LLM(Large Language Model)ベースのアプリケーション内アシスタント(Cooperlot)は、ソフトウェアタスクの自動化を可能にする。
完全自動操縦と半自動操縦の2つの自動化パラダイムについて検討した。
GuidedCopilotは、ステップバイステップの視覚的ガイダンスを提供しながら、簡単なステップを自動化する。
論文 参考訳(メタデータ) (2025-04-22T03:11:10Z) - ComfyGPT: A Self-Optimizing Multi-Agent System for Comprehensive ComfyUI Workflow Generation [71.31634636156384]
タスク記述に基づいてComfyUIを生成するように設計された,最初の自己最適化型マルチエージェントシステムであるComfyGPTを紹介する。
ComfyGPTは、ReformatAgent、FlowAgent、RefineAgent、ExecuteAgentの4つの特殊エージェントで構成されている。
FlowDatasetは、13,571のワークフロー記述ペアを含む大規模なデータセットであり、FlowBenchはワークフロー生成システムを評価するためのベンチマークである。
論文 参考訳(メタデータ) (2025-03-22T06:48:50Z) - ComfyBench: Benchmarking LLM-based Agents in ComfyUI for Autonomously Designing Collaborative AI Systems [80.69865295743149]
この研究は、LLMベースのエージェントを使用して、協調AIシステムを自律的に設計する試みである。
ComfyBenchをベースとしたComfyAgentは,エージェントが自律的に協調的なAIシステムを生成して設計できるようにするフレームワークである。
ComfyAgentは、o1-previewに匹敵する解像度を達成し、ComfyBenchの他のエージェントをはるかに上回っているが、ComfyAgentはクリエイティブタスクの15%しか解決していない。
論文 参考訳(メタデータ) (2024-09-02T17:44:10Z) - CarDreamer: Open-Source Learning Platform for World Model based Autonomous Driving [25.49856190295859]
世界モデルに基づく強化学習(RL)は,様々な環境の複雑な力学を学習し,予測することで,有望なアプローチとして現れてきた。
高度な運転環境において、そのようなアルゴリズムを訓練し、テストするためのアクセス可能なプラットフォームは存在しない。
私たちは、WMベースの自動運転アルゴリズムの開発に特化して設計された、オープンソースの学習プラットフォームであるCarDreamerを紹介します。
論文 参考訳(メタデータ) (2024-05-15T05:57:20Z) - OS-Copilot: Towards Generalist Computer Agents with Self-Improvement [48.29860831901484]
オペレーティングシステム(OS)の包括的要素と対話可能な汎用エージェントを構築するためのフレームワークであるOS-Copilotを紹介する。
我々はOS-Copilotを使って、汎用コンピュータタスクを自動化する自己改善型実施エージェントであるFRIDAYを開発した。
一般的なAIアシスタントのベンチマークであるGAIAでは、FRIDAYが従来の手法を35%上回り、以前のタスクから蓄積したスキルを通じて、目に見えないアプリケーションへの強力な一般化を示している。
論文 参考訳(メタデータ) (2024-02-12T07:29:22Z) - Exploring the Problems, their Causes and Solutions of AI Pair Programming: A Study on GitHub and Stack Overflow [6.724815667295355]
AIプログラマペアであるGitHub Copilotは、コードスニペットの大規模なコーパスでトレーニングされた機械学習モデルを使用して、コード提案を生成する。
ソフトウェア開発で人気があるにもかかわらず、Copilotと仕事をする実践者の実際の経験に関する実証的な証拠は限られている。
473のGitHubイシュー、706のGitHubディスカッション、142のStack Overflowポストからデータを収集しました。
論文 参考訳(メタデータ) (2023-11-02T06:24:38Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。