論文の概要: ComfySearch: Autonomous Exploration and Reasoning for ComfyUI Workflows
- arxiv url: http://arxiv.org/abs/2601.04060v1
- Date: Wed, 07 Jan 2026 16:24:01 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-01-09 02:15:23.686229
- Title: ComfySearch: Autonomous Exploration and Reasoning for ComfyUI Workflows
- Title(参考訳): ComfySearch: ComfyUIワークフローのための自律的な探索と推論
- Authors: Jinwei Su, Qizhen Lan, Zeyu Wang, Yinghui Xia, Hairu Wen, Yiqun Duan, Xi Xiao, Tianyu Shi, Yang Jingsong, Lewei He,
- Abstract要約: ComfySearchは、コンポーネント空間を効果的に探索し、機能的なComfyUIパイプラインを生成するエージェントフレームワークである。
実験によると、ComfySearchは、複雑でクリエイティブなタスクで既存のメソッドを大幅に上回っている。
- 参考スコア(独自算出の注目度): 19.457904539789663
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: AI-generated content has progressed from monolithic models to modular workflows, especially on platforms like ComfyUI, allowing users to customize complex creative pipelines. However, the large number of components in ComfyUI and the difficulty of maintaining long-horizon structural consistency under strict graph constraints frequently lead to low pass rates and workflows of limited quality. To tackle these limitations, we present ComfySearch, an agentic framework that can effectively explore the component space and generate functional ComfyUI pipelines via validation-guided workflow construction. Experiments demonstrate that ComfySearch substantially outperforms existing methods on complex and creative tasks, achieving higher executability (pass) rates, higher solution rates, and stronger generalization.
- Abstract(参考訳): AI生成コンテンツはモノリシックモデルからモジュール化されたワークフロー、特にComfyUIのようなプラットフォームへと進化し、複雑なクリエイティブパイプラインをカスタマイズできるようになった。
しかし、ComfyUIの多数のコンポーネントと、厳密なグラフ制約下での長い水平構造一貫性を維持することの難しさは、しばしば低いパスレートと限られた品質のワークフローをもたらす。
このような制限に対処するために、我々は、コンポーネント空間を効果的に探索し、バリデーション誘導ワークフロー構築を通じて機能的なComfyUIパイプラインを生成するエージェントフレームワークであるComfySearchを紹介します。
実験により、ComfySearchは、複雑で創造的なタスクにおける既存のメソッドを大幅に上回り、より高い実行可能性(パス)率、より高いソリューションレート、より強力な一般化を実現している。
関連論文リスト
- Iterative Structured Pruning for Large Language Models with Multi-Domain Calibration [73.40887151631088]
大規模言語モデル(LLM)は、自然言語処理タスクの幅広い範囲で顕著な成功を収めている。
その拡大を続けるスケールは、かなりの計算オーバーヘッド、メモリフットプリント、推論レイテンシなど、現実世界のデプロイメントに重大な障壁をもたらす。
本研究では,アーキテクチャコンポーネント全体を排除し,標準ハードウェアアクセラレーションとの互換性を維持する構造的プルーニングについて検討する。
論文 参考訳(メタデータ) (2026-01-06T03:09:31Z) - ComfyUI-R1: Exploring Reasoning Models for Workflow Generation [49.09090292453288]
私たちはワークフローの自動生成のための最初の大きな推論モデルであるComfyUI-R1を紹介します。
ノードの選択、ワークフロー計画、コードレベルのワークフローを含む、長いチェーン・オブ・シンク(CoT)推論データを構築します。
実験の結果、我々の7B-パラメーターモデルでは、高いパスレート、ノードレベル、グラフレベルのF1スコアとともに、97%のフォーマットの妥当性が得られた。
論文 参考訳(メタデータ) (2025-06-11T14:35:15Z) - EIFBENCH: Extremely Complex Instruction Following Benchmark for Large Language Models [64.70546873396624]
大規模言語モデル(LLM)を評価するためのEIFBENCH(Extremely Complex Instruction following Benchmark)を提案する。
EIFBENCHにはマルチタスクシナリオが含まれており、多様なタスクタイプを同時に総合的に評価することができる。
また,LLMのマルチタスクワークフローを正確に満たす能力を高めるために,セグメントポリシー最適化(SegPO)アルゴリズムを提案する。
論文 参考訳(メタデータ) (2025-06-10T02:39:55Z) - ComfyUI-Copilot: An Intelligent Assistant for Automated Workflow Development [45.78818581469798]
ComfyUI-CopilotはComfyUI用の大規模な言語モデル駆動プラグインである。
インテリジェントなノードとモデルレコメンデーションとワンクリックワークフローの自動構築を提供する。
オフラインの定量的評価とオンラインユーザフィードバックによるComfyUI-Copilotの有効性を検証する。
論文 参考訳(メタデータ) (2025-06-05T13:20:50Z) - ComfyMind: Toward General-Purpose Generation via Tree-Based Planning and Reactive Feedback [15.363560226232668]
我々は、堅牢でスケーラブルな汎用生成を可能にするために設計されたコラボレーティブAIシステムであるComfyMindを紹介する。
ComfyMindでは,低レベルのノードグラフをコール可能な関数言語に抽象化するセマンティックインターフェース(SWI)と,検索ツリー計画機構という,2つのコアイノベーションを紹介している。
我々はComfyBench、GenEval、Reason-Editの3つの公開ベンチマークでComfyMindを評価した。
論文 参考訳(メタデータ) (2025-05-23T13:53:03Z) - EpiCoder: Encompassing Diversity and Complexity in Code Generation [66.43738008739555]
既存のコード生成方法はシードデータとしてコードスニペットを使用する。
階層的なコード機能を中心に展開する,新しい機能ツリーベースの合成フレームワークを提案する。
我々のフレームワークは、生成されたコードの複雑さを正確に制御し、関数レベルの操作からマルチファイルのシナリオまで幅広い機能を実現する。
論文 参考訳(メタデータ) (2025-01-08T18:58:15Z) - Large Language Models to the Rescue: Reducing the Complexity in
Scientific Workflow Development Using ChatGPT [11.410608233274942]
科学システムは、大規模なデータセット上で複雑なデータ分析パイプラインを表現および実行するためにますます人気がある。
しかし、多くのブラックボックスツールと実行に必要な深いインフラストラクチャスタックが関与しているため、実装は難しい。
本研究では,大規模言語モデル,特にChatGPTの効率性を検討した。
論文 参考訳(メタデータ) (2023-11-03T10:28:53Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。