Fugu-MT 論文翻訳(概要): Bel Esprit: Multi-Agent Framework for Building AI Model Pipelines

論文の概要: Bel Esprit: Multi-Agent Framework for Building AI Model Pipelines

arxiv url: http://arxiv.org/abs/2412.14684v2
Date: Fri, 13 Jun 2025 14:30:53 GMT
ステータス: 翻訳完了
システム内更新日: 2025-06-16 13:34:01.391437
Title: Bel Esprit: Multi-Agent Framework for Building AI Model Pipelines
Title（参考訳）: Bel Esprit: AIモデルパイプライン構築のためのマルチエージェントフレームワーク
Authors: Yunsu Kim, AhmedElmogtaba Abdelaziz, Thiago Castro Ferreira, Mohamed Al-Badrashiny, Hassan Sawaf,
Abstract要約: 本稿では,ユーザ定義要求に基づいてAIモデルパイプラインを構築するための対話エージェントであるBel Espritを紹介する。あいまいなユーザクエリからパイプラインを生成する上で,このフレームワークの有効性を示す。詳細なエラー解析では、パイプライン構築における進行中の課題を強調している。
参考スコア（独自算出の注目度）: 6.366591618050151
License: http://creativecommons.org/licenses/by-nc-nd/4.0/
Abstract: As the demand for artificial intelligence (AI) grows to address complex real-world tasks, single models are often insufficient, requiring the integration of multiple models into pipelines. This paper introduces Bel Esprit, a conversational agent designed to construct AI model pipelines based on user-defined requirements. Bel Esprit employs a multi-agent framework where subagents collaborate to clarify requirements, build, validate, and populate pipelines with appropriate models. We demonstrate the effectiveness of this framework in generating pipelines from ambiguous user queries, using both human-curated and synthetic data. A detailed error analysis highlights ongoing challenges in pipeline construction. Bel Esprit is available for a free trial at https://belesprit.aixplain.com.
Abstract（参考訳）: 人工知能(AI)の需要が増大して、複雑な現実世界のタスクに対処するようになると、単一モデルはしばしば不足し、複数のモデルをパイプラインに統合する必要がある。本稿では,ユーザ定義要求に基づいてAIモデルパイプラインを構築するための対話エージェントであるBel Espritを紹介する。 Bel Esprit氏は、サブエージェントが要求を明確にし、ビルド、検証、適切なモデルでパイプラインをポップアップする、マルチエージェントフレームワークを使用している。我々は,このフレームワークが不明瞭なユーザクエリからパイプラインを生成する上で,人為的および合成的データの両方を用いて有効であることを示す。詳細なエラー解析では、パイプライン構築における進行中の課題を強調している。 Bel Espritはhttps://belesprit.aixplain.comで無料で試用できる。

関連論文リスト

Agent World Model: Infinity Synthetic Environments for Agentic Reinforcement Learning [62.499592503950026]
大規模言語モデル(LLM)は、ツールや環境とのマルチターンインタラクションを必要とする複雑なタスクを実行するために、自律エージェントに権限を与えている。完全合成環境生成パイプラインであるエージェント・ワールド・モデル(AWM)を提案する。私たちは、エージェントがリッチなツールセットと対話できる、毎日のシナリオをカバーする1,000の環境にスケールします。
論文参考訳（メタデータ） (2026-02-10T18:55:41Z)
AgentSkiller: Scaling Generalist Agent Intelligence through Semantically Integrated Cross-Domain Data Synthesis [30.512393568258105]
大規模言語モデルエージェントは、ツールを介して現実世界の問題を解決する可能性を実証するが、汎用的な知性は、質の低い長期データによってボトルネックとなる。本稿では,現実的なセマンティックなドメイン間でのマルチターンインタラクションデータを合成する,完全に自動化されたフレームワークであるAgentSkillerを提案する。
論文参考訳（メタデータ） (2026-02-10T03:21:42Z)
Pipeline Inspection, Visualization, and Interoperability in PyTerrier [30.03419590071127]
PyTerrierは、Information Retrieval (IR)パイプラインの構築と実験のためのフレームワークを提供する。これらの機能は、研究者、学生、AIエージェントが幅広いIRパイプラインを理解し、使用するのを容易にすることを目的としている。
論文参考訳（メタデータ） (2026-01-24T16:01:57Z)
ABC-Bench: Benchmarking Agentic Backend Coding in Real-World Development [72.4729759618632]
本稿では,現実的かつ実行可能なワークフロー内でエージェントバックエンドコーディングを評価するベンチマークであるABC-Benchを紹介する。オープンソースリポジトリから8つの言語と19のフレームワークにまたがる224の実践的なタスクをキュレートしました。我々の評価は、最先端モデルでさえ、これらの総合的なタスクに対して信頼性の高いパフォーマンスを提供するのに苦労していることを示している。
論文参考訳（メタデータ） (2026-01-16T08:23:52Z)
DUET: Agentic Design Understanding via Experimentation and Testing [6.787641711048685]
DUETは、実験とテストによる設計理解を開発するための一般的な方法論である。仮説を反復的に生成し、EDAツールでテストし、結果を統合して、設計のボトムアップ理解を構築する。 DUETは,実験なしでのベースラインフローと比較して,形式的検証においてAIエージェントの性能を向上させることを示す。
論文参考訳（メタデータ） (2025-12-06T02:16:28Z)
Dynamic Generation of Multi-LLM Agents Communication Topologies with Graph Diffusion Models [99.85131798240808]
我々はtextitGuided Topology Diffusion (GTD) と呼ばれる新しい生成フレームワークを導入する。条件付き離散グラフ拡散モデルにインスパイアされたGTD式は、反復的な構成過程としてトポロジー合成を行う。各ステップで生成は、多目的報酬を予測する軽量プロキシモデルによって制御される。実験により、GTDは高いタスク適応性、スパース、効率的な通信トポロジを生成できることが示されている。
論文参考訳（メタデータ） (2025-10-09T05:28:28Z)
Rethinking Testing for LLM Applications: Characteristics, Challenges, and a Lightweight Interaction Protocol [83.83217247686402]
大言語モデル(LLM)は、単純なテキストジェネレータから、検索強化、ツール呼び出し、マルチターンインタラクションを統合する複雑なソフトウェアシステムへと進化してきた。その固有の非決定主義、ダイナミズム、文脈依存は品質保証に根本的な課題をもたらす。本稿では,LLMアプリケーションを3層アーキテクチャに分解する: textbftextitSystem Shell Layer, textbftextitPrompt Orchestration Layer, textbftextitLLM Inference Core。
論文参考訳（メタデータ） (2025-08-28T13:00:28Z)
Text-to-Pipeline: Bridging Natural Language and Data Preparation Pipelines [18.75611679837171]
我々は,NLデータ作成命令をDPパイプラインに変換する新しいタスクであるText-to-Pipelineを紹介する。 Parrotは、体系的な評価をサポートする大規模なベンチマークである。 ParROTは、プロダクションパイプラインから変換パターンをマイニングし、23,009の現実世界のテーブル上でインスタンス化する。
論文参考訳（メタデータ） (2025-05-21T15:40:53Z)
APIGen-MT: Agentic Pipeline for Multi-Turn Data Generation via Simulated Agent-Human Interplay [86.01901238059261]
APIGen-MTは検証可能で多様なマルチターンエージェントデータを生成するフレームワークである。 xLAM-2-fc-r 級数で 1B から 70B のパラメータを持つモデル群を訓練する。我々のモデルは、$tau$-benchとBFCLベンチマークでGPT-4oやClaude 3.5のようなフロンティアモデルより優れている。
論文参考訳（メタデータ） (2025-04-04T17:13:57Z)
An Empirical Study of Validating Synthetic Data for Text-Based Person Retrieval [51.10419281315848]
我々は,テキストベース人検索(TBPR)研究における合成データの可能性を探るため,実証的研究を行った。本稿では,自動プロンプト構築戦略を導入するクラス間画像生成パイプラインを提案する。我々は、画像のさらなる編集に生成AIモデルを応用した、クラス内画像拡張パイプラインを開発する。
論文参考訳（メタデータ） (2025-03-28T06:18:15Z)
ToolACE: Winning the Points of LLM Function Calling [139.07157814653638]
ToolACEは、正確で複雑で多様なツール学習データを生成するように設計された自動エージェントパイプラインである。我々は、合成データに基づいてトレーニングされたモデルが、8Bパラメータだけで、バークレー・ファンクション・カリング・リーダーボード上で最先端のパフォーマンスを達成することを実証した。
論文参考訳（メタデータ） (2024-09-02T03:19:56Z)
Multi-LLM QA with Embodied Exploration [55.581423861790945]
未知環境における質問応答におけるマルチエンボディードLEMエクスプローラ(MELE)の利用について検討する。複数のLSMベースのエージェントが独立して家庭用環境に関する質問を探索し、回答する。各問合せに対して1つの最終回答を生成するために,異なるアグリゲーション手法を解析する。
論文参考訳（メタデータ） (2024-06-16T12:46:40Z)
Making Task-Oriented Dialogue Datasets More Natural by Synthetically Generating Indirect User Requests [6.33281463741573]
間接ユーザ要求(IUR)は、ヒューマン・ヒューマン・タスク指向の対話において一般的であり、聞き手からの世界的知識と実践的推論を必要とする。大きな言語モデル(LLM)はこれらの要求を効果的に処理できるが、仮想アシスタントにデプロイされる小さなモデルはリソースの制約のためにしばしば苦労する。
論文参考訳（メタデータ） (2024-06-12T01:18:04Z)
Model Callers for Transforming Predictive and Generative AI Applications [2.7195102129095003]
モデル呼び出し(model caller)と呼ばれる新しいソフトウェア抽象化を導入する。モデル呼び出しは、AIとMLモデル呼び出しの仲介役として機能する。我々は、モデル呼び出しのためのPythonライブラリのプロトタイプをリリースした。
論文参考訳（メタデータ） (2024-04-17T12:21:06Z)
An Interpretable Ensemble of Graph and Language Models for Improving Search Relevance in E-Commerce [22.449320058423886]
プラグアンドプレイグラフLanguage Model (PP-GLAM) を提案する。このアプローチでは、均一なデータ処理パイプラインを備えたモジュラーフレームワークを使用します。 PP-GLAMは,実世界のマルチリンガル,マルチリージョンのeコマースデータセット上で,最先端のベースラインとプロプライエタリなモデルよりも優れていることを示す。
論文参考訳（メタデータ） (2024-03-01T19:08:25Z)
Pipeline MoE: A Flexible MoE Implementation with Pipeline Parallelism [91.9372563527801]
既存のMoEモデルは、膨大な内部ノードとノード間通信オーバーヘッドに悩まされる。本稿では,新しいMoEアーキテクチャであるPipeline MoE(PPMoE)を提案する。 PPMoEは、テンソル並列を組み込んだ専門家の並列処理を構築し、通信集約型の全対一のディスパッチとコレクションを置き換える。
論文参考訳（メタデータ） (2023-04-22T14:09:14Z)
Modeling Quality and Machine Learning Pipelines through Extended Feature Models [0.0]
本稿では,機能モデルメタモデルを適切に拡張した品質MLパイプラインのための新しいエンジニアリング手法を提案する。提案されたアプローチでは、MLパイプライン、その品質要件(パイプライン全体と単一フェーズ)、各パイプラインフェーズを実装するアルゴリズムの品質特性をモデル化することができる。
論文参考訳（メタデータ） (2022-07-15T15:20:28Z)
Plumber: A Modular Framework to Create Information Extraction Pipelines [1.3326219707058071]
PLUMBERは、コミュニティが作成したツールプールからユーザーが手動で自動的に適切なIEパイプラインを作成できる最初のフレームワークである。このアプローチは、パイプラインを変更し、IEタスクを実行するためのインタラクティブな媒体を提供する。
論文参考訳（メタデータ） (2022-06-03T08:10:35Z)
UKP-SQUARE: An Online Platform for Question Answering Research [50.35348764297317]
我々は、研究者向けのオンラインQAプラットフォームであるUKP-SQUAREを紹介した。 UKP-SQUAREでは、ユーザフレンドリーなWebインターフェースと統合テストを通じて、モダンスキルの大規模なコレクションをクエリし、分析することができる。
論文参考訳（メタデータ） (2022-03-25T15:00:24Z)
SOLIS -- The MLOps journey from data acquisition to actionable insights [62.997667081978825]
本稿では,基本的なクロスプラットフォームテンソルフレームワークとスクリプト言語エンジンを使用しながら,すべての要件をサポートする統合デプロイメントパイプラインとフリー・ツー・オペレートアプローチを提案する。しかし、このアプローチは、実際のプロダクショングレードシステムに機械学習機能を実際にデプロイするために必要な手順やパイプラインを提供していない。
論文参考訳（メタデータ） (2021-12-22T14:45:37Z)
Text Modular Networks: Learning to Decompose Tasks in the Language of Existing Models [61.480085460269514]
本稿では,既存のモデルで解けるより単純なモデルに分解することで,複雑なタスクを解くための解釈可能なシステムを構築するためのフレームワークを提案する。我々はこのフレームワークを用いて、ニューラルネットワークのファクトイド単一スパンQAモデルとシンボリック電卓で答えられるサブクエストに分解することで、マルチホップ推論問題に答えられるシステムであるModularQAを構築する。
論文参考訳（メタデータ） (2020-09-01T23:45:42Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。