論文の概要: Large Language Model Based Multi-Agent System Augmented Complex Event Processing Pipeline for Internet of Multimedia Things
- arxiv url: http://arxiv.org/abs/2501.00906v1
- Date: Wed, 01 Jan 2025 17:38:40 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-01-05 17:12:16.533535
- Title: Large Language Model Based Multi-Agent System Augmented Complex Event Processing Pipeline for Internet of Multimedia Things
- Title(参考訳): マルチメディアモノのインターネットのための大規模言語モデルに基づく複合イベント処理パイプラインの拡張
- Authors: Talha Zeeshan, Abhishek Kumar, Susanna Pirttikangas, Sasu Tarkoma,
- Abstract要約: 本稿では,複合イベント処理(CEP)のためのLarge Language Model (LLM)ベースのシステムフレームワークの開発と評価について述べる。
第一の目的は概念実証を作ることで、現在のCEPシステムとのLLMの統合に対処するために、最先端のLLMオーケストレーションフレームワークとパブリッシュ/サブスクライブ(pub/sub)ツールを統合することである。
- 参考スコア(独自算出の注目度): 8.729059187561761
- License:
- Abstract: This paper presents the development and evaluation of a Large Language Model (LLM), also known as foundation models, based multi-agent system framework for complex event processing (CEP) with a focus on video query processing use cases. The primary goal is to create a proof-of-concept (POC) that integrates state-of-the-art LLM orchestration frameworks with publish/subscribe (pub/sub) tools to address the integration of LLMs with current CEP systems. Utilizing the Autogen framework in conjunction with Kafka message brokers, the system demonstrates an autonomous CEP pipeline capable of handling complex workflows. Extensive experiments evaluate the system's performance across varying configurations, complexities, and video resolutions, revealing the trade-offs between functionality and latency. The results show that while higher agent count and video complexities increase latency, the system maintains high consistency in narrative coherence. This research builds upon and contributes to, existing novel approaches to distributed AI systems, offering detailed insights into integrating such systems into existing infrastructures.
- Abstract(参考訳): 本稿では,複合イベント処理(CEP)のための多エージェントシステムフレームワークであるLLM(Large Language Model)の開発と評価について述べる。
第一のゴールは概念実証(POC)を作ることで、現在のCEPシステムとのLLMの統合に対処するために、最先端のLLMオーケストレーションフレームワークとパブリッシュ/サブスクライブ(pub/sub)ツールを統合することである。
Kafkaメッセージブローカと組み合わせてAutogenフレームワークを利用することで、複雑なワークフローを処理可能な自律的なCEPパイプラインを実演する。
大規模な実験では、さまざまな構成、複雑度、ビデオ解像度でシステムのパフォーマンスを評価し、機能とレイテンシのトレードオフを明らかにしている。
その結果,より高いエージェント数とビデオの複雑度は遅延を増大させるが,物語コヒーレンスでは高い一貫性を維持していることがわかった。
この研究は、既存の分散AIシステムに対する新しいアプローチを構築し、貢献し、そのようなシステムを既存のインフラに統合するための詳細な洞察を提供する。
関連論文リスト
- CUE-M: Contextual Understanding and Enhanced Search with Multimodal Large Language Model [9.224965304457708]
本稿では,新しいマルチモーダル検索フレームワークであるMLLM (CUE-M) について述べる。
マルチモーダルなQ&Aデータセットとパブリックセーフティベンチマークによる評価は、CUE-Mが精度、知識統合、安全性のベースラインを上回っていることを示している。
論文 参考訳(メタデータ) (2024-11-19T07:16:48Z) - VisionCoder: Empowering Multi-Agent Auto-Programming for Image Processing with Hybrid LLMs [8.380216582290025]
本稿では,自動プログラミングタスクを協調的に完了するマルチエージェントフレームワークを提案する。
各エージェントは、仮想組織をまとめて形成する、ソフトウェア開発サイクルにおいて、明確な役割を担います。
このフレームワークは、プロジェクト、モジュール、ファンクションレベルにまたがるツリー構造化の思考分布と開発メカニズムを確立することで、コスト効率と効率的なソリューションを提供します。
論文 参考訳(メタデータ) (2024-10-25T01:52:15Z) - The Compressor-Retriever Architecture for Language Model OS [20.56093501980724]
オペレーティングシステム(OS)のコアコンポーネントとして言語モデルを用いるという概念について検討する。
このようなLM OSを実現する上で重要な課題は、寿命の長いコンテキストを管理し、セッション間のステートフルネスを確保することだ。
本稿では,生涯のコンテキスト管理のために設計されたモデル非依存アーキテクチャであるコンプレッサー・レトリバーを紹介する。
論文 参考訳(メタデータ) (2024-09-02T23:28:15Z) - ComfyBench: Benchmarking LLM-based Agents in ComfyUI for Autonomously Designing Collaborative AI Systems [80.69865295743149]
この研究は、LLMベースのエージェントを使用して、協調AIシステムを自律的に設計する試みである。
ComfyBenchをベースとしたComfyAgentは,エージェントが自律的に協調的なAIシステムを生成して設計できるようにするフレームワークである。
ComfyAgentは、o1-previewに匹敵する解像度を達成し、ComfyBenchの他のエージェントをはるかに上回っているが、ComfyAgentはクリエイティブタスクの15%しか解決していない。
論文 参考訳(メタデータ) (2024-09-02T17:44:10Z) - A Comprehensive Review of Multimodal Large Language Models: Performance and Challenges Across Different Tasks [74.52259252807191]
MLLM(Multimodal Large Language Models)は、単一のモダリティシステムの能力を超えた現実世界のアプリケーションの複雑さに対処する。
本稿では,自然言語,視覚,音声などのマルチモーダルタスクにおけるMLLMの応用を体系的に整理する。
論文 参考訳(メタデータ) (2024-08-02T15:14:53Z) - Very Large-Scale Multi-Agent Simulation in AgentScope [112.98986800070581]
我々は,ユーザフレンドリーなマルチエージェントプラットフォームであるAgentScopeの新機能とコンポーネントを開発した。
高いスケーラビリティと高効率を実現するために,アクタをベースとした分散機構を提案する。
また、多数のエージェントを便利に監視し、管理するためのWebベースのインターフェースも提供します。
論文 参考訳(メタデータ) (2024-07-25T05:50:46Z) - Towards More Unified In-context Visual Understanding [74.55332581979292]
マルチモーダル出力を有効にした視覚理解のための新しいICLフレームワークを提案する。
まず、テキストと視覚的プロンプトの両方を量子化し、統一された表現空間に埋め込む。
次にデコーダのみのスパーストランスアーキテクチャを用いて生成モデリングを行う。
論文 参考訳(メタデータ) (2023-12-05T06:02:21Z) - Multilayer Environment and Toolchain for Holistic NetwOrk Design and Analysis [2.7763199324745966]
本研究は分散システム評価の要件を詳細に分析する。
我々のアプローチは、より広い範囲の分散システムのセットアップと評価に重点を置いています。
さまざまなユースケースにまたがって価値ある洞察を提供するためのフレームワークの機能を示します。
論文 参考訳(メタデータ) (2023-10-24T21:18:25Z) - Concepts and Algorithms for Agent-based Decentralized and Integrated
Scheduling of Production and Auxiliary Processes [78.120734120667]
本稿ではエージェントベースの分散型統合スケジューリング手法について述べる。
要求の一部は、線形にスケールする通信アーキテクチャを開発することである。
このアプローチは、工業的要件に基づいた例を使って説明されます。
論文 参考訳(メタデータ) (2022-05-06T18:44:29Z) - Platform for Situated Intelligence [19.208956579428296]
マルチモーダルな統合型AIシステムの迅速な開発と研究を支援するために開発されたオープンソースのフレームワークです。
このフレームワークは、異なるモダリティにわたるデータの一時的なストリームから推論を検知、融合、作成するためのインフラストラクチャを提供する。
論文 参考訳(メタデータ) (2021-03-29T22:30:15Z) - A Data-Centric Framework for Composable NLP Workflows [109.51144493023533]
アプリケーションドメインにおける経験的自然言語処理システム(例えば、ヘルスケア、ファイナンス、教育)は、複数のコンポーネント間の相互運用を伴う。
我々は,このような高度なNLPの高速な開発を支援するために,統一的なオープンソースフレームワークを構築した。
論文 参考訳(メタデータ) (2021-03-02T16:19:44Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。