Fugu-MT 論文翻訳(概要): Towards Resource-Efficient Compound AI Systems

論文の概要: Towards Resource-Efficient Compound AI Systems

arxiv url: http://arxiv.org/abs/2501.16634v3
Date: Mon, 17 Mar 2025 20:14:48 GMT
ステータス: 翻訳完了
システム内更新日: 2025-03-19 16:29:10.956381
Title: Towards Resource-Efficient Compound AI Systems
Title（参考訳）: 資源効率の良い複合AIシステムを目指して
Authors: Gohar Irfan Chaudhry, Esha Choukse, Íñigo Goiri, Rodrigo Fonseca, Adam Belay, Ricardo Bianchini,
Abstract要約: 複合AIシステムは、モデル、レトリバー、外部ツールなどの複数の相互作用コンポーネントを統合する。現在の実装は、アプリケーションロジックと実行の詳細の密結合によって、非効率なリソース利用に悩まされています。本稿では、動的スケジューリングとリソース認識意思決定のための宣言型ワークフロープログラミングモデルと適応型ランタイムシステムを提案する。
参考スコア（独自算出の注目度）: 4.709762596591902
License: http://creativecommons.org/licenses/by-nc-sa/4.0/
Abstract: Compound AI Systems, integrating multiple interacting components like models, retrievers, and external tools, have emerged as essential for addressing complex AI tasks. However, current implementations suffer from inefficient resource utilization due to tight coupling between application logic and execution details, a disconnect between orchestration and resource management layers, and the perceived exclusiveness between efficiency and quality. We propose a vision for resource-efficient Compound AI Systems through a declarative workflow programming model and an adaptive runtime system for dynamic scheduling and resource-aware decision-making. Decoupling application logic from low-level details exposes levers for the runtime to flexibly configure the execution environment and resources, without compromising on quality. Enabling collaboration between the workflow orchestration and cluster manager enables higher efficiency through better scheduling and resource management. We are building a prototype system, called Murakkab, to realize this vision. Our preliminary evaluation demonstrates speedups up to $\sim 3.4\times$ in workflow completion times while delivering $\sim 4.5\times$ higher energy efficiency, showing promise in optimizing resources and advancing AI system design.
Abstract（参考訳）: モデルやレトリバー、外部ツールといった複数のインタラクションコンポーネントを統合する複合AIシステムは、複雑なAIタスクに対処するために欠かせないものとなっている。しかしながら、現在の実装では、アプリケーションロジックと実行の詳細の密結合、オーケストレーションとリソース管理レイヤの切り離し、効率と品質の排他性が認識されているため、非効率なリソース利用に悩まされています。本稿では、宣言型ワークフロープログラミングモデルと動的スケジューリングとリソース認識決定のための適応型ランタイムシステムを用いて、資源効率の高い複合AIシステムのビジョンを提案する。低レベルの詳細からアプリケーションロジックを分離することは、実行環境とリソースを柔軟に構成するランタイムのレバーを、品質を損なうことなく公開します。ワークフローオーケストレーションとクラスタマネージャのコラボレーションは、スケジューリングとリソース管理の改善を通じて、より高い効率を実現する。私たちはこのビジョンを実現するために、Murakkabと呼ばれるプロトタイプシステムを構築しています。予備評価では、ワークフロー完了時に最大$\sim 3.4\times$を、高エネルギー効率で$\sim 4.5\times$を、リソースの最適化とAIシステム設計の進歩を約束することを示す。

関連論文リスト

MegaFlow: Large-Scale Distributed Orchestration System for the Agentic Era [74.42509044145417]
MegaFlowは、エージェント環境ワークロードの効率的なスケジューリング、リソース割り当て、きめ細かいタスク管理を可能にする、大規模な分散オーケストレーションシステムである。エージェントのトレーニングデプロイメントでは、MegaFlowは、高いシステムの安定性を維持しながら、数万の並行エージェントタスクを編成し、効率的なリソース利用を実現しています。
論文参考訳（メタデータ） (2026-01-12T13:25:33Z)
Adaptive GPU Resource Allocation for Multi-Agent Collaborative Reasoning in Serverless Environments [0.3668877906130206]
大規模言語モデルを用いたマルチエージェントシステムは、複雑な推論タスクを解くための有望なパラダイムとして登場してきた。サーバレスGPUプラットフォームにこれらのシステムを効率的にデプロイすることは、リソース割り当てに重大な課題をもたらす。本稿では,ラウンドロビンスケジューリングと比較して85%の遅延低減を実現する適応型GPUリソース割り当てフレームワークを提案する。
論文参考訳（メタデータ） (2025-12-15T09:21:48Z)
Dependency-Aware Task Offloading in Multi-UAV Assisted Collaborative Mobile Edge Computing [53.88774113545582]
本稿では,新しい無人航空機(UAV)による協調移動エッジコンピューティング(MEC)フレームワークを提案する。システムコストを最小限に抑え、タスク消費とエネルギー消費のトレードオフを改善することを目的としている。提案手法はシステムコストを大幅に削減し,タスク消費とエネルギー消費のトレードオフの改善を実現する。
論文参考訳（メタデータ） (2025-10-23T02:55:40Z)
xLLM Technical Report [57.13120905321185]
我々は,知的かつ効率的なLarge Language Model (LLM)推論フレームワークであるxLLMを紹介する。 xLLMは、新しい分離されたサービスエンジンアーキテクチャを構築する。 xLLM-Engineは、システムとアルゴリズムの設計を最適化し、コンピュータリソースを完全に飽和させる。
論文参考訳（メタデータ） (2025-10-16T13:53:47Z)
Hierarchical Task Offloading for UAV-Assisted Vehicular Edge Computing via Deep Reinforcement Learning [11.695622067301128]
部分オフロードに基づく2層UAV支援エッジコンピューティングアーキテクチャを提案する。提案アーキテクチャは異種資源の効率的な統合と調整を可能にする。提案手法は,タスク完了率,システム効率,収束速度において,いくつかのベースラインを上回っていることを示す。
論文参考訳（メタデータ） (2025-07-08T07:10:52Z)
HAWK: A Hierarchical Workflow Framework for Multi-Agent Collaboration [3.2588674134593942]
マルチエージェントシステムは、クロスプラットフォームの相互運用性、動的タスクスケジューリング、効率的なリソース共有において永続的な課題に直面している。階層型エージェント (Hawk) は, ユーザ, オペレータ, エージェント, リソースの5つのレイヤから構成され, 16の標準化インターフェースでサポートされているモジュール型フレームワークである。 Hawkはタスク解析、ワークフローオーケストレーション、インテリジェントスケジューリング、リソース呼び出し、データ同期をカバーしたエンドツーエンドパイプラインを提供する。
論文参考訳（メタデータ） (2025-07-05T15:03:53Z)
Co-Saving: Resource Aware Multi-Agent Collaboration for Software Development [65.94639060883475]
本稿では,リソースを意識したマルチエージェントシステムであるCo-Savingを提案する。私たちの重要なイノベーションは、"ショートカット"の導入です。最先端のMAS ChatDevと比較して,トークン使用量の平均50.85%の削減を実現している。
論文参考訳（メタデータ） (2025-05-28T02:23:53Z)
Edge-Cloud Collaborative Computing on Distributed Intelligence and Model Optimization: A Survey [59.52058740470727]
エッジクラウドコラボレーティブコンピューティング(ECCC)は、現代のインテリジェントアプリケーションの計算要求に対処するための重要なパラダイムとして登場した。 AIの最近の進歩、特にディープラーニングと大規模言語モデル(LLM)は、これらの分散システムの能力を劇的に向上させてきた。この調査は、基本的なアーキテクチャ、技術の実現、新しいアプリケーションに関する構造化されたチュートリアルを提供する。
論文参考訳（メタデータ） (2025-05-03T13:55:38Z)
DynTaskMAS: A Dynamic Task Graph-driven Framework for Asynchronous and Parallel LLM-based Multi-Agent Systems [2.6353853440763113]
本稿では,マルチエージェントシステムにおける非同期および並列操作をオーケストレーションする新しいフレームワークであるDynTaskMASを紹介する。 1) 論理的依存関係を維持しながら複雑なタスクを分解する動的タスクグラフ生成装置,(2) 効率的なタスクスケジューリングによるリソース利用を最適化する非同期並列実行エンジン,(3) エージェント間の効率的な情報共有を可能にするセマンティック・アウェア・コンテキスト管理システムである。
論文参考訳（メタデータ） (2025-03-10T06:16:10Z)
DNN-Powered MLOps Pipeline Optimization for Large Language Models: A Framework for Automated Deployment and Resource Management [0.0]
本研究では、Deep Neural Networks(DNN)を活用してMLOpsパイプラインをLarge Language Models(LLM)に最適化する新しいフレームワークを提案する。当社のアプローチでは,最適なパフォーマンスとコスト効率を維持しつつ,デプロイメント決定やリソース割り当て,パイプライン最適化を自動化するインテリジェントシステムを導入しています。
論文参考訳（メタデータ） (2025-01-14T14:15:32Z)
Cluster-Based Multi-Agent Task Scheduling for Space-Air-Ground Integrated Networks [60.085771314013044]
低高度経済は、コミュニケーションやセンシングなどの分野で発展する大きな可能性を秘めている。本稿では,SAGINにおけるマルチUAV協調タスクスケジューリング問題に対処するため,クラスタリングに基づく多エージェントDeep Deterministic Policy Gradient (CMADDPG)アルゴリズムを提案する。
論文参考訳（メタデータ） (2024-12-14T06:17:33Z)
Reinforcement Learning for Adaptive Resource Scheduling in Complex System Environments [8.315191578007857]
そこで本研究では,Q-ラーニングに基づく新しいコンピュータシステムの性能最適化と適応型ワークロード管理スケジューリングアルゴリズムを提案する。対照的に、強化学習アルゴリズムであるQラーニングは、システムの状態変化から継続的に学習し、動的スケジューリングとリソース最適化を可能にする。この研究は、将来の大規模システムにおけるAI駆動適応スケジューリングの統合の基礎を提供し、システムのパフォーマンスを高め、運用コストを削減し、持続可能なエネルギー消費をサポートするスケーラブルでインテリジェントなソリューションを提供する。
論文参考訳（メタデータ） (2024-11-08T05:58:09Z)
FusionLLM: A Decentralized LLM Training System on Geo-distributed GPUs with Adaptive Compression [55.992528247880685]
分散トレーニングは、システム設計と効率に関する重要な課題に直面します。大規模深層ニューラルネットワーク(DNN)のトレーニング用に設計・実装された分散トレーニングシステムFusionLLMを提案する。本システムと手法は,収束性を確保しつつ,ベースライン法と比較して1.45～9.39倍の高速化を実現可能であることを示す。
論文参考訳（メタデータ） (2024-10-16T16:13:19Z)
DNN Partitioning, Task Offloading, and Resource Allocation in Dynamic Vehicular Networks: A Lyapunov-Guided Diffusion-Based Reinforcement Learning Approach [49.56404236394601]
本稿では,Vehicular Edge Computingにおける共同DNNパーティショニング,タスクオフロード,リソース割り当ての問題を定式化する。我々の目標は、時間とともにシステムの安定性を保証しながら、DNNベースのタスク完了時間を最小化することである。拡散モデルの革新的利用を取り入れたマルチエージェント拡散に基づく深層強化学習(MAD2RL)アルゴリズムを提案する。
論文参考訳（メタデータ） (2024-06-11T06:31:03Z)
Efficient Orchestrated AI Workflows Execution on Scale-out Spatial Architecture [17.516934379812994]
さまざまなタスクをロジック駆動型決定と統合し、動的で洗練されたAIを提供する。我々は,オーケストレーションされた空間グラフを用いて,オーケストレーションされたAIの本質的なデュアルダイナミクスを効果的に表現できることを見出した。我々の評価は、オーケストレーションAIの動的な要求に対処する上で、従来のアーキテクチャよりも大幅に優れていることを示している。
論文参考訳（メタデータ） (2024-05-21T14:09:31Z)
AIOS: LLM Agent Operating System [39.59087894012381]
本稿では,LLMベースのエージェント管理のコンテキスト下で,AIOS(LLMベースのAIエージェントオペレーティングシステム)のアーキテクチャを提案する。エージェントアプリケーションからリソースとLLM固有のサービスをAIOSカーネルに分離することで、LLMベースのエージェントを提供するための新しいアーキテクチャを導入する。 AIOSを使用すると、さまざまなエージェントフレームワークで構築されたエージェントを最大2.1倍高速に実行することができる。
論文参考訳（メタデータ） (2024-03-25T17:32:23Z)
Joint User Association, Interference Cancellation and Power Control for Multi-IRS Assisted UAV Communications [80.35959154762381]
インテリジェント反射面(IRS)支援無人航空機(UAV)通信は、地上基地局の負荷を低コストで軽減することが期待されている。既存の研究は主に、複数のIRSではなく単一のIRSの配置とリソース割り当てに焦点を当てている。我々は,共同IRSユーザアソシエーションのための新しい最適化アルゴリズム,UAVの軌道最適化,逐次干渉キャンセル(SIC)復号命令スケジューリング,電力割り当てを提案する。
論文参考訳（メタデータ） (2023-12-08T01:57:10Z)
A Multi-Head Ensemble Multi-Task Learning Approach for Dynamical Computation Offloading [62.34538208323411]
共有バックボーンと複数の予測ヘッド(PH)を組み合わせたマルチヘッドマルチタスク学習(MEMTL)手法を提案する。 MEMTLは、追加のトレーニングデータを必要とせず、推測精度と平均平方誤差の両方でベンチマーク手法より優れている。
論文参考訳（メタデータ） (2023-09-02T11:01:16Z)
Multi-Resource Allocation for On-Device Distributed Federated Learning Systems [79.02994855744848]
本研究は,デバイス上の分散フェデレーション学習(FL)システムにおいて,レイテンシとエネルギー消費の重み付け和を最小化する分散マルチリソース割り当て方式を提案する。システム内の各モバイルデバイスは、指定された領域内でモデルトレーニングプロセスを実行し、それぞれパラメータの導出とアップロードを行うための計算と通信資源を割り当てる。
論文参考訳（メタデータ） (2022-11-01T14:16:05Z)
Multi-Agent Reinforcement Learning for Long-Term Network Resource Allocation through Auction: a V2X Application [7.326507804995567]
我々は,自律エージェント間の分散意思決定として,移動エージェントの動的グループ(自動車など)からの計算タスクのオフロードを定式化する。我々は、競争と協力のバランスをとることで、そのようなエージェントにプライベートとシステム目標の整合を動機付けるインタラクションメカニズムを設計する。本稿では,部分的,遅延,ノイズの多い状態情報を用いて学習する,新しいマルチエージェントオンライン学習アルゴリズムを提案する。
論文参考訳（メタデータ） (2022-07-29T10:29:06Z)
Deep Reinforcement Model Selection for Communications Resource Allocation in On-Site Medical Care [8.564319625930892]
本稿では、スケジューラが接続されたユーザ間で混合性能指標のバランスをとる必要があるリソース割り当てシナリオについて検討する。本稿では,異なるモデルベーススケジューリングアルゴリズムを適応的に切り替えるスケジューラを提案する。結果として得られるアンサンブルスケジューラは、その構成アルゴリズムを組み合わせて、総コスト関数を最大化することができる。
論文参考訳（メタデータ） (2021-11-12T12:04:53Z)
Energy-Efficient Multi-Orchestrator Mobile Edge Learning [54.28419430315478]
Mobile Edge Learning(MEL)は、エッジデバイス上で機械学習(ML)モデルの分散トレーニングを特徴とする、協調学習パラダイムである。 MELでは、異なるデータセットで複数の学習タスクが共存する可能性がある。本稿では, エネルギー消費, 精度, 解複雑性のトレードオフを容易にする軽量なアルゴリズムを提案する。
論文参考訳（メタデータ） (2021-09-02T07:37:10Z)
Resource allocation in dynamic multiagent systems [0.0]
MG-RAOアルゴリズムは,マルチエージェントシステムにおける資源配分問題を解決するために開発された。シミュレーション環境における固定リソース割り当てに対する23～28%の改善を示す。また、揮発性システムでは、mg-raoアルゴリズムを用いて、子エージェントがすべてのエージェントのリソース割り当てをモデル化するように構成されているため、複数のエージェント群をモデル化するときのパフォーマンスは46.5%である。
論文参考訳（メタデータ） (2021-02-16T17:56:23Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。