論文の概要: Cloud Services Enable Efficient AI-Guided Simulation Workflows across
Heterogeneous Resources
- arxiv url: http://arxiv.org/abs/2303.08803v1
- Date: Wed, 15 Mar 2023 17:54:02 GMT
- ステータス: 処理完了
- システム内更新日: 2023-03-16 12:44:20.474086
- Title: Cloud Services Enable Efficient AI-Guided Simulation Workflows across
Heterogeneous Resources
- Title(参考訳): 異種リソース間の効率的なai誘導シミュレーションワークフローを実現するクラウドサービス
- Authors: Logan Ward, J. Gregory Pauloski, Valerie Hayot-Sasson, Ryan Chard,
Yadu Babuji, Ganesh Sivaraman, Sutanay Choudhury, Kyle Chard, Rajeev Thakur,
Ian Foster
- Abstract要約: このような異種システムに2つのAI誘導シミュレーションをデプロイした経験を紹介する。
このアプローチのユニークな側面は、クラウドでホストされた管理サービスを使用することです。
これらの手法は,資源間の直接接続に依存するシステムと性能的に同等であることを示す。
- 参考スコア(独自算出の注目度): 3.0448404204967003
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Applications that fuse machine learning and simulation can benefit from the
use of multiple computing resources, with, for example, simulation codes
running on highly parallel supercomputers and AI training and inference tasks
on specialized accelerators. Here, we present our experiences deploying two
AI-guided simulation workflows across such heterogeneous systems. A unique
aspect of our approach is our use of cloud-hosted management services to manage
challenging aspects of cross-resource authentication and authorization,
function-as-a-service (FaaS) function invocation, and data transfer.
We show that these methods can achieve performance parity with systems that
rely on direct connection between resources. We achieve parity by integrating
the FaaS system and data transfer capabilities with a system that passes data
by reference among managers and workers, and a user-configurable steering
algorithm to hide data transfer latencies. We anticipate that this ease of use
can enable routine use of heterogeneous resources in computational science.
- Abstract(参考訳): 機械学習とシミュレーションを融合するアプリケーションは、例えば、高並列スーパーコンピュータで動作するシミュレーションコードや、特別なアクセラレータ上でAIトレーニングと推論タスクなど、複数のコンピューティングリソースの使用の恩恵を受けることができる。
本稿では、このような異種システムに2つのAI誘導シミュレーションワークフローをデプロイした経験を紹介する。
当社のアプローチのユニークな側面は、クラウドホスト型管理サービスを使用して、クロスリソース認証と認証、FaaS(Function-as-a-service)関数呼び出し、データ転送の困難な側面を管理することです。
これらの手法は,資源間の直接接続に依存するシステムと性能的に同等であることを示す。
我々は、FaaSシステムとデータ転送機能と、マネージャやワーカー間の参照データによるデータ転送システムと、データ転送レイテンシを隠蔽するユーザ設定可能なステアリングアルゴリズムを統合することで、同等性を実現する。
この使いやすさにより、計算科学における異種資源の日常的な活用が期待できる。
関連論文リスト
- The Story of QoS Prediction in Vehicular Communication: From Radio
Environment Statistics to Network-Access Throughput Prediction [58.88295409355006]
最大スループット予測の強化、例えばストリーミングやHDマッピングアプリケーションについて検討する。
収集したデータの基盤となる特性をより深く理解することで、MLテクノロジ上に信頼性を構築することができるかを強調します。
我々は、明示可能なAI(XAI)を使用して、MLが明示的にプログラムされることなく、無線ネットワークの基本原理を学習できることを示す。
論文 参考訳(メタデータ) (2023-02-23T12:29:20Z) - A Transformer Framework for Data Fusion and Multi-Task Learning in Smart
Cities [99.56635097352628]
本稿では,新興スマートシティを対象としたトランスフォーマーベースのAIシステムを提案する。
ほぼ全ての入力データと出力タスクタイプをサポートし、現在のS&CCをサポートする。
S&CC環境を代表する多様なタスクセットを学習して実演する。
論文 参考訳(メタデータ) (2022-11-18T20:43:09Z) - The MIT Supercloud Workload Classification Challenge [10.458111248130944]
本稿では,MIT Supercloudデータセットに基づくワークロード分類の課題について述べる。
この課題の目標は、計算ワークロードの分析におけるアルゴリズムのイノベーションを促進することである。
論文 参考訳(メタデータ) (2022-04-12T14:28:04Z) - Federated Stochastic Gradient Descent Begets Self-Induced Momentum [151.4322255230084]
Federated Learning(FL)は、モバイルエッジシステムに適用可能な、新興の機械学習手法である。
このような条件下での勾配降下(SGD)への走行は,大域的な集約プロセスに運動量的な項を加えるとみなすことができる。
論文 参考訳(メタデータ) (2022-02-17T02:01:37Z) - SOLIS -- The MLOps journey from data acquisition to actionable insights [62.997667081978825]
本稿では,基本的なクロスプラットフォームテンソルフレームワークとスクリプト言語エンジンを使用しながら,すべての要件をサポートする統合デプロイメントパイプラインとフリー・ツー・オペレートアプローチを提案する。
しかし、このアプローチは、実際のプロダクショングレードシステムに機械学習機能を実際にデプロイするために必要な手順やパイプラインを提供していない。
論文 参考訳(メタデータ) (2021-12-22T14:45:37Z) - Towards Intelligent Load Balancing in Data Centers [0.5505634045241288]
本稿では,機械学習とネットワークシステムのギャップを埋めるため,Aquariusを提案する。
オフラインデータ分析とオンラインモデル展開の両方を現実的なシステムで実行する能力を示している。
論文 参考訳(メタデータ) (2021-10-27T12:47:30Z) - Adaptive Scheduling for Machine Learning Tasks over Networks [1.4271989597349055]
本論文では, 線形回帰タスクに資源を効率的に割り当てるアルゴリズムを, データのインフォマティビティ性を利用して検討する。
アルゴリズムは、信頼性の高い性能保証による学習タスクの適応スケジューリングを可能にする。
論文 参考訳(メタデータ) (2021-01-25T10:59:00Z) - Toward Multiple Federated Learning Services Resource Sharing in Mobile
Edge Networks [88.15736037284408]
本稿では,マルチアクセスエッジコンピューティングサーバにおいて,複数のフェデレーション付き学習サービスの新たなモデルについて検討する。
共同資源最適化とハイパーラーニング率制御の問題,すなわちMS-FEDLを提案する。
シミュレーションの結果,提案アルゴリズムの収束性能を実証した。
論文 参考訳(メタデータ) (2020-11-25T01:29:41Z) - Reinforcement Learning on Computational Resource Allocation of
Cloud-based Wireless Networks [22.06811314358283]
IoT(Internet of Things)に使用される無線ネットワークには、主にクラウドベースのコンピューティングと処理が関与することが期待されている。
クラウド環境では、プロセスのパフォーマンスを維持しながらエネルギーを節約するために、動的計算資源割り当てが不可欠である。
本稿では、この動的計算資源割当問題をマルコフ決定プロセス(MDP)にモデル化し、CPU使用量の動的リソース割当を最適化するためのモデルベース強化学習エージェントを設計する。
その結果, エージェントは最適方針に迅速に収束し, 異なる設定で安定して動作し, 性能が良く, あるいは少なくとも等しく動作し, 異なるシナリオでの省エネにおけるベースラインアルゴリズムと比較した。
論文 参考訳(メタデータ) (2020-10-10T15:16:26Z) - A Machine Learning Approach for Task and Resource Allocation in Mobile
Edge Computing Based Networks [108.57859531628264]
無線ネットワークにおいて,共同作業,スペクトル,送信電力配分問題について検討する。
提案アルゴリズムは、標準Q-ラーニングアルゴリズムと比較して、収束に必要なイテレーション数と全ユーザの最大遅延を最大18%、11.1%削減することができる。
論文 参考訳(メタデータ) (2020-07-20T13:46:42Z) - Artificial Intelligence (AI)-Centric Management of Resources in Modern
Distributed Computing Systems [22.550075095184514]
Cloud Data Centres (DCS) は大規模で複雑で異種であり、複数のネットワークと地理的境界に分散している。
IoT(Internet of Things)駆動のアプリケーションは、リアルタイム処理と迅速な応答を必要とする膨大なデータを生成しています。
既存のリソース管理システム(RMS)は、そのような複合システムや動的システムには静的またはソリューションが不十分である。
論文 参考訳(メタデータ) (2020-06-09T06:54:07Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。