論文の概要: Performance Measurements in the AI-Centric Computing Continuum Systems
- arxiv url: http://arxiv.org/abs/2506.22884v1
- Date: Sat, 28 Jun 2025 13:46:07 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-07-01 21:27:53.617062
- Title: Performance Measurements in the AI-Centric Computing Continuum Systems
- Title(参考訳): AI-Centric Computing Continuumシステムの性能測定
- Authors: Praveen Kumar Donta, Qiyang Zhang, Schahram Dustdar,
- Abstract要約: 我々は分散コンピューティング継続(DCC)とモノのインターネット環境でよく使われるメトリクスについてレビューする。
本稿では,持続可能性,エネルギー効率,システムの可観測性といった,進化するコンピューティングニーズに対処する新たなパフォーマンス次元について論じる。
- 参考スコア(独自算出の注目度): 5.815300670677979
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Over the Eight decades, computing paradigms have shifted from large, centralized systems to compact, distributed architectures, leading to the rise of the Distributed Computing Continuum (DCC). In this model, multiple layers such as cloud, edge, Internet of Things (IoT), and mobile platforms work together to support a wide range of applications. Recently, the emergence of Generative AI and large language models has further intensified the demand for computational resources across this continuum. Although traditional performance metrics have provided a solid foundation, they need to be revisited and expanded to keep pace with changing computational demands and application requirements. Accurate performance measurements benefit both system designers and users by supporting improvements in efficiency and promoting alignment with system goals. In this context, we review commonly used metrics in DCC and IoT environments. We also discuss emerging performance dimensions that address evolving computing needs, such as sustainability, energy efficiency, and system observability. We also outline criteria and considerations for selecting appropriate metrics, aiming to inspire future research and development in this critical area.
- Abstract(参考訳): 80年以上にわたり、コンピューティングパラダイムは大規模で中央集権的なシステムからコンパクトな分散アーキテクチャへと移行し、分散コンピューティング継続(DCC)の台頭につながった。
このモデルでは、クラウド、エッジ、IoT(Internet of Things)、モバイルプラットフォームといった複数のレイヤが連携して、幅広いアプリケーションをサポートする。
近年、生成型AIと大規模言語モデルの出現により、この連続体における計算資源の需要はさらに増大している。
従来のパフォーマンス指標はしっかりとした基盤を提供してきましたが、計算要求やアプリケーション要求の変化に追従するためには、再検討と拡張が必要です。
正確なパフォーマンス測定は、効率の向上とシステム目標との整合性の向上をサポートすることで、システムデザイナとユーザの両方に利益をもたらす。
この文脈では、DCCとIoT環境でよく使われるメトリクスについてレビューする。
また、持続可能性、エネルギー効率、システムオブザーバビリティといった、進化するコンピューティングニーズに対処する新たなパフォーマンスの次元についても論じる。
また、この重要な分野における今後の研究・開発を刺激することを目的として、適切な指標を選択するための基準と考察を概説する。
関連論文リスト
- Edge-Cloud Collaborative Computing on Distributed Intelligence and Model Optimization: A Survey [59.52058740470727]
エッジクラウドコラボレーティブコンピューティング(ECCC)は、現代のインテリジェントアプリケーションの計算要求に対処するための重要なパラダイムとして登場した。
AIの最近の進歩、特にディープラーニングと大規模言語モデル(LLM)は、これらの分散システムの能力を劇的に向上させてきた。
この調査は、基本的なアーキテクチャ、技術の実現、新しいアプリケーションに関する構造化されたチュートリアルを提供する。
論文 参考訳(メタデータ) (2025-05-03T13:55:38Z) - Machine Learning Insides OptVerse AI Solver: Design Principles and
Applications [74.67495900436728]
本稿では,Huawei CloudのOpsVerse AIソルバに機械学習(ML)技術を統合するための総合的研究について述べる。
本稿では,実世界の多面構造を反映した生成モデルを用いて,複雑なSATインスタンスとMILPインスタンスを生成する手法を紹介する。
本稿では,解解器性能を著しく向上させる,最先端パラメータチューニングアルゴリズムの導入について詳述する。
論文 参考訳(メタデータ) (2024-01-11T15:02:15Z) - Offloading and Quality Control for AI Generated Content Services in 6G Mobile Edge Computing Networks [18.723955271182007]
本稿では, 逆拡散段階における拡散モデルのオフロード決定, 計算時間, 拡散ステップに対する共同最適化アルゴリズムを提案する。
実験結果から,提案アルゴリズムはベースラインよりも優れた継手最適化性能が得られることが示された。
論文 参考訳(メタデータ) (2023-12-11T08:36:27Z) - Age-Based Scheduling for Mobile Edge Computing: A Deep Reinforcement
Learning Approach [58.911515417156174]
我々は情報時代(AoI)の新たな定義を提案し、再定義されたAoIに基づいて、MECシステムにおけるオンラインAoI問題を定式化する。
本稿では,システム力学の部分的知識を活用するために,PDS(Post-Decision State)を導入する。
また、PSDと深いRLを組み合わせることで、アルゴリズムの適用性、スケーラビリティ、堅牢性をさらに向上します。
論文 参考訳(メタデータ) (2023-12-01T01:30:49Z) - MLPerfTM HPC: A Holistic Benchmark Suite for Scientific Machine Learning
on HPC Systems [32.621917787044396]
我々はMLCommonsTM Associationが推進する科学機械学習トレーニングアプリケーションのベンチマークスイートであるHPCを紹介する。
共同分析のための体系的なフレームワークを開発し、データステージング、アルゴリズム収束、計算性能の観点から比較する。
低レベルのメモリ、I/O、ネットワークの振る舞いに関して、各ベンチマークを特徴付けることで結論付ける。
論文 参考訳(メタデータ) (2021-10-21T20:30:12Z) - Integrating Deep Learning in Domain Sciences at Exascale [2.241545093375334]
我々は,大規模HPCシステム上でディープラーニングモデルとアプリケーションを効率的に動作させるための既存パッケージの評価を行った。
本稿では,現在の大規模異種システムに対する新しい非同期並列化と最適化手法を提案する。
従来の計算集約型アプリケーションとデータ集約型アプリケーションをAIで拡張するための図表と潜在的なソリューションを提案する。
論文 参考訳(メタデータ) (2020-11-23T03:09:58Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。