論文の概要: SAIH: A Scalable Evaluation Methodology for Understanding AI Performance
Trend on HPC Systems
- arxiv url: http://arxiv.org/abs/2212.03410v1
- Date: Wed, 7 Dec 2022 02:42:29 GMT
- ステータス: 処理完了
- システム内更新日: 2022-12-08 17:00:09.343827
- Title: SAIH: A Scalable Evaluation Methodology for Understanding AI Performance
Trend on HPC Systems
- Title(参考訳): SAIH:HPCシステムにおけるAIパフォーマンストレンドを理解するためのスケーラブルな評価手法
- Authors: Jiangsu Du, Dongsheng Li, Yingpeng Wen, Jiazhi Jiang, Dan Huang,
Xiangke Liao, and Yutong Lu
- Abstract要約: 本稿では,HPCシステムのAI性能傾向を分析するためのスケーラブルな評価手法(SAIH)を提案する。
データとモデルは絶えずスケールするので、HPCシステムにおけるAIパフォーマンスの傾向と範囲を調べることができる。
- 参考スコア(独自算出の注目度): 18.699431277588637
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Novel artificial intelligence (AI) technology has expedited various
scientific research, e.g., cosmology, physics and bioinformatics, inevitably
becoming a significant category of workload on high performance computing (HPC)
systems. Existing AI benchmarks tend to customize well-recognized AI
applications, so as to evaluate the AI performance of HPC systems under
predefined problem size, in terms of datasets and AI models. Due to lack of
scalability on the problem size, static AI benchmarks might be under competent
to help understand the performance trend of evolving AI applications on HPC
systems, in particular, the scientific AI applications on large-scale systems.
In this paper, we propose a scalable evaluation methodology (SAIH) for
analyzing the AI performance trend of HPC systems with scaling the problem
sizes of customized AI applications. To enable scalability, SAIH builds a set
of novel mechanisms for augmenting problem sizes. As the data and model
constantly scale, we can investigate the trend and range of AI performance on
HPC systems, and further diagnose system bottlenecks. To verify our
methodology, we augment a cosmological AI application to evaluate a real HPC
system equipped with GPUs as a case study of SAIH.
- Abstract(参考訳): 新たな人工知能(AI)技術は、宇宙学、物理学、バイオインフォマティクスなど様々な科学研究を迅速化しており、ハイパフォーマンスコンピューティング(HPC)システムにおいて必然的に重要な分野となっている。
既存のAIベンチマークは、データセットとAIモデルの観点から、事前に定義された問題サイズの下でHPCシステムのAIパフォーマンスを評価するために、よく認識されたAIアプリケーションをカスタマイズする傾向がある。
問題サイズにスケーラビリティが欠如しているため、静的AIベンチマークは、HPCシステム、特に大規模システムにおける科学AIアプリケーションの進化するAIアプリケーションのパフォーマンストレンドを理解するのに役立つ可能性がある。
本稿では,HPCシステムのAI性能傾向を,カスタマイズされたAIアプリケーションの問題サイズを拡大して解析するスケーラブルな評価手法(SAIH)を提案する。
スケーラビリティを実現するため、SAIHは問題のサイズを拡大するための新しいメカニズムのセットを構築している。
データとモデルは絶えずスケールするので、HPCシステムにおけるAIパフォーマンスの傾向と範囲を調べ、システムのボトルネックをさらに診断することができる。
提案手法を検証するため,SAIHのケーススタディとしてGPUを備えた実HPCシステムを評価するために,宇宙AIアプリケーションを拡張した。
関連論文リスト
- Over the Edge of Chaos? Excess Complexity as a Roadblock to Artificial General Intelligence [4.901955678857442]
我々は、AIの性能が臨界複雑性しきい値を超えると不安定になるかもしれない複雑なシステムにおける位相遷移に類似した臨界点の存在を仮定した。
我々のシミュレーションは、AIシステムの複雑さの増加が、より高い臨界閾値を超え、予測不可能なパフォーマンス行動を引き起こすことを実証した。
論文 参考訳(メタデータ) (2024-07-04T05:46:39Z) - Revolutionizing System Reliability: The Role of AI in Predictive Maintenance Strategies [0.0]
この研究は、AI、特に機械学習とニューラルネットワークが、予測メンテナンス戦略を強化するためにどのように利用されているかを探求している。
この記事では、AIによる予測メンテナンスの実装の有効性と課題について、洞察を提供する。
論文 参考訳(メタデータ) (2024-04-20T19:31:05Z) - Neuromorphic hardware for sustainable AI data centers [3.011658333753524]
ニューロモルフィックハードウェアは、脳が情報を処理する方法からインスピレーションを得ている。
その可能性にもかかわらず、ニューロモルフィックなハードウェアは商用AIデータセンターに導入されていない。
本稿は、ニューロモルフィックハードウェアをデータセンターに統合する際の課題に対する意識を高めることを目的としている。
論文 参考訳(メタデータ) (2024-02-04T15:08:50Z) - Machine Learning Insides OptVerse AI Solver: Design Principles and
Applications [74.67495900436728]
本稿では,Huawei CloudのOpsVerse AIソルバに機械学習(ML)技術を統合するための総合的研究について述べる。
本稿では,実世界の多面構造を反映した生成モデルを用いて,複雑なSATインスタンスとMILPインスタンスを生成する手法を紹介する。
本稿では,解解器性能を著しく向上させる,最先端パラメータチューニングアルゴリズムの導入について詳述する。
論文 参考訳(メタデータ) (2024-01-11T15:02:15Z) - Brain-Inspired Computational Intelligence via Predictive Coding [89.6335791546526]
予測符号化(PC)は、マシンインテリジェンスタスクにおいて有望なパフォーマンスを示している。
PCは様々な脳領域で情報処理をモデル化することができ、認知制御やロボティクスで使用することができる。
論文 参考訳(メタデータ) (2023-08-15T16:37:16Z) - The Future of Fundamental Science Led by Generative Closed-Loop
Artificial Intelligence [67.70415658080121]
機械学習とAIの最近の進歩は、技術革新、製品開発、社会全体を破壊している。
AIは、科学的な実践とモデル発見のための高品質なデータの大規模なデータセットへのアクセスがより困難であるため、基礎科学にはあまり貢献していない。
ここでは、科学的な発見に対するAI駆動、自動化、クローズドループアプローチの側面を調査し、調査する。
論文 参考訳(メタデータ) (2023-07-09T21:16:56Z) - AI for IT Operations (AIOps) on Cloud Platforms: Reviews, Opportunities
and Challenges [60.56413461109281]
IT運用のための人工知能(AIOps)は、AIのパワーとIT運用プロセスが生成するビッグデータを組み合わせることを目的としている。
我々は、IT運用活動が発信する重要なデータの種類、分析における規模と課題、そしてどのように役立つかについて深く議論する。
主要なAIOpsタスクは、インシデント検出、障害予測、根本原因分析、自動アクションに分類します。
論文 参考訳(メタデータ) (2023-04-10T15:38:12Z) - Enabling Automated Machine Learning for Model-Driven AI Engineering [60.09869520679979]
モデル駆動型ソフトウェアエンジニアリングとモデル駆動型AIエンジニアリングを実現するための新しいアプローチを提案する。
特に、私たちはAutomated MLをサポートし、AI集約システムの開発において、AIの深い知識のないソフトウェアエンジニアを支援します。
論文 参考訳(メタデータ) (2022-03-06T10:12:56Z) - Towards AIOps in Edge Computing Environments [60.27785717687999]
本稿では,異種分散環境に適用可能なaiopsプラットフォームのシステム設計について述べる。
高頻度でメトリクスを収集し、エッジデバイス上で特定の異常検出アルゴリズムを直接実行することが可能である。
論文 参考訳(メタデータ) (2021-02-12T09:33:00Z) - Integrating Deep Learning in Domain Sciences at Exascale [2.241545093375334]
我々は,大規模HPCシステム上でディープラーニングモデルとアプリケーションを効率的に動作させるための既存パッケージの評価を行った。
本稿では,現在の大規模異種システムに対する新しい非同期並列化と最適化手法を提案する。
従来の計算集約型アプリケーションとデータ集約型アプリケーションをAIで拡張するための図表と潜在的なソリューションを提案する。
論文 参考訳(メタデータ) (2020-11-23T03:09:58Z) - AIPerf: Automated machine learning as an AI-HPC benchmark [17.57686674304368]
自動機械学習(AutoML)を利用したエンドツーエンドベンチマークスイートを提案する。
アルゴリズムを並列かつ柔軟な方法で実装し、多様なシステムにおける効率性と最適化の可能性を保証する。
フレキシブルなワークロードと単一のメトリックによって、私たちのベンチマークはAI-HPCのスケールとランク付けが容易になります。
論文 参考訳(メタデータ) (2020-08-17T08:06:43Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。