Fugu-MT 論文翻訳(概要): SAIH: A Scalable Evaluation Methodology for Understanding AI Performance Trend on HPC Systems

論文の概要: SAIH: A Scalable Evaluation Methodology for Understanding AI Performance Trend on HPC Systems

arxiv url: http://arxiv.org/abs/2212.03410v1
Date: Wed, 7 Dec 2022 02:42:29 GMT
ステータス: 翻訳完了
システム内更新日: 2022-12-08 17:00:09.343827
Title: SAIH: A Scalable Evaluation Methodology for Understanding AI Performance Trend on HPC Systems
Title（参考訳）: SAIH:HPCシステムにおけるAIパフォーマンストレンドを理解するためのスケーラブルな評価手法
Authors: Jiangsu Du, Dongsheng Li, Yingpeng Wen, Jiazhi Jiang, Dan Huang, Xiangke Liao, and Yutong Lu
Abstract要約: 本稿では,HPCシステムのAI性能傾向を分析するためのスケーラブルな評価手法(SAIH)を提案する。データとモデルは絶えずスケールするので、HPCシステムにおけるAIパフォーマンスの傾向と範囲を調べることができる。
参考スコア（独自算出の注目度）: 18.699431277588637
License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
Abstract: Novel artificial intelligence (AI) technology has expedited various scientific research, e.g., cosmology, physics and bioinformatics, inevitably becoming a significant category of workload on high performance computing (HPC) systems. Existing AI benchmarks tend to customize well-recognized AI applications, so as to evaluate the AI performance of HPC systems under predefined problem size, in terms of datasets and AI models. Due to lack of scalability on the problem size, static AI benchmarks might be under competent to help understand the performance trend of evolving AI applications on HPC systems, in particular, the scientific AI applications on large-scale systems. In this paper, we propose a scalable evaluation methodology (SAIH) for analyzing the AI performance trend of HPC systems with scaling the problem sizes of customized AI applications. To enable scalability, SAIH builds a set of novel mechanisms for augmenting problem sizes. As the data and model constantly scale, we can investigate the trend and range of AI performance on HPC systems, and further diagnose system bottlenecks. To verify our methodology, we augment a cosmological AI application to evaluate a real HPC system equipped with GPUs as a case study of SAIH.
Abstract（参考訳）: 新たな人工知能(AI)技術は、宇宙学、物理学、バイオインフォマティクスなど様々な科学研究を迅速化しており、ハイパフォーマンスコンピューティング(HPC)システムにおいて必然的に重要な分野となっている。既存のAIベンチマークは、データセットとAIモデルの観点から、事前に定義された問題サイズの下でHPCシステムのAIパフォーマンスを評価するために、よく認識されたAIアプリケーションをカスタマイズする傾向がある。問題サイズにスケーラビリティが欠如しているため、静的AIベンチマークは、HPCシステム、特に大規模システムにおける科学AIアプリケーションの進化するAIアプリケーションのパフォーマンストレンドを理解するのに役立つ可能性がある。本稿では,HPCシステムのAI性能傾向を,カスタマイズされたAIアプリケーションの問題サイズを拡大して解析するスケーラブルな評価手法(SAIH)を提案する。スケーラビリティを実現するため、SAIHは問題のサイズを拡大するための新しいメカニズムのセットを構築している。データとモデルは絶えずスケールするので、HPCシステムにおけるAIパフォーマンスの傾向と範囲を調べ、システムのボトルネックをさらに診断することができる。提案手法を検証するため,SAIHのケーススタディとしてGPUを備えた実HPCシステムを評価するために,宇宙AIアプリケーションを拡張した。

関連論文リスト

What Artificial Intelligence can do for High-Performance Computing systems? [0.0]
本稿では、機械学習(ML)や最適化を含む人工(AI)が、運用用HPCシステムの効率をどのように改善するかを評価する。 2019年から2025年までの約1,800の出版物は、事前に定義された包括的・排他的基準を用いて手動で審査された。 74の"AI for HPC"論文は、パフォーマンス推定、パフォーマンス最適化、スケジューリング、サロゲートモデリング、障害検出、言語モデルに基づく自動化の6つのアプリケーション領域にまとめられ、グループ化された。
論文参考訳（メタデータ） (2026-01-03T19:25:23Z)
Let the Barbarians In: How AI Can Accelerate Systems Performance Research [80.43506848683633]
我々は、この繰り返しサイクルを、AI駆動システム研究の生成、評価、洗練のサイクルと呼ぶ。我々はADRSが生成するソリューションが人間の最先端の設計に適合し、さらに優れることを示した。
論文参考訳（メタデータ） (2025-12-16T18:51:23Z)
Barbarians at the Gate: How AI is Upending Systems Research [58.95406995634148]
システム研究は、新しいパフォーマンス指向アルゴリズムの設計と評価に長年注力してきたが、AI駆動のソリューション発見には特に適している、と私たちは主張する。このアプローチをAI駆動システム研究(ADRS)と呼び、ソリューションを反復的に生成し、評価し、洗練する。我々の研究結果は、AI時代のシステム研究の実践に急激な適応の必要性と破壊的な可能性を浮き彫りにしている。
論文参考訳（メタデータ） (2025-10-07T17:49:24Z)
AI-Driven Automation Can Become the Foundation of Next-Era Science of Science Research [58.944125758758936]
科学科学(Science of Science, SoS)は、科学的発見の基礎となるメカニズムを探求する。人工知能(AI)の出現は、次世代のSoSに変革の機会をもたらす。我々は、従来の手法よりもAIの利点を概説し、潜在的な制限について議論し、それらを克服するための経路を提案する。
論文参考訳（メタデータ） (2025-05-17T15:01:33Z)
Edge-Cloud Collaborative Computing on Distributed Intelligence and Model Optimization: A Survey [59.52058740470727]
エッジクラウドコラボレーティブコンピューティング(ECCC)は、現代のインテリジェントアプリケーションの計算要求に対処するための重要なパラダイムとして登場した。 AIの最近の進歩、特にディープラーニングと大規模言語モデル(LLM)は、これらの分散システムの能力を劇的に向上させてきた。この調査は、基本的なアーキテクチャ、技術の実現、新しいアプリケーションに関する構造化されたチュートリアルを提供する。
論文参考訳（メタデータ） (2025-05-03T13:55:38Z)
General Scales Unlock AI Evaluation with Explanatory and Predictive Power [57.7995945974989]
ベンチマークはAIの進歩を導くものだが、汎用AIシステムには限られた説明力と予測力を提供している。私たちは、一般的なAIベンチマークが実際に何を計測しているかを説明することができる、AI評価のための一般的な尺度を紹介します。私たちの完全に自動化された方法論は、飽和しない一般的なスケールにインスタンス要求を配置する18の新しく作られたルーリックの上に構築されます。
論文参考訳（メタデータ） (2025-03-09T01:13:56Z)
AI Automatons: AI Systems Intended to Imitate Humans [54.19152688545896]
人々の行動、仕事、能力、類似性、または人間性を模倣するように設計されたAIシステムが増加している。このようなAIシステムの研究、設計、展開、可用性は、幅広い法的、倫理的、その他の社会的影響に対する懸念を喚起している。
論文参考訳（メタデータ） (2025-03-04T03:55:38Z)
AI-Aided Kalman Filters [65.35350122917914]
カルマンフィルタ(KF)とその変種は、信号処理において最も著名なアルゴリズムの一つである。最近の進歩は、古典的なカルマン型フィルタリングでディープニューラルネットワーク(DNN)を融合させる可能性を示している。本稿では,KF型アルゴリズムにAIを組み込むための設計アプローチについて,チュートリアル形式で概説する。
論文参考訳（メタデータ） (2024-10-16T06:47:53Z)
Over the Edge of Chaos? Excess Complexity as a Roadblock to Artificial General Intelligence [4.901955678857442]
我々は、AIの性能が臨界複雑性しきい値を超えると不安定になるかもしれない複雑なシステムにおける位相遷移に類似した臨界点の存在を仮定した。我々のシミュレーションは、AIシステムの複雑さの増加が、より高い臨界閾値を超え、予測不可能なパフォーマンス行動を引き起こすことを実証した。
論文参考訳（メタデータ） (2024-07-04T05:46:39Z)
Revolutionizing System Reliability: The Role of AI in Predictive Maintenance Strategies [0.0]
この研究は、AI、特に機械学習とニューラルネットワークが、予測メンテナンス戦略を強化するためにどのように利用されているかを探求している。この記事では、AIによる予測メンテナンスの実装の有効性と課題について、洞察を提供する。
論文参考訳（メタデータ） (2024-04-20T19:31:05Z)
Neuromorphic hardware for sustainable AI data centers [3.011658333753524]
ニューロモルフィックハードウェアは、脳が情報を処理する方法からインスピレーションを得ている。その可能性にもかかわらず、ニューロモルフィックなハードウェアは商用AIデータセンターに導入されていない。本稿は、ニューロモルフィックハードウェアをデータセンターに統合する際の課題に対する意識を高めることを目的としている。
論文参考訳（メタデータ） (2024-02-04T15:08:50Z)
Machine Learning Insides OptVerse AI Solver: Design Principles and Applications [74.67495900436728]
本稿では,Huawei CloudのOpsVerse AIソルバに機械学習(ML)技術を統合するための総合的研究について述べる。本稿では,実世界の多面構造を反映した生成モデルを用いて,複雑なSATインスタンスとMILPインスタンスを生成する手法を紹介する。本稿では,解解器性能を著しく向上させる,最先端パラメータチューニングアルゴリズムの導入について詳述する。
論文参考訳（メタデータ） (2024-01-11T15:02:15Z)
Brain-Inspired Computational Intelligence via Predictive Coding [89.6335791546526]
予測符号化(PC)は、マシンインテリジェンスタスクにおいて有望なパフォーマンスを示している。 PCは様々な脳領域で情報処理をモデル化することができ、認知制御やロボティクスで使用することができる。
論文参考訳（メタデータ） (2023-08-15T16:37:16Z)
The Future of Fundamental Science Led by Generative Closed-Loop Artificial Intelligence [67.70415658080121]
機械学習とAIの最近の進歩は、技術革新、製品開発、社会全体を破壊している。 AIは、科学的な実践とモデル発見のための高品質なデータの大規模なデータセットへのアクセスがより困難であるため、基礎科学にはあまり貢献していない。ここでは、科学的な発見に対するAI駆動、自動化、クローズドループアプローチの側面を調査し、調査する。
論文参考訳（メタデータ） (2023-07-09T21:16:56Z)
AI for IT Operations (AIOps) on Cloud Platforms: Reviews, Opportunities and Challenges [60.56413461109281]
IT運用のための人工知能(AIOps)は、AIのパワーとIT運用プロセスが生成するビッグデータを組み合わせることを目的としている。我々は、IT運用活動が発信する重要なデータの種類、分析における規模と課題、そしてどのように役立つかについて深く議論する。主要なAIOpsタスクは、インシデント検出、障害予測、根本原因分析、自動アクションに分類します。
論文参考訳（メタデータ） (2023-04-10T15:38:12Z)
Enabling Automated Machine Learning for Model-Driven AI Engineering [60.09869520679979]
モデル駆動型ソフトウェアエンジニアリングとモデル駆動型AIエンジニアリングを実現するための新しいアプローチを提案する。特に、私たちはAutomated MLをサポートし、AI集約システムの開発において、AIの深い知識のないソフトウェアエンジニアを支援します。
論文参考訳（メタデータ） (2022-03-06T10:12:56Z)
Integrating Deep Learning in Domain Sciences at Exascale [2.241545093375334]
我々は,大規模HPCシステム上でディープラーニングモデルとアプリケーションを効率的に動作させるための既存パッケージの評価を行った。本稿では,現在の大規模異種システムに対する新しい非同期並列化と最適化手法を提案する。従来の計算集約型アプリケーションとデータ集約型アプリケーションをAIで拡張するための図表と潜在的なソリューションを提案する。
論文参考訳（メタデータ） (2020-11-23T03:09:58Z)
AIPerf: Automated machine learning as an AI-HPC benchmark [17.57686674304368]
自動機械学習(AutoML)を利用したエンドツーエンドベンチマークスイートを提案する。アルゴリズムを並列かつ柔軟な方法で実装し、多様なシステムにおける効率性と最適化の可能性を保証する。フレキシブルなワークロードと単一のメトリックによって、私たちのベンチマークはAI-HPCのスケールとランク付けが容易になります。
論文参考訳（メタデータ） (2020-08-17T08:06:43Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。