論文の概要: MLCommons Chakra: Advancing Performance Benchmarking and Co-design using Standardized Execution Traces
- arxiv url: http://arxiv.org/abs/2605.11333v3
- Date: Tue, 19 May 2026 03:40:14 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-05-21 06:35:59.755319
- Title: MLCommons Chakra: Advancing Performance Benchmarking and Co-design using Standardized Execution Traces
- Title(参考訳): MLCommons Chakra: 標準化された実行トレースを使用したパフォーマンスベンチマークと共同設計の改善
- Authors: Srinivas Sridharan, Theodor-Adrian Badea, Andy Balogh, Bradford M. Beckmann, Brian Coutinho, Louis Feng, Sheng Fu, Sanshan Gao, Mehryar Garakani, Taekyung Heo, David Kanter, Josh Ladd, Ziwei Li, Winston Liu, Changhai Man, Dan Mihailescu, Spandan More, Joongun Park, Ashwin Ramachandran, Vinay Ramakrishnaiah, Saeed Rashidi, Vijay Janapa Reddi, Puneet Sharma, Phio Tian, William Won, Hanjiang Wu, Huan Xu, Jinsun Yoo, Tushar Krishna,
- Abstract要約: パフォーマンスベンチマークと共同設計のためのオープンでポータブルなエコシステムであるChakraを紹介します。
Chakraのコアコンポーネントは、Chakra実行トレース(ET)と呼ばれる、分散AI/MLワークロードのオープンで相互運用可能なグラフベースの表現である。
これらのETは、計算、メモリ、通信、データと制御の依存関係、タイミング、リソースの制約といった重要な操作を表す。
- 参考スコア(独自算出の注目度): 12.410424372802689
- License: http://creativecommons.org/licenses/by-nc-nd/4.0/
- Abstract: The fast pace of artificial intelligence~(AI) innovation demands an agile methodology for observation, reproduction and optimization of distributed machine learning~(ML) workload behavior in production AI systems and enables efficient software-hardware~(SW-HW) co-design for future systems. We present Chakra, an open and portable ecosystem for performance benchmarking and co-design. The core component of Chakra is an open and interoperable graph-based representation of distributed AI/ML workloads, called Chakra execution trace~(ET). These ETs represent key operations, such as compute, memory, and communication, data and control dependencies, timing, and resource constraints. Additionally, Chakra includes a complementary set of tools and capabilities to enable the collection, analysis, generation, and adoption of Chakra ETs by a broad range of simulators, emulators, and replay tools. We present analysis of Chakra ETs collected on production AI clusters and demonstrate value via real-world case studies. Chakra has been adopted by MLCommons and has active contributions and engagement across the industry, including but not limited to NVIDIA, AMD, Meta, Keysight, HPE, and Scala, to name a few.
- Abstract(参考訳): 人工知能の高速なペース~(AI)革新は、分散機械学習〜(ML)ワークロードの振る舞いをプロダクションAIシステムで観察、再現、最適化するためのアジャイル方法論を必要とし、将来のシステムで効率的なソフトウェア・ハードウエア〜(SW-HW)の共同設計を可能にします。
パフォーマンスベンチマークと共同設計のためのオープンでポータブルなエコシステムであるChakraを紹介します。
Chakraのコアコンポーネントは、Chakra実行トレース~(ET)と呼ばれる、分散AI/MLワークロードのオープンで相互運用可能なグラフベースの表現である。
これらのETは、計算、メモリ、通信、データと制御の依存関係、タイミング、リソースの制約といった重要な操作を表す。
さらにChakraには、さまざまなシミュレータ、エミュレータ、リプレイツールによるChakra ETの収集、分析、生成、導入を可能にする、補完的なツールセットと機能が含まれている。
実運用のAIクラスタ上で収集されたChakra ETの分析を行い、実世界のケーススタディを通して価値を実証する。
ChakraはMLCommonsに採用され、NVIDIA、AMD、Meta、Keysight、HPE、Scalaに限らず、業界全体で積極的にコントリビューションとエンゲージメントを行っている。
関連論文リスト
- Quantum Integrated High-Performance Computing: Foundations, Architectural Elements and Future Directions [19.209291403001416]
本稿では,CPU,GPU,FPGA,QPUを一級異種資源として統合するビジョンアーキテクチャフレームワークを提案する。
私たちのビジョンの中心的な側面は、統一されたジョブ・サブミッション・インターフェースを通じて異種リソースを公開する強力なユーザ・リクエスト・抽象化です。
スケーラブルで信頼性があり、プログラム可能な量子古典的なインフラを構築する際のオープンな課題を強調して、結論付けます。
論文 参考訳(メタデータ) (2026-04-17T04:29:16Z) - Energy Efficient Software Hardware CoDesign for Machine Learning: From TinyML to Large Language Models [0.4852108302782534]
本研究は,エッジ推論とトレーニングを対象とするエネルギー効率のよいソフトウェアハードウェア設計手法を,データセンター規模のLCMサービスにレビューする。
共通設計レバーとトレードオフを蒸留し、クロスプラットフォームの一般化、大規模でコストのかかる共同設計の検索スペース、ワークロードとデプロイメント設定間の一貫性のないベンチマークなど、繰り返し発生するギャップを強調します。
最後に、最適化戦略を計算的役割にマッピングし、漸進的適応をサポートし、エネルギーと炭素を意識したMLシステムを構築するための実践的なガイダンスを提供する階層的な分解の観点を概説する。
論文 参考訳(メタデータ) (2026-03-24T19:10:42Z) - Towards Agentic Intelligence for Materials Science [73.4576385477731]
この調査は、コーパスキュレーションからプレトレーニングから、シミュレーションと実験プラットフォームに面した目標条件付きエージェントまで、ユニークなパイプライン中心の視点を推し進める。
コミュニティをブリッジし、参照の共有フレームを確立するために、まず、AIと材料科学をまたいだ用語、評価、ワークフローの段階を整列する統合レンズを提示する。
論文 参考訳(メタデータ) (2026-01-29T23:48:43Z) - The AI_INFN Platform: Artificial Intelligence Development in the Cloud [0.0]
INFNイニシアチブであるAI_INFN(Artificial Intelligence at INFN)は、さまざまなINFN研究シナリオでMLメソッドの使用を促進することを目指している。
性能と統合結果の両方を実証し、予備ベンチマーク、機能テスト、ケーススタディを示す。
論文 参考訳(メタデータ) (2025-09-26T09:40:51Z) - A Survey on Cloud-Edge-Terminal Collaborative Intelligence in AIoT Networks [49.90474228895655]
クラウドエッジ端末協調インテリジェンス(CETCI)は、モノの人工知能(AIoT)コミュニティにおける基本的なパラダイムである。
CETCIは、分離されたレイヤ最適化からデプロイ可能なコラボレーティブインテリジェンスシステムに移行する、新興のAIoTアプリケーションで大きな進歩を遂げた。
本調査では、基礎アーキテクチャ、CETCIパラダイムのテクノロジの実現、シナリオについて解説し、CISAIOT初心者向けのチュートリアルスタイルのレビューを提供する。
論文 参考訳(メタデータ) (2025-08-26T08:38:01Z) - Edge-Cloud Collaborative Computing on Distributed Intelligence and Model Optimization: A Survey [58.50944604905037]
エッジクラウドコラボレーティブコンピューティング(ECCC)は、現代のインテリジェントアプリケーションの計算要求に対処するための重要なパラダイムとして登場した。
AIの最近の進歩、特にディープラーニングと大規模言語モデル(LLM)は、これらの分散システムの能力を劇的に向上させてきた。
この調査は、基本的なアーキテクチャ、技術の実現、新しいアプリケーションに関する構造化されたチュートリアルを提供する。
論文 参考訳(メタデータ) (2025-05-03T13:55:38Z) - Chakra: Advancing Performance Benchmarking and Co-design using
Standardized Execution Traces [5.692357167709513]
作業負荷仕様を標準化するためのオープングラフスキーマであるChakraを提案する。
例えば、生成AIモデルを使用して、何千ものChakra ETの潜在統計特性を学習し、これらのモデルを使用してChakra ETを合成します。
私たちのゴールは、将来のAIシステムの共同設計を推進するために、業界全体のアジャイルベンチマークとツールの活発なエコシステムを構築することです。
論文 参考訳(メタデータ) (2023-05-23T20:45:45Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。