論文の概要: AI Factories: It's time to rethink the Cloud-HPC divide
- arxiv url: http://arxiv.org/abs/2509.12849v1
- Date: Tue, 16 Sep 2025 09:08:05 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-09-17 17:50:52.987673
- Title: AI Factories: It's time to rethink the Cloud-HPC divide
- Title(参考訳): AIファクトリ:クラウドとHPCの分断を再考する時が来た
- Authors: Pedro Garcia Lopez, Daniel Barcelona Pons, Marcin Copik, Torsten Hoefler, Eduardo Quiñones, Maciej Malawski, Peter Pietzutch, Alberto Marti, Thomas Ohlson Timoudas, Aleksander Slominski,
- Abstract要約: この記事では、HPCとクラウドネイティブ技術の統合という、スーパーコンピュータにおけるデュアルスタックアプローチを提唱する。
私たちのゴールは、ハイパフォーマンスとハードウェアアクセラレーションと使いやすさとサービス指向のフロントエンドを組み合わせることで、HPCとクラウドコンピューティングの隔たりを埋めることです。
- 参考スコア(独自算出の注目度): 43.712212475089224
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: The strategic importance of artificial intelligence is driving a global push toward Sovereign AI initiatives. Nationwide governments are increasingly developing dedicated infrastructures, called AI Factories (AIF), to achieve technological autonomy and secure the resources necessary to sustain robust local digital ecosystems. In Europe, the EuroHPC Joint Undertaking is investing hundreds of millions of euros into several AI Factories, built atop existing high-performance computing (HPC) supercomputers. However, while HPC systems excel in raw performance, they are not inherently designed for usability, accessibility, or serving as public-facing platforms for AI services such as inference or agentic applications. In contrast, AI practitioners are accustomed to cloud-native technologies like Kubernetes and object storage, tools that are often difficult to integrate within traditional HPC environments. This article advocates for a dual-stack approach within supercomputers: integrating both HPC and cloud-native technologies. Our goal is to bridge the divide between HPC and cloud computing by combining high performance and hardware acceleration with ease of use and service-oriented front-ends. This convergence allows each paradigm to amplify the other. To this end, we will study the cloud challenges of HPC (Serverless HPC) and the HPC challenges of cloud technologies (High-performance Cloud).
- Abstract(参考訳): 人工知能の戦略的重要性は、Sovereign AIイニシアチブへのグローバルな推進を推進している。
各国政府は、技術的自律性を達成し、ロバストなローカルデジタルエコシステムを維持するために必要なリソースを確保するために、AIF(AI Factories)と呼ばれる専用インフラの開発をますます進めている。
ヨーロッパでは、EuroHPC Joint Undertakeは、既存の高性能コンピューティング(HPC)スーパーコンピュータの上に構築された、数億ユーロのAIファクトリーに投資している。
しかしながら、HPCシステムは生のパフォーマンスは優れているが、本質的にはユーザビリティ、アクセシビリティ、あるいは推論やエージェントアプリケーションなどのAIサービスのパブリックなプラットフォームとして機能するために設計されていない。
それとは対照的に、AI実践者は、従来のHPC環境に統合するのが困難な、Kubernetesやオブジェクトストレージといったクラウドネイティブなテクノロジに慣れている。
この記事では、HPCとクラウドネイティブ技術の統合という、スーパーコンピュータにおけるデュアルスタックアプローチを提唱する。
私たちのゴールは、ハイパフォーマンスとハードウェアアクセラレーションと使いやすさとサービス指向のフロントエンドを組み合わせることで、HPCとクラウドコンピューティングの隔たりを埋めることです。
この収束により、各パラダイムは互いに増幅することができる。
この目的のために,HPC(サーバーレスHPC)のクラウド課題とクラウド技術(高性能クラウド)のHPC課題について検討する。
関連論文リスト
- Transforming the Hybrid Cloud for Emerging AI Workloads [82.21522417363666]
このホワイトペーパーでは、AIワークロードの複雑さの増大に対応するために、ハイブリッドクラウドシステムを変革することを想定している。
提案したフレームワークは、エネルギー効率、性能、コスト効率において重要な課題に対処する。
この共同イニシアチブは、ハイブリッドクラウドをセキュアで効率的で持続可能なプラットフォームとして確立することを目的としています。
論文 参考訳(メタデータ) (2024-11-20T11:57:43Z) - AI-Driven Innovations in Modern Cloud Computing [2.3931689873603594]
本稿では,AIとクラウドコンピューティングがアプリケーションモダナイズのためのトランスフォーメーション機能を実現するためにどのように相互作用するかを考察する。
AIとクラウドの両技術の組み合わせによって、テクノロジプロバイダはインテリジェントなリソース管理、予測分析、自動デプロイメントとスケーリングを活用できるようになった。
論文 参考訳(メタデータ) (2024-10-21T12:45:10Z) - Computing in the Era of Large Generative Models: From Cloud-Native to
AI-Native [46.7766555589807]
クラウドネイティブ技術と高度な機械学習推論の両方のパワーを利用するAIネイティブコンピューティングパラダイムについて説明する。
これらの共同作業は、コスト・オブ・グッド・ソード(COGS)を最適化し、資源のアクセシビリティを向上させることを目的としている。
論文 参考訳(メタデータ) (2024-01-17T20:34:11Z) - Green Edge AI: A Contemporary Survey [46.11332733210337]
AIの変換力は、ディープニューラルネットワーク(DNN)の利用から導かれる。
ディープラーニング(DL)は、エンドユーザーデバイス(EUD)に近い無線エッジネットワークに移行しつつある。
その可能性にもかかわらず、エッジAIは大きな課題に直面している。主な原因は、無線エッジネットワークのリソース制限と、DLのリソース集約的な性質の分離である。
論文 参考訳(メタデータ) (2023-12-01T04:04:37Z) - One nine availability of a Photonic Quantum Computer on the Cloud toward
HPC integration [0.8961191069175432]
2022年11月、我々は単一の光子をベースとしたクラウドアクセス可能な汎用量子コンピュータを初めて導入した。
クラウドアクセス可能な量子コンピューティングプラットフォームの設計と実装について説明するとともに、9つの可用性(外部ユーザに対しては6ヶ月間の92、ほとんどのオンラインサービスよりも高い92)を実証する。
この研究は、ハイブリッドHPC-QCインフラにおける量子コンピューティングアクセシビリティとユーザビリティの進歩の基礎となった。
論文 参考訳(メタデータ) (2023-08-28T13:47:39Z) - Future Computer Systems and Networking Research in the Netherlands: A
Manifesto [137.47124933818066]
我々はICTの重要部分としてCompSysに注目している。
オランダ経済のトップセクター、国家研究アジェンダの各ルート、国連持続可能な開発目標の各ルートは、コンプシーズの進歩なしには対処できない課題を提起する。
論文 参考訳(メタデータ) (2022-05-26T11:02:29Z) - Edge-Cloud Polarization and Collaboration: A Comprehensive Survey [61.05059817550049]
クラウドとエッジ両方のAIの体系的なレビューを行います。
私たちはクラウドとエッジモデリングの協調学習メカニズムを最初にセットアップしました。
我々は現在進行中の最先端AIトピックの可能性と実践経験について議論する。
論文 参考訳(メタデータ) (2021-11-11T05:58:23Z) - Artificial Intelligence at the Edge [25.451110446336276]
5Gモバイル通信ネットワークは通信容量を増やし、伝送遅延とエラーを低減し、省エネする。
将来の6Gテクノロジーは、可視光通信など、より多くの技術を統合します。
多くのアプリケーションは、アプリケーションのエンドポイントに近い計算と分析を必要とします。つまり、中央集権型クラウドではなく、ネットワークの端にあります。
論文 参考訳(メタデータ) (2020-12-10T02:08:47Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。