論文の概要: Twelve quick tips for designing AI-driven HPC workflows
- arxiv url: http://arxiv.org/abs/2606.07491v1
- Date: Fri, 05 Jun 2026 17:46:32 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-06-08 14:33:29.876535
- Title: Twelve quick tips for designing AI-driven HPC workflows
- Title(参考訳): AI駆動型HPCワークフロー設計のための12のクイックヒント
- Authors: Jamie J. Alnasir,
- Abstract要約: このガイドは、研究者が効率的でスケーラブルで再現可能なAI駆動型HPCの設計を支援するために設計された12の実用的なヒントを提供する。
環境ポータビリティのためのコンテナ化、ジョブアレイの戦略的展開、明示的なフィードバックループ機構、小さなファイルのためのI/Oといった重要なシステムレベルのボトルネックに対処することで、この記事では、厳格な実行パイプラインから適応的なインテリジェントな計算環境に移行するためのフレームワークを提供します。
- 参考スコア(独自算出の注目度): 0.0
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: High-performance computing (HPC) clusters remain the backbone of large-scale scientific computation, traditionally executing deterministic, linear pipelines optimised for predictable performance. However, the pervasive integration of artificial intelligence (AI) and foundation models into scientific research has introduced a fundamentally new computational paradigm. AI-driven workflows are characteristically iterative, data-driven, and probabilistic, introducing unique challenges regarding data gravity, heterogeneous resource management, and complex workflow orchestration. This guide provides twelve practical tips designed to help researchers design efficient, scalable, and reproducible AI-driven HPC workflows. By addressing critical system-level bottlenecks - such as containerisation for environment portability, strategic deployment of job arrays, explicit feedback loop mechanics, and I/O optimisation for small files - this article offers a framework for transitioning from rigid execution pipelines to adaptive, intelligent computational environments. While these architectural principles are broadly applicable across distributed environments, they are particularly tailored to the resource-intensive throughput demands of modern computational biology.
- Abstract(参考訳): ハイパフォーマンスコンピューティング(HPC)クラスタは、予測可能なパフォーマンスのために最適化された決定論的線形パイプラインを伝統的に実行する、大規模科学計算のバックボーンのままである。
しかし、人工知能(AI)と基礎モデルの科学的研究への広範な統合により、根本的に新しい計算パラダイムが導入された。
AI駆動ワークフローは、データ重力、異質なリソース管理、複雑なワークフローオーケストレーションに関するユニークな課題を導入し、反復的、データ駆動、確率的である。
このガイドは、研究者が効率的でスケーラブルで再現可能なAI駆動HPCワークフローの設計を支援するために設計された12の実用的なヒントを提供する。
環境ポータビリティのためのコンテナ化、ジョブアレイの戦略的展開、明示的なフィードバックループ機構、小さなファイルのためのI/O最適化といった重要なシステムレベルのボトルネックに対処することで、この記事では、厳格な実行パイプラインから適応的でインテリジェントな計算環境に移行するためのフレームワークを提供します。
これらのアーキテクチャの原則は分散環境に広く適用されているが、現代の計算生物学における資源集約的なスループット要求に特化している。
関連論文リスト
- Scalable AI-assisted Workflow Management for Detector Design Optimization Using Distributed Computing [0.7287445515583322]
本稿では,多目的ベイズ最適化を統合した検出器設計最適化のためのAI支援フレームワークを提案する。
我々は、Electron-Ion Collider(EIC)のためのベンチマーク問題とePICおよびdRICH検出器の現実的研究を用いたフレームワークを実証する。
その結果、多目的最適化における自動化、スケーラビリティ、効率性が向上した。
論文 参考訳(メタデータ) (2026-03-31T17:11:16Z) - EmboCoach-Bench: Benchmarking AI Agents on Developing Embodied Robots [68.29056647487519]
Embodied AIは、高忠実度シミュレーションと大規模データ収集によって実現されている。
しかし、このスケーリング能力は、労働集約的な手作業の監視に依存しているため、いまだにボトルネックになっている。
実装ポリシーを自律的に構築するための LLM エージェントの能力を評価するベンチマークである textscEmboCoach-Bench を紹介する。
論文 参考訳(メタデータ) (2026-01-29T11:33:49Z) - Optimizing the Network Topology of a Linear Reservoir Computer [0.0]
貯留層コンピューティング(Reservoir computing)は、予測および観測タスクのための時間データを処理する機械学習ツールである。
伝統的に、貯水池コンピュータ(RC)の接続はランダムに発生し、基本設計を欠いている。
本稿では,線形RCのトポロジを最適化し,その性能と解釈性を改善することに焦点を当てる。
論文 参考訳(メタデータ) (2025-09-27T16:24:53Z) - Provenance Tracking in Large-Scale Machine Learning Systems [0.0]
y4MLは、W3C PROVとProvProvML標準に準拠したフォーマットでデータを収集するように設計されたツールである。
y4MLはyProvフレームワークと完全に統合されており、ワークフロー管理システムを通じて実行されるタスクの高レベルなペアリングを可能にする。
論文 参考訳(メタデータ) (2025-07-01T14:10:02Z) - Performance Analysis of Convolutional Neural Network By Applying Unconstrained Binary Quadratic Programming [0.0]
畳み込みニューラルネットワーク(CNN)は、コンピュータビジョンとビッグデータ分析において重要であるが、大規模なデータセットでトレーニングされた場合には、かなりの計算リソースを必要とする。
CNNトレーニングを高速化するために,Unconstrained Binary Quadratic Programming (UBQP) と Gradient Descent (SGD) を組み合わせたハイブリッド最適化手法を提案する。
提案手法は, BP-CNNベースラインの10-15%の精度向上を実現し, 同様の実行時間を維持する。
論文 参考訳(メタデータ) (2025-05-30T21:25:31Z) - Edge-Cloud Collaborative Computing on Distributed Intelligence and Model Optimization: A Survey [58.50944604905037]
エッジクラウドコラボレーティブコンピューティング(ECCC)は、現代のインテリジェントアプリケーションの計算要求に対処するための重要なパラダイムとして登場した。
AIの最近の進歩、特にディープラーニングと大規模言語モデル(LLM)は、これらの分散システムの能力を劇的に向上させてきた。
この調査は、基本的なアーキテクチャ、技術の実現、新しいアプリケーションに関する構造化されたチュートリアルを提供する。
論文 参考訳(メタデータ) (2025-05-03T13:55:38Z) - A Survey on Inference Optimization Techniques for Mixture of Experts Models [50.40325411764262]
大規模Mixture of Experts(MoE)モデルは、条件計算によるモデル容量と計算効率の向上を提供する。
これらのモデル上で推論をデプロイし実行することは、計算資源、レイテンシ、エネルギー効率において大きな課題を示す。
本調査では,システムスタック全体にわたるMoEモデルの最適化手法について分析する。
論文 参考訳(メタデータ) (2024-12-18T14:11:15Z) - Integrating Deep Learning in Domain Sciences at Exascale [2.241545093375334]
我々は,大規模HPCシステム上でディープラーニングモデルとアプリケーションを効率的に動作させるための既存パッケージの評価を行った。
本稿では,現在の大規模異種システムに対する新しい非同期並列化と最適化手法を提案する。
従来の計算集約型アプリケーションとデータ集約型アプリケーションをAIで拡張するための図表と潜在的なソリューションを提案する。
論文 参考訳(メタデータ) (2020-11-23T03:09:58Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。