Fugu-MT 論文翻訳(概要): Benchmarking Performance of Deep Learning Model for Material Segmentation on Two HPC Systems

論文の概要: Benchmarking Performance of Deep Learning Model for Material Segmentation on Two HPC Systems

arxiv url: http://arxiv.org/abs/2307.14921v1
Date: Thu, 27 Jul 2023 15:03:13 GMT
ステータス: 翻訳完了
システム内更新日: 2023-07-28 14:13:57.722687
Title: Benchmarking Performance of Deep Learning Model for Material Segmentation on Two HPC Systems
Title（参考訳）: 2つのHPCシステムにおける材料セグメンテーションのためのディープラーニングモデルのベンチマーク性能
Authors: Warren R. Williams, S. Ross Glandon, Luke L. Morris, Jing-Ru C. Cheng
Abstract要約: パフォーマンスデータは、OnyxとVulcaniteという2つのERDC DSRCシステム上で収集される。 Vulcaniteは、多数のベンチマークにおいてより高速なモデル時間を持ち、Onyxよりもパフォーマンスを遅くする可能性のある環境要因も考慮されている。
参考スコア（独自算出の注目度）: 0.0
License: http://creativecommons.org/licenses/by/4.0/
Abstract: Performance Benchmarking of HPC systems is an ongoing effort that seeks to provide information that will allow for increased performance and improve the job schedulers that manage these systems. We develop a benchmarking tool that utilizes machine learning models and gathers performance data on GPU-accelerated nodes while they perform material segmentation analysis. The benchmark uses a ML model that has been converted from Caffe to PyTorch using the MMdnn toolkit and the MINC-2500 dataset. Performance data is gathered on two ERDC DSRC systems, Onyx and Vulcanite. The data reveals that while Vulcanite has faster model times in a large number of benchmarks, and it is also more subject to some environmental factors that can cause performances slower than Onyx. In contrast the model times from Onyx are consistent across benchmarks.
Abstract（参考訳）: HPCシステムのパフォーマンスベンチマークは、パフォーマンスの向上と、これらのシステムを管理するジョブスケジューラの改善を可能にする情報の提供を目的としている。我々は,機械学習モデルを利用したベンチマークツールを開発し,材料セグメンテーション解析を行う間,GPUアクセラレーションノードのパフォーマンスデータを収集する。このベンチマークでは、MMdnnツールキットとMINC-2500データセットを使用して、CaffeからPyTorchに変換されたMLモデルを使用している。パフォーマンスデータは2つのERDC DSRCシステム、OnyxとVulcaniteで収集される。このデータによると、vulcaniteは多数のベンチマークでモデルタイムが速いが、onyxよりもパフォーマンスを遅くする可能性のあるいくつかの環境要因の影響を受けやすい。対照的に、onyxのモデル時間はベンチマーク間で一貫しています。

関連論文リスト

ChipBench: A Next-Step Benchmark for Evaluating LLM Performance in AI-Aided Chip Design [15.71144418188142]
大規模言語モデル(LLM)は、ハードウェア工学において大きな可能性を秘めている。現在のベンチマークでは飽和とタスクの多様性が制限されている。本稿では,AI支援チップ設計のための総合ベンチマークを提案する。
論文参考訳（メタデータ） (2026-01-29T09:26:55Z)
Predictive Modeling of I/O Performance for Machine Learning Training Pipelines: A Data-Driven Approach to Storage Optimization [0.0]
現代の機械学習トレーニングは、計算よりもデータI/Oによってますますボトルネックになっている。本稿では,機械学習によるI/O性能の予測と,MLトレーニングパイプラインのための最適なストレージ構成を提案する。
論文参考訳（メタデータ） (2025-12-07T07:25:08Z)
Optimizing PyTorch Inference with LLM-Based Multi-Agent Systems [1.2289544895833646]
マルチエージェントPyTorch最適化システムを比較するためのフレームワークを提案する。エラー修正エージェントと組み合わせた場合,エクスプロイトヘビー戦略が最善であることを示す。最も優れた実装は、H100 GPU上で平均2.88倍のスピードアップを達成する。
論文参考訳（メタデータ） (2025-11-21T05:37:38Z)
DS@GT at LongEval: Evaluating Temporal Performance in Web Search Systems and Topics with Two-Stage Retrieval [44.99833362998488]
DS@GTコンペティションチームはCLEF 2025のLongEval(LongEval)実験室に参加した。 Qwant Webデータセットの分析には、時間とともにトピックモデリングを伴う探索的データ分析が含まれる。我々のベストシステムは、トレーニングとテストデータセット全体で平均0.296のNDCG@10を達成し、2023-05で全体のスコアは0.395である。
論文参考訳（メタデータ） (2025-07-11T07:23:08Z)
AIvaluateXR: An Evaluation Framework for on-Device AI in XR with Benchmarking Results [55.33807002543901]
我々は,XRデバイス上で動作する大規模言語モデル(LLM)をベンチマークするための総合評価フレームワークであるAIvaluateXRを提案する。我々はMagic Leap 2、Meta Quest 3、Vivo X100s Pro、Apple Vision Proという4つのXRプラットフォームに17個の選択されたLSMをデプロイし、広範囲な評価を行います。本稿では,3次元最適性理論に基づく統一評価手法を提案する。
論文参考訳（メタデータ） (2025-02-13T20:55:48Z)
SMPLest-X: Ultimate Scaling for Expressive Human Pose and Shape Estimation [81.36747103102459]
表現的人間のポーズと形状推定(EHPS)は、身体、手、顔の動きを多数の応用で統合する。現在の最先端の手法は、限定されたデータセット上で革新的なアーキテクチャ設計を訓練することに焦点を当てている。本稿では,EHPSのスケールアップが一般基盤モデルのファミリに与える影響について検討する。
論文参考訳（メタデータ） (2025-01-16T18:59:46Z)
LiveXiv -- A Multi-Modal Live Benchmark Based on Arxiv Papers Content [62.816876067499415]
我々は、科学的ArXiv論文に基づくスケーラブルな進化型ライブベンチマークであるLiveXivを提案する。 LiveXivは、任意のタイムスタンプでドメイン固有の原稿にアクセスし、視覚的な問合せペアを自動的に生成することを提案する。ベンチマークの最初のバージョンで、複数のオープンでプロプライエタリなLMM(Large Multi-modal Models)をベンチマークし、その挑戦的な性質を示し、モデルの真の能力を明らかにする。
論文参考訳（メタデータ） (2024-10-14T17:51:23Z)
SMPLer-X: Scaling Up Expressive Human Pose and Shape Estimation [83.18930314027254]
表現的人間のポーズと形状推定(EHPS)は、身体、手、顔の動きを多数の応用で統合する。本研究では,VT-Huge をバックボーンとする第1次一般基礎モデル (SMPLer-X) に向けた EHPS のスケールアップについて検討する。ビッグデータと大規模モデルにより、SMPLer-Xは、さまざまなテストベンチマークにまたがる強力なパフォーマンスと、目に見えない環境への優れた転送性を示す。
論文参考訳（メタデータ） (2023-09-29T17:58:06Z)
Temporal Graph Benchmark for Machine Learning on Temporal Graphs [54.52243310226456]
テンポラルグラフベンチマーク(TGB)は、困難で多様なベンチマークデータセットのコレクションである。各データセットをベンチマークし、共通のモデルのパフォーマンスがデータセット間で大きく異なることを発見した。 TGBは、再現可能でアクセス可能な時間グラフ研究のための自動機械学習パイプラインを提供する。
論文参考訳（メタデータ） (2023-07-03T13:58:20Z)
Benchmarking Edge Computing Devices for Grape Bunches and Trunks Detection using Accelerated Object Detection Single Shot MultiBox Deep Learning Models [2.1922186455344796]
この研究は、オブジェクト検出のための異なるプラットフォームのパフォーマンスをリアルタイムでベンチマークする。著者らは、自然なVineデータセットを使用して、RetinaNet ResNet-50を微調整した。
論文参考訳（メタデータ） (2022-11-21T17:02:33Z)
Tech Report: One-stage Lightweight Object Detectors [0.38073142980733]
この研究は、mAPと遅延の点でよく機能するワンステージ軽量検出器を設計するためのものである。 GPUとCPUを対象とするベースラインモデルでは、ベースラインモデルのバックボーンネットワークにおけるメイン操作の代わりに、さまざまな操作が適用される。
論文参考訳（メタデータ） (2022-10-31T09:02:37Z)
PDEBENCH: An Extensive Benchmark for Scientific Machine Learning [20.036987098901644]
部分微分方程式(PDE)に基づく時間依存シミュレーションタスクのベンチマークスイートであるPDEBenchを紹介する。 PDEBenchは、コードとデータの両方で構成され、古典的な数値シミュレーションと機械学習ベースラインの両方に対して、新しい機械学習モデルのパフォーマンスをベンチマークする。
論文参考訳（メタデータ） (2022-10-13T17:03:36Z)
NumS: Scalable Array Programming for the Cloud [82.827921577004]
タスクベース分散システム上でNumPyのような表現を最適化する配列プログラミングライブラリであるNumSを提案する。これはLoad Simulated Hierarchical Scheduling (LSHS)と呼ばれる新しいスケジューラによって実現される。 LSHSは、ネットワーク負荷を2倍減らし、メモリを4倍減らし、ロジスティック回帰問題において実行時間を10倍減らし、Rayの性能を向上させる。
論文参考訳（メタデータ） (2022-06-28T20:13:40Z)
Building a Performance Model for Deep Learning Recommendation Model Training on GPUs [6.05245376098191]
我々は、ディープラーニング勧告モデル(DLRM)のGPUトレーニングのためのパフォーマンスモデルを作成する。デバイスアクティブ時間(カーネルランタイムの総和)とデバイスアイドル時間の両方が、デバイスタイム全体の重要なコンポーネントであることを示す。本稿では,その実行グラフをトラバースすることで,DLRMのバッチごとのトレーニング時間を予測できるクリティカルパスベースのアルゴリズムを提案する。
論文参考訳（メタデータ） (2022-01-19T19:05:42Z)
MLPerfTM HPC: A Holistic Benchmark Suite for Scientific Machine Learning on HPC Systems [32.621917787044396]
我々はMLCommonsTM Associationが推進する科学機械学習トレーニングアプリケーションのベンチマークスイートであるHPCを紹介する。共同分析のための体系的なフレームワークを開発し、データステージング、アルゴリズム収束、計算性能の観点から比較する。低レベルのメモリ、I/O、ネットワークの振る舞いに関して、各ベンチマークを特徴付けることで結論付ける。
論文参考訳（メタデータ） (2021-10-21T20:30:12Z)
Providing Meaningful Data Summarizations Using Examplar-based Clustering in Industry 4.0 [67.80123919697971]
我々は,従来のCPUアルゴリズムと比較して,一精度で最大72倍,半精度で最大452倍の高速化を実現していることを示す。提案アルゴリズムは射出成形プロセスから得られた実世界のデータに適用し, 得られたサマリーが, コスト削減と不良部品製造の削減のために, この特定のプロセスのステアリングにどのように役立つかについて議論する。
論文参考訳（メタデータ） (2021-05-25T15:55:14Z)
RadixSpline: A Single-Pass Learned Index [84.84747738666263]
RadixSpline(RS)は、データに1回のパスで構築できる学習インデックスです。 RSは2つのパラメータしか持たないにもかかわらず、すべてのデータセットで競合的な結果を達成する。
論文参考訳（メタデータ） (2020-04-30T01:56:54Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。