論文の概要: Inference-optimized AI and high performance computing for gravitational
wave detection at scale
- arxiv url: http://arxiv.org/abs/2201.11133v1
- Date: Wed, 26 Jan 2022 19:00:01 GMT
- ステータス: 処理完了
- システム内更新日: 2022-01-28 14:43:47.794692
- Title: Inference-optimized AI and high performance computing for gravitational
wave detection at scale
- Title(参考訳): 大規模重力波検出のための推論最適化AIと高性能計算
- Authors: Pranshu Chaturvedi, Asad Khan, Minyang Tian, E. A. Huerta and Huihuo
Zheng
- Abstract要約: 我々は、32ノードを用いたサミットスーパーコンピュータでトレーニングした重力波検出のための人工知能モデルのアンサンブルを導入する。
我々はArgonne Leadership Computer FacilityのThetaGPUスーパーコンピュータに推論最適化AIアンサンブルをデプロイする。
NVIDIARTに最適化されたAIアンサンブルは、50秒以内に、先進的なLIGOデータ(ハンフォードやリビングストンのデータストリームを含む)の1ヶ月を要した。
- 参考スコア(独自算出の注目度): 3.6118662460334527
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: We introduce an ensemble of artificial intelligence models for gravitational
wave detection that we trained in the Summit supercomputer using 32 nodes,
equivalent to 192 NVIDIA V100 GPUs, within 2 hours. Once fully trained, we
optimized these models for accelerated inference using NVIDIA TensorRT. We
deployed our inference-optimized AI ensemble in the ThetaGPU supercomputer at
Argonne Leadership Computer Facility to conduct distributed inference. Using
the entire ThetaGPU supercomputer, consisting of 20 nodes each of which has 8
NVIDIA A100 Tensor Core GPUs and 2 AMD Rome CPUs, our NVIDIA TensorRT-optimized
AI ensemble porcessed an entire month of advanced LIGO data (including Hanford
and Livingston data streams) within 50 seconds. Our inference-optimized AI
ensemble retains the same sensitivity of traditional AI models, namely, it
identifies all known binary black hole mergers previously identified in this
advanced LIGO dataset and reports no misclassifications, while also providing a
3X inference speedup compared to traditional artificial intelligence models. We
used time slides to quantify the performance of our AI ensemble to process up
to 5 years worth of advanced LIGO data. In this synthetically enhanced dataset,
our AI ensemble reports an average of one misclassification for every month of
searched advanced LIGO data. We also present the receiver operating
characteristic curve of our AI ensemble using this 5 year long advanced LIGO
dataset. This approach provides the required tools to conduct accelerated,
AI-driven gravitational wave detection at scale.
- Abstract(参考訳): 2時間以内に192 nvidia v100 gpuに相当する32ノードを使用して、summitスーパーコンピュータでトレーニングした重力波検出のための人工知能モデルのアンサンブルを導入する。
トレーニングが完了したら、NVIDIA TensorRTを使用して、これらのモデルを高速化推論に最適化しました。
我々は,分散推論を行うために,Argonne Leadership Computer FacilityのThetaGPUスーパーコンピュータに推論最適化AIアンサンブルを配置した。
8つのNVIDIA A100 Tensor Core GPUと2つのAMD Rome CPUを持つ20のノードからなるThetaGPUスーパーコンピュータを使用すれば、NVIDIA TensorRTに最適化されたAIアンサンブルは50秒以内に1ヶ月の高度なLIGOデータ(ハンフォードとリビングストンのデータストリームを含む)を取得できた。
私たちの推論最適化AIアンサンブルは、従来のAIモデルと同じ感度を維持している、すなわち、この先進的なLIGOデータセットで以前に特定されたすべての既知のバイナリブラックホールマージを特定し、誤分類を報告せず、従来の人工知能モデルと比較して3倍の推論スピードアップを提供する。
私たちは、AIアンサンブルのパフォーマンスを定量化するために、時間スライドを使用して、最大5年分の高度なLIGOデータを処理しました。
この合成強化データセットでは、我々のAIアンサンブルは、検索された高度なLIGOデータの毎月1つの誤分類を報告します。
また、この5年間の進歩LIGOデータセットを用いて、AIアンサンブルの受信機動作特性曲線を示す。
このアプローチは、大規模でai駆動の重力波検出を行うために必要なツールを提供する。
関連論文リスト
- Generative Diffusion-based Contract Design for Efficient AI Twins Migration in Vehicular Embodied AI Networks [55.15079732226397]
Embodied AIは、サイバースペースと物理空間のギャップを埋める、急速に進歩する分野だ。
VEANETでは、組み込まれたAIツインが車載AIアシスタントとして機能し、自律運転をサポートするさまざまなタスクを実行する。
論文 参考訳(メタデータ) (2024-10-02T02:20:42Z) - AI-Generated Images as Data Source: The Dawn of Synthetic Era [61.879821573066216]
生成AIは、現実世界の写真によく似た合成画像を作成する可能性を解き放った。
本稿では、これらのAI生成画像を新しいデータソースとして活用するという革新的な概念を探求する。
実際のデータとは対照的に、AI生成データには、未整合のアブリダンスやスケーラビリティなど、大きなメリットがある。
論文 参考訳(メタデータ) (2023-10-03T06:55:19Z) - AI ensemble for signal detection of higher order gravitational wave
modes of quasi-circular, spinning, non-precessing binary black hole mergers [0.36832029288386137]
我々は、準時間的、回転的、必要でない二元ブラックホール質量を記述した240万の波形を持つAIを訓練する。
次に、転送を使用して、潜在的な二元ブラックホールの総質量を推定する学習予測器を作成する。
これは、重力順の重力波モード信号を探し、見つけるために設計された最初のAIアンサンブルである。
論文 参考訳(メタデータ) (2023-09-29T18:00:03Z) - Physics-inspired spatiotemporal-graph AI ensemble for the detection of higher order wave mode signals of spinning binary black hole mergers [0.2999888908665658]
準円、回転、不要な二元ブラックホールの融合を検出するための新しいAIモデルを提案する。
これらのAIモデルは、ハイブリッド拡張ニューラルネットワークを組み合わせて、重力波の短距離時間情報と長距離時間情報を正確にモデル化する。
論文 参考訳(メタデータ) (2023-06-27T18:09:15Z) - Tricking AI chips into Simulating the Human Brain: A Detailed
Performance Analysis [0.5354801701968198]
脳シミュレーションでは、複数の最先端AIチップ(Graphcore IPU、GroqChip、劣悪なCoreを持つNvidia GPU、Google TPU)を評価した。
性能解析の結果,シミュレーション問題はGPUとTPUアーキテクチャに極めてよく対応していることがわかった。
GroqChipは、小さなネットワークにおいて両方のプラットフォームより優れているが、精度の低い浮動小数点演算を実装しているため、脳シミュレーションではまだ利用できない。
論文 参考訳(メタデータ) (2023-01-31T13:51:37Z) - ProcTHOR: Large-Scale Embodied AI Using Procedural Generation [55.485985317538194]
ProcTHORは、Embodied AI環境の手続き的生成のためのフレームワークである。
ナビゲーション、アレンジメント、アーム操作のための6つの具体化されたAIベンチマークに対して、最先端の結果を実証する。
論文 参考訳(メタデータ) (2022-06-14T17:09:35Z) - FPGA-based AI Smart NICs for Scalable Distributed AI Training Systems [62.20308752994373]
我々は、フィールドプログラマブルゲートアレイ(FPGA)を用いた分散AI訓練システムのための新しいスマートネットワークインタフェースカード(NIC)を提案する。
提案するFPGAベースのAIスマートNICは,従来のNICを用いたベースラインシステムと比較して,6ノードで1.6倍,32ノードで2.5倍の性能向上が期待できる。
論文 参考訳(メタデータ) (2022-04-22T21:57:00Z) - FPGA-optimized Hardware acceleration for Spiking Neural Networks [69.49429223251178]
本研究は,画像認識タスクに適用したオフライントレーニングによるSNN用ハードウェアアクセラレータの開発について述べる。
この設計はXilinx Artix-7 FPGAをターゲットにしており、利用可能なハードウェアリソースの40%を合計で使用している。
分類時間を3桁に短縮し、ソフトウェアと比較すると精度にわずか4.5%の影響を与えている。
論文 参考訳(メタデータ) (2022-01-18T13:59:22Z) - ElegantRL-Podracer: Scalable and Elastic Library for Cloud-Native Deep
Reinforcement Learning [141.58588761593955]
クラウドネイティブな深層強化学習のためのライブラリElegantRL-podracerを提案する。
数百万のコアを効率的にサポートし、複数のレベルで大規模な並列トレーニングを実行する。
低レベルでは、各ポッドは1つのGPUで7,000近いGPUコアをフル活用することで、エージェントと環境のインタラクションを並列にシミュレートする。
論文 参考訳(メタデータ) (2021-12-11T06:31:21Z) - Confluence of Artificial Intelligence and High Performance Computing for
Accelerated, Scalable and Reproducible Gravitational Wave Detection [4.081122815035999]
DOEとNSFが支援するサイバーインフラストラクチャーの接続によって、機械学習モデルをパブリッシュする方法を実証する。
次に、このワークフローを用いて、オープンソースの先進LIGOデータにおいて、二元ブラックホール重力波信号を探索する。
このワークフローを使うことで、オープンソースで利用可能な4つのディープラーニングモデルのアンサンブルがHAL上で実行でき、2017年8月のLIGOデータの高度な処理をわずか7分で行うことができる。
論文 参考訳(メタデータ) (2020-12-15T19:00:29Z) - CLAN: Continuous Learning using Asynchronous Neuroevolution on Commodity
Edge Devices [3.812706195714961]
我々は、NeuroEvolutionary(NE)学習と推論を実行するWiFiを介して通信するRaspberry Piのプロトタイプシステムを構築した。
本研究では,このような協調システムの性能を評価し,システムの異なる配置の計算/通信特性について詳述する。
論文 参考訳(メタデータ) (2020-08-27T01:49:21Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。