論文の概要: Parallel 3DPIFCM Algorithm for Noisy Brain MRI Images
- arxiv url: http://arxiv.org/abs/2002.01981v1
- Date: Wed, 5 Feb 2020 20:30:29 GMT
- ステータス: 処理完了
- システム内更新日: 2023-01-03 21:55:20.149632
- Title: Parallel 3DPIFCM Algorithm for Noisy Brain MRI Images
- Title(参考訳): ノイズ脳MRI画像のための並列3DPIFCMアルゴリズム
- Authors: Arie Agranonik, Maya Herman, Mark Last
- Abstract要約: 本稿では,GPUを用いて並列環境で3DPIFCMと呼ばれる[1]で開発したアルゴリズムについて述べる。
この結果から,並列バージョンはGAIFCMアルゴリズムより最大27倍高速,GAIFCMアルゴリズムより68倍高速であることがわかった。
- 参考スコア(独自算出の注目度): 3.3946853660795884
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: In this paper we implemented the algorithm we developed in [1] called 3DPIFCM
in a parallel environment by using CUDA on a GPU. In our previous work we
introduced 3DPIFCM which performs segmentation of images in noisy conditions
and uses particle swarm optimization for finding the optimal algorithm
parameters to account for noise. This algorithm achieved state of the art
segmentation accuracy when compared to FCM (Fuzzy C-Means), IFCMPSO (Improved
Fuzzy C-Means with Particle Swarm Optimization), GAIFCM (Genetic Algorithm
Improved Fuzzy C-Means) on noisy MRI images of an adult Brain.
When using a genetic algorithm or PSO (Particle Swarm Optimization) on a
single machine for optimization we witnessed long execution times for practical
clinical usage. Therefore, in the current paper our goal was to speed up the
execution of 3DPIFCM by taking out parts of the algorithm and executing them as
kernels on a GPU. The algorithm was implemented using the CUDA [13] framework
from NVIDIA and experiments where performed on a server containing 64GB RAM , 8
cores and a TITAN X GPU with 3072 SP cores and 12GB of GPU memory.
Our results show that the parallel version of the algorithm performs up to
27x faster than the original sequential version and 68x faster than GAIFCM
algorithm. We show that the speedup of the parallel version increases as we
increase the size of the image due to better utilization of cores in the GPU.
Also, we show a speedup of up to 5x in our Brainweb experiment compared to
other generic variants such as IFCMPSO and GAIFCM.
- Abstract(参考訳): 本稿では,GPU上でCUDAを用いて並列環境で3DPIFCMと呼ばれる[1]で開発したアルゴリズムを実装した。
前報ではノイズを考慮した最適なアルゴリズムパラメータを求めるために粒子群最適化を用いた3dpifcmを導入した。
このアルゴリズムは,成人脳のMRI画像に対して,FCM (Fuzzy C-Means), IFCMPSO (Improved Fuzzy C-Means with Particle Swarm Optimization), GAIFCM (Genetic Algorithm Improved Fuzzy C-Means) と比較して,術式分割精度を向上した。
遺伝的アルゴリズムやPSO(Particle Swarm Optimization)を1台のマシンで最適化する場合,臨床応用に長い実行時間を要した。
そこで本論文では,アルゴリズムの一部を抽出し,GPU上でカーネルとして実行することにより,3DPIFCMの実行を高速化することを目的としている。
このアルゴリズムはNVIDIAのCUDA[13]フレームワークを使って実装され、64GBのRAM、8コア、3072のSPコアと12GBのGPUメモリを備えたTITAN X GPUを含むサーバー上で実行された。
その結果,並列版のアルゴリズムは,従来のシーケンシャルバージョンよりも最大27倍高速であり,gaifcmアルゴリズムより68倍高速であることがわかった。
並列バージョンの高速化は、GPUにおけるコアの活用性の向上により、画像のサイズが大きくなるにつれて増加することを示す。
また、IFCMPSOやGAIFCMといった他の汎用モデルと比較して、Brainweb実験では最大5倍のスピードアップを示す。
関連論文リスト
- 3DGS-LM: Faster Gaussian-Splatting Optimization with Levenberg-Marquardt [65.25603275491544]
3DGS-LM, 3D Gaussian Splatting(3DGS)の再構築を高速化する新しい手法を提案する。
提案手法は元の3DGSよりも30%高速で, 再現品質の最適化が可能である。
論文 参考訳(メタデータ) (2024-09-19T16:31:44Z) - INR-Arch: A Dataflow Architecture and Compiler for Arbitrary-Order
Gradient Computations in Implicit Neural Representation Processing [66.00729477511219]
計算グラフとして表される関数を考えると、従来のアーキテクチャはn階勾配を効率的に計算する上で困難に直面している。
InR-Archは,n階勾配の計算グラフをハードウェア最適化データフローアーキテクチャに変換するフレームワークである。
1.8-4.8x と 1.5-3.6x の高速化を CPU と GPU のベースラインと比較した結果を示す。
論文 参考訳(メタデータ) (2023-08-11T04:24:39Z) - Batch-efficient EigenDecomposition for Small and Medium Matrices [65.67315418971688]
EigenDecomposition (ED)は多くのコンピュータビジョンアルゴリズムとアプリケーションの中心にある。
本稿では,コンピュータビジョンの応用シナリオに特化したQRベースのED手法を提案する。
論文 参考訳(メタデータ) (2022-07-09T09:14:12Z) - Fast and High-Quality Image Denoising via Malleable Convolutions [72.18723834537494]
動的畳み込みの効率的な変種として、Malleable Convolution (MalleConv)を提案する。
以前の作品とは異なり、MalleConvは入力から空間的に変化するカーネルのより小さなセットを生成する。
また、MalleNetという造語であるMalleConvを用いて、効率的なdenoisingネットワークを構築した。
論文 参考訳(メタデータ) (2022-01-02T18:35:20Z) - GPU-accelerated Faster Mean Shift with euclidean distance metrics [1.3507758562554621]
平均シフトアルゴリズムはクラスタリング問題の解法として広く用いられている。
従来の研究では,GPUを高速化する高速平均シフトアルゴリズムが提案されている。
本研究では,ユークリッド距離測定値を扱うために,従来のアルゴリズムを拡張し改良する。
論文 参考訳(メタデータ) (2021-12-27T20:18:24Z) - GPU optimization of the 3D Scale-invariant Feature Transform Algorithm
and a Novel BRIEF-inspired 3D Fast Descriptor [5.1537294207900715]
本研究は,大規模な医用画像データからの機械学習を目的として,SIFTアルゴリズムの高効率実装について述べる。
3D SIFTコードの主要な操作は、畳み込み、サブサンプリング、スケールスペースピラミッドからの4Dピーク検出を含むグラフィックス処理ユニット(GPU)上に実装されている。
パフォーマンス改善は、異なる人の3D MRI人間の脳量を用いて、キーポイント検出と画像と画像のマッチング実験で定量化される。
論文 参考訳(メタデータ) (2021-12-19T20:56:40Z) - RAMA: A Rapid Multicut Algorithm on GPU [23.281726932718232]
本稿では,マルチカット問題(マグニチュード相関クラスタリング)に対する高並列原始双対アルゴリズムを提案する。
我々のアルゴリズムは、最適距離を推定する原始解と双対下界を生成する。
最大$mathcalO(108)$変数を数秒で、小さな原始双対ギャップで、非常に大規模なベンチマーク問題を解くことができる。
論文 参考訳(メタデータ) (2021-09-04T10:33:59Z) - Efficient and Generic 1D Dilated Convolution Layer for Deep Learning [52.899995651639436]
幅広いパラメータをカバーする汎用的な1D畳み込み層の効率的な実装を紹介します。
特にIntel AVX-512とAVX-512 BFloat16命令を含むアーキテクチャ向けに最適化されている。
本稿では,最適化された1次元畳み込み層の性能を,実際のゲノミクスデータセットを用いたエンドツーエンドニューラルネットワークトレーニングで実証する。
論文 参考訳(メタデータ) (2021-04-16T09:54:30Z) - Increased performance in DDM analysis by calculating structure functions
through Fourier transform in time [0.0]
微分動的顕微鏡解析法により,画像の集合を効率的に処理するアルゴリズムを提案する。
新しい実装では、信号の違いを発生させる代わりに、追加のフーリエ変換により、DDM解析を高速に計算する。
GPUハードウェアアクセラレーションがなければ、同じ画像に対して、新しいアルゴリズムは、どちらもCPU上でのみ実行される旧アルゴリズムよりも300倍高速であることがわかった。
論文 参考訳(メタデータ) (2020-12-02T21:12:45Z) - Kernel methods through the roof: handling billions of points efficiently [94.31450736250918]
カーネル法は、非パラメトリック学習に対するエレガントで原則化されたアプローチを提供するが、今のところ大規模な問題ではほとんど利用できない。
最近の進歩は、最適化、数値線形代数、ランダム射影など、多くのアルゴリズム的アイデアの利点を示している。
ここでは、これらの取り組みをさらに進めて、GPUハードウェアを最大限に活用する解決器を開発し、テストする。
論文 参考訳(メタデータ) (2020-06-18T08:16:25Z) - 3DPIFCM Novel Algorithm for Segmentation of Noisy Brain MRI Images [3.3946853660795884]
3DPIFCMは、よく知られたIFCM(Improved Fuzzy C-Means)アルゴリズムの拡張である。
ファジィセグメンテーションを行い、ボクセルの近接によって影響を受けるフィットネス機能を導入する。
3DPIFCMアルゴリズムはPSO(Particle Swarm Optimization)を用いてフィットネス機能を最適化する。
論文 参考訳(メタデータ) (2020-02-05T20:48:51Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。