論文の概要: GPU optimization of the 3D Scale-invariant Feature Transform Algorithm
and a Novel BRIEF-inspired 3D Fast Descriptor
- arxiv url: http://arxiv.org/abs/2112.10258v1
- Date: Sun, 19 Dec 2021 20:56:40 GMT
- ステータス: 処理完了
- システム内更新日: 2021-12-22 03:56:28.047137
- Title: GPU optimization of the 3D Scale-invariant Feature Transform Algorithm
and a Novel BRIEF-inspired 3D Fast Descriptor
- Title(参考訳): 3次元スケール不変特徴変換アルゴリズムのgpu最適化と新しい簡易インスパイア3d高速ディスクリプタ
- Authors: Jean-Baptiste Carluer, Laurent Chauvin, Jie Luo, William M. Wells III,
Ines Machado, Rola Harmouche, Matthew Toews
- Abstract要約: 本研究は,大規模な医用画像データからの機械学習を目的として,SIFTアルゴリズムの高効率実装について述べる。
3D SIFTコードの主要な操作は、畳み込み、サブサンプリング、スケールスペースピラミッドからの4Dピーク検出を含むグラフィックス処理ユニット(GPU)上に実装されている。
パフォーマンス改善は、異なる人の3D MRI人間の脳量を用いて、キーポイント検出と画像と画像のマッチング実験で定量化される。
- 参考スコア(独自算出の注目度): 5.1537294207900715
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: This work details a highly efficient implementation of the 3D scale-invariant
feature transform (SIFT) algorithm, for the purpose of machine learning from
large sets of volumetric medical image data. The primary operations of the 3D
SIFT code are implemented on a graphics processing unit (GPU), including
convolution, sub-sampling, and 4D peak detection from scale-space pyramids. The
performance improvements are quantified in keypoint detection and
image-to-image matching experiments, using 3D MRI human brain volumes of
different people. Computationally efficient 3D keypoint descriptors are
proposed based on the Binary Robust Independent Elementary Feature (BRIEF)
code, including a novel descriptor we call Ranked Robust Independent Elementary
Features (RRIEF), and compared to the original 3D SIFT-Rank
method\citep{toews2013efficient}. The GPU implementation affords a speedup of
approximately 7X beyond an optimised CPU implementation, where computation time
is reduced from 1.4 seconds to 0.2 seconds for 3D volumes of size (145, 174,
145) voxels with approximately 3000 keypoints. Notable speedups include the
convolution operation (20X), 4D peak detection (3X), sub-sampling (3X), and
difference-of-Gaussian pyramid construction (2X). Efficient descriptors offer a
speedup of 2X and a memory savings of 6X compared to standard SIFT-Rank
descriptors, at a cost of reduced numbers of keypoint correspondences,
revealing a trade-off between computational efficiency and algorithmic
performance. The speedups gained by our implementation will allow for a more
efficient analysis on larger data sets. Our optimized GPU implementation of the
3D SIFT-Rank extractor is available at
https://github.com/CarluerJB/3D_SIFT_CUDA.
- Abstract(参考訳): 本研究は,大規模医用画像データを用いた機械学習を目的とした3次元スケール不変特徴変換(sift)アルゴリズムの高効率実装について述べる。
3D SIFTコードの主要な操作は、畳み込み、サブサンプリング、スケールスペースピラミッドからの4Dピーク検出を含むグラフィックス処理ユニット(GPU)上に実装されている。
パフォーマンス改善は、異なる人の3D MRI人間の脳量を用いて、キーポイント検出と画像間マッチング実験で定量化される。
計算効率のよい3Dキーポイント記述子は、RRIEFと呼ばれる新しい記述子を含むバイナリロバスト独立基本特徴(BRIEF)に基づいて提案され、元の3DSIFT-Rank法と比較される。
GPUの実装により、最適化されたCPU実装を超えて約7倍のスピードアップが可能となり、計算時間は3Dボリューム(145, 174, 145)で約3000のキーポイントを持つ1.4秒から0.2秒に短縮される。
注目すべきスピードアップは畳み込み動作(20x)、4dピーク検出(3x)、サブサンプリング(3x)、ガウスピラミッド構造(2x)である。
効率的なディスクリプタは、標準的なSIFT-Rankディスクリプタと比較して2Xのスピードアップと6Xのメモリセーブを提供し、キーポイント対応の数を削減し、計算効率とアルゴリズム性能のトレードオフを明らかにする。
実装によって得られるスピードアップにより、より大きなデータセットをより効率的に分析することができます。
3D SIFT-Rank抽出器のGPU実装はhttps://github.com/CarluerJB/3D_SIFT_CUDAで利用可能である。
関連論文リスト
- Voxel-Aggergated Feature Synthesis: Efficient Dense Mapping for Simulated 3D Reasoning [3.199782544428545]
Voxel-Aggregated Feature Synthesis (VAFS) はシミュレーションにおける高密度3次元マッピングの新しいアプローチである。
VAFSはシミュレータの物理エンジンによって計算される分節点クラウドを用いて計算を大幅に削減する。
シミュレーションシーンにおける異なるオブジェクトに対する意味的クエリのIoUスコアを評価することで、結果の表現を検証する。
論文 参考訳(メタデータ) (2024-11-15T22:37:56Z) - Efficient and Distributed Large-Scale 3D Map Registration using Tomographic Features [10.740403545402508]
資源効率,分散,最小パラメータ化された3次元マップマッチングとマージアルゴリズムを提案する。
提案アルゴリズムは,重力方向の局所写像の水平断面の2次元プロジェクションのトモグラフィ特性を利用して,これらのプロジェクションスライスをあらゆる高さ差で一致させる。
論文 参考訳(メタデータ) (2024-06-27T18:03:06Z) - MicroDreamer: Efficient 3D Generation in $\sim$20 Seconds by Score-based Iterative Reconstruction [37.07128043394227]
本稿では,NFEの削減のために,異なる3次元再構成過程を模倣した効率的かつ汎用的なアルゴリズムであるスコアベース反復再構成(SIR)を提案する。
我々は,様々な3次元表現や3次元生成タスクに適用可能な,MicroDreamerと呼ばれる効率的な手法を提案する。
論文 参考訳(メタデータ) (2024-04-30T12:56:14Z) - Splatter Image: Ultra-Fast Single-View 3D Reconstruction [67.96212093828179]
Splatter ImageはGaussian Splattingをベースにしており、複数の画像から3Dシーンを高速かつ高品質に再現することができる。
テスト時に38FPSでフィードフォワードで再構成を行うニューラルネットワークを学習する。
いくつかの総合、実、マルチカテゴリ、大規模ベンチマークデータセットにおいて、トレーニング中にPSNR、LPIPS、その他のメトリクスでより良い結果を得る。
論文 参考訳(メタデータ) (2023-12-20T16:14:58Z) - Instant3D: Instant Text-to-3D Generation [101.25562463919795]
Instant3Dと呼ばれる高速テキストから3D生成のための新しいフレームワークを提案する。
Instant3Dはフィードフォワードネットワークの単一実行で1秒未満で、目に見えないテキストプロンプトのための3Dオブジェクトを作成することができる。
論文 参考訳(メタデータ) (2023-11-14T18:59:59Z) - INR-Arch: A Dataflow Architecture and Compiler for Arbitrary-Order
Gradient Computations in Implicit Neural Representation Processing [66.00729477511219]
計算グラフとして表される関数を考えると、従来のアーキテクチャはn階勾配を効率的に計算する上で困難に直面している。
InR-Archは,n階勾配の計算グラフをハードウェア最適化データフローアーキテクチャに変換するフレームワークである。
1.8-4.8x と 1.5-3.6x の高速化を CPU と GPU のベースラインと比較した結果を示す。
論文 参考訳(メタデータ) (2023-08-11T04:24:39Z) - Spatiotemporal Modeling Encounters 3D Medical Image Analysis:
Slice-Shift UNet with Multi-View Fusion [0.0]
本稿では,2次元CNNにおける3次元特徴をエンコードする2次元モデルSlice SHift UNetを提案する。
より正確にマルチビュー機能は、ボリュームの3次元平面に沿って2次元の畳み込みを実行することで協調的に学習される。
提案手法の有効性は,多モード腹部多臓器軸 (AMOS) と Cranial Vault (BTCV) データセットを越えたマルチアトラスラベリング (Multi-Atlas Labeling Beyond the Cranial Vault) で検証した。
論文 参考訳(メタデータ) (2023-07-24T14:53:23Z) - UNETR++: Delving into Efficient and Accurate 3D Medical Image Segmentation [93.88170217725805]
本稿では,高画質なセグメンテーションマスクと,パラメータ,計算コスト,推論速度の両面での効率性を提供するUNETR++という3次元医用画像セグメンテーション手法を提案する。
我々の設計の核となるのは、空間的およびチャネル的な識別的特徴を効率的に学習する、新しい効率的な対注意ブロック(EPA)の導入である。
Synapse, BTCV, ACDC, BRaTs, Decathlon-Lungの5つのベンチマークで評価した結果, 効率と精度の両面で, コントリビューションの有効性が示された。
論文 参考訳(メタデータ) (2022-12-08T18:59:57Z) - Fast-SNARF: A Fast Deformer for Articulated Neural Fields [92.68788512596254]
本稿では,標準空間とポーズ空間の正確な対応性を求める,ニューラルフィールドのための新しい調音モジュールFast-SNARFを提案する。
Fast-SNARFはこれまでの研究であるSNARFの代替であり、計算効率は大幅に向上した。
変形マップの学習は多くの3次元人間のアバター法において重要な要素であるため、この研究は3次元仮想人間の実現に向けた重要なステップであると考えている。
論文 参考訳(メタデータ) (2022-11-28T17:55:34Z) - Displacement-Invariant Cost Computation for Efficient Stereo Matching [122.94051630000934]
ディープラーニング手法は、前例のない不一致の精度を得ることによって、ステレオマッチングのリーダーボードを支配してきた。
しかし、その推測時間は一般的に540p画像の秒数で遅い。
本研究では,4次元特徴量を必要としないEmphdisplacement-invariant cost moduleを提案する。
論文 参考訳(メタデータ) (2020-12-01T23:58:16Z) - Depthwise Spatio-Temporal STFT Convolutional Neural Networks for Human
Action Recognition [42.400429835080416]
従来の3D畳み込みニューラルネットワーク(CNN)は計算コストが高く、メモリ集約性があり、過度に適合する傾向がある。
本稿では,3次元CNNにおける3次元畳み込み層の代替として機能する新しい畳み込みブロックのクラスを提案する。
Some-something v1, v2, Jester, Diving Kinetics-400, UCF 101, HMDB 51を含む7つの行動認識データセットについて,STFTブロックをベースとした3D CNNが,現状と比較して同等以上の性能で達成可能であることを示す。
論文 参考訳(メタデータ) (2020-07-22T12:26:04Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。