論文の概要: Faster Mean-shift: GPU-accelerated clustering for cosine embedding-based
cell segmentation and tracking
- arxiv url: http://arxiv.org/abs/2007.14283v2
- Date: Tue, 20 Apr 2021 02:37:04 GMT
- ステータス: 処理完了
- システム内更新日: 2022-11-06 02:12:39.142901
- Title: Faster Mean-shift: GPU-accelerated clustering for cosine embedding-based
cell segmentation and tracking
- Title(参考訳): Faster Mean-shift:コサイン埋め込みによる細胞セグメンテーションとトラッキングのためのGPUアクセラレーションクラスタリング
- Authors: Mengyang Zhao, Aadarsh Jha, Quan Liu, Bryan A. Millis, Anita
Mahadevan-Jansen, Le Lu, Bennett A. Landman, Matthew J.Tyskac and Yuankai Huo
- Abstract要約: 本稿では,埋め込み型セルセグメンテーションとトラッキングの計算ボトルネックに対処する,高速平均シフトアルゴリズムを提案する。
提案したFaster Mean-shiftアルゴリズムは、最先端の埋め込みベースのセルインスタンスのセグメンテーションとトラッキングアルゴリズムと比較して7~10倍の高速化を実現した。
我々の高速平均シフトアルゴリズムは、メモリ消費を最適化した他のGPUベンチマークと比較して計算速度も高い。
- 参考スコア(独自算出の注目度): 12.60841328582138
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Recently, single-stage embedding based deep learning algorithms gain
increasing attention in cell segmentation and tracking. Compared with the
traditional "segment-then-associate" two-stage approach, a single-stage
algorithm not only simultaneously achieves consistent instance cell
segmentation and tracking but also gains superior performance when
distinguishing ambiguous pixels on boundaries and overlaps. However, the
deployment of an embedding based algorithm is restricted by slow inference
speed (e.g., around 1-2 mins per frame). In this study, we propose a novel
Faster Mean-shift algorithm, which tackles the computational bottleneck of
embedding based cell segmentation and tracking. Different from previous
GPU-accelerated fast mean-shift algorithms, a new online seed optimization
policy (OSOP) is introduced to adaptively determine the minimal number of
seeds, accelerate computation, and save GPU memory. With both embedding
simulation and empirical validation via the four cohorts from the ISBI cell
tracking challenge, the proposed Faster Mean-shift algorithm achieved 7-10
times speedup compared to the state-of-the-art embedding based cell instance
segmentation and tracking algorithm. Our Faster Mean-shift algorithm also
achieved the highest computational speed compared to other GPU benchmarks with
optimized memory consumption. The Faster Mean-shift is a plug-and-play model,
which can be employed on other pixel embedding based clustering inference for
medical image analysis. (Plug-and-play model is publicly available:
https://github.com/masqm/Faster-Mean-Shift)
- Abstract(参考訳): 近年,単段埋め込み型ディープラーニングアルゴリズムがセルセグメンテーションやトラッキングに注目が集まっている。
従来の"segment-then-associate"二段階アプローチと比較して、シングルステージアルゴリズムは、一貫性のあるインスタンスセルのセグメンテーションとトラッキングを同時に達成するだけでなく、境界と重なりの曖昧なピクセルを区別する際にも優れた性能を発揮する。
しかし、埋め込みベースのアルゴリズムの展開は、遅い推論速度(例えば、1フレームあたり約1-2分)によって制限される。
本研究では,組込み型セルセグメンテーションと追跡の計算ボトルネックに対処する,新しい高速平均シフトアルゴリズムを提案する。
従来のGPUアクセラレーションによる高速平均シフトアルゴリズムとは異なり、最小数のシードを適応的に決定し、計算を高速化し、GPUメモリを節約するために、新しいオンラインシード最適化ポリシー(OSOP)が導入されている。
isbiセルトラッキングチャレンジの4つのコホートによる埋め込みシミュレーションと経験的検証の両方により、提案する平均シフトアルゴリズムは、最先端の組込みセルインスタンスのセグメンテーションとトラッキングアルゴリズムと比較して、7~10倍の高速化を達成した。
我々の高速平均シフトアルゴリズムは、メモリ消費を最適化した他のGPUベンチマークと比較して計算速度も高い。
Faster Mean-shiftはプラグアンドプレイモデルであり、他のピクセル埋め込みベースのクラスタリング推論を用いて医療画像解析を行うことができる。
(プラグアンドプレイモデルは、https://github.com/masqm/faster-mean-shift)
関連論文リスト
- Breaking the Memory Barrier: Near Infinite Batch Size Scaling for Contrastive Loss [59.835032408496545]
本稿では, コントラスト損失計算を任意の小ブロックに分割するタイルベースの戦略を提案する。
分散システムの階層構造を活用するためのマルチレベルタイリング戦略も導入する。
SOTAメモリ効率のソリューションと比較すると、同等の速度を維持しながら、メモリの2桁の削減を実現している。
論文 参考訳(メタデータ) (2024-10-22T17:59:30Z) - Implementation and Analysis of GPU Algorithms for Vecchia Approximation [0.8057006406834466]
Vecchia Approximationは計算複雑性を減らすために広く使われており、恥ずかしい並列アルゴリズムで計算することができる。
Vecchia Approximationのためにマルチコアソフトウェアが開発されたが、グラフィックス処理ユニット(GPU)上で動作するように設計されたソフトウェアは不足している。
我々の新しい手法は他の2つより優れており、GpGpU Rパッケージに表示されます。
論文 参考訳(メタデータ) (2024-07-03T01:24:44Z) - Efficient stereo matching on embedded GPUs with zero-means cross
correlation [8.446808526407738]
本稿では,Jetson Tx2組込みGPU上でのゼロ平均正規化クロス相関(ZNCC)マッチングコスト計算アルゴリズムの高速化手法を提案する。
本手法では,ZNCCの高速化のために,Zigzag方式で対象画像をスキャンし,隣接する画素に対して1ピクセルの計算を効率的に再利用する。
本システムでは,最大1280x384ピクセル画像のJetson Tx2 GPUにおいて,32fpsのリアルタイム処理速度を示した。
論文 参考訳(メタデータ) (2022-12-01T13:03:38Z) - Communication-Efficient Adam-Type Algorithms for Distributed Data Mining [93.50424502011626]
我々はスケッチを利用した新しい分散Adam型アルゴリズムのクラス(例:SketchedAMSGrad)を提案する。
我々の新しいアルゴリズムは、反復毎に$O(frac1sqrtnT + frac1(k/d)2 T)$の高速収束率を$O(k log(d))$の通信コストで達成する。
論文 参考訳(メタデータ) (2022-10-14T01:42:05Z) - Rapid Person Re-Identification via Sub-space Consistency Regularization [51.76876061721556]
Person Re-Identification (ReID) は、歩行者を分離したカメラで識別する。
実値特徴記述子を用いた既存のReID法は精度が高いが、ユークリッド距離計算が遅いため効率が低い。
本稿では,ReID 処理を 0.25 倍高速化するサブスペース一貫性規則化 (SCR) アルゴリズムを提案する。
論文 参考訳(メタデータ) (2022-07-13T02:44:05Z) - GPU-accelerated Faster Mean Shift with euclidean distance metrics [1.3507758562554621]
平均シフトアルゴリズムはクラスタリング問題の解法として広く用いられている。
従来の研究では,GPUを高速化する高速平均シフトアルゴリズムが提案されている。
本研究では,ユークリッド距離測定値を扱うために,従来のアルゴリズムを拡張し改良する。
論文 参考訳(メタデータ) (2021-12-27T20:18:24Z) - Gradient Boosted Binary Histogram Ensemble for Large-scale Regression [60.16351608335641]
本研究では,2値ヒストグラム分割とアンサンブル学習に基づくテキストグラディエント2値ヒストグラムアンサンブル(GBBHE)と呼ばれる大規模回帰問題に対する勾配向上アルゴリズムを提案する。
実験では, 勾配向上回帰木 (GBRT) などの他の最先端アルゴリズムと比較して, GBBHEアルゴリズムは大規模データセット上での実行時間が少なく, 有望な性能を示す。
論文 参考訳(メタデータ) (2021-06-03T17:05:40Z) - Guided Interactive Video Object Segmentation Using Reliability-Based
Attention Maps [55.94785248905853]
本論文では,映像オブジェクトの対話的セグメンテーション(GIS)アルゴリズムを提案し,セグメンテーション精度の向上と対話時間の短縮を図る。
我々は,隣接フレームにセグメンテーション結果を伝達する,交差点対応伝搬モジュールを開発した。
実験により,提案アルゴリズムは従来のアルゴリズムよりも高速に精度の高いセグメンテーション結果を提供することを示した。
論文 参考訳(メタデータ) (2021-04-21T07:08:57Z) - MeanShift++: Extremely Fast Mode-Seeking With Applications to
Segmentation and Object Tracking [40.662116703422846]
MeanShiftは、機械学習の幅広いアプリケーションで使用される一般的なモード探索クラスタリングアルゴリズムです。
平均シフトステップを高速化するためにグリッドベースのアプローチを用いたMeanShift++を提案する。
ランタイムは点数で線形であり、次元で指数的であるため、MeanShift++は低次元アプリケーションに理想的です。
論文 参考訳(メタデータ) (2021-04-01T07:14:11Z) - Heterogeneous CPU+GPU Stochastic Gradient Descent Algorithms [1.3249453757295084]
ヘテロジニアスCPU+GPUアーキテクチャの深層学習のためのトレーニングアルゴリズムについて検討する。
私たちの2倍の目標 -- 収束率と資源利用を同時に最大化する -- は、この問題を難しくします。
これらのアルゴリズムの実装は,複数の実データセットよりも高速な収束と資源利用の両立を実現していることを示す。
論文 参考訳(メタデータ) (2020-04-19T05:21:20Z) - Efficient Video Semantic Segmentation with Labels Propagation and
Refinement [138.55845680523908]
本稿では,ハイブリッドGPU/CPUを用いた高精細ビデオのリアルタイムセマンティックセマンティックセマンティック化の問題に取り組む。
i) CPU上では、非常に高速な光フロー法であり、ビデオの時間的側面を利用して、あるフレームから次のフレームへ意味情報を伝達するために使用される。
高解像度フレーム(2048 x 1024)を持つ一般的なCityscapesデータセットでは、単一のGPUとCPU上で80から1000Hzの動作ポイントが提案されている。
論文 参考訳(メタデータ) (2019-12-26T11:45:15Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。