論文の概要: Parallel Discrete Convolutions on Adaptive Particle Representations of
Images
- arxiv url: http://arxiv.org/abs/2112.03592v1
- Date: Tue, 7 Dec 2021 09:40:05 GMT
- ステータス: 処理完了
- システム内更新日: 2021-12-08 16:00:57.999198
- Title: Parallel Discrete Convolutions on Adaptive Particle Representations of
Images
- Title(参考訳): 画像の適応粒子表現における並列離散畳み込み
- Authors: Joel Jonsson, Bevan L. Cheeseman, Suryanarayana Maddu, Krzysztof
Gonciarz, Ivo F. Sbalzarini
- Abstract要約: 適応粒子表現上の離散畳み込み演算子のネイティブ実装のためのデータ構造とアルゴリズムを提案する。
APRは、サンプリング解像度を画像信号に局所的に適応するコンテンツ適応型画像表現である。
APRの畳み込みは、マルチコアCPUとGPUアーキテクチャを効率的に並列化するスケール適応アルゴリズムを自然に導くことを示す。
- 参考スコア(独自算出の注目度): 2.362412515574206
- License: http://creativecommons.org/licenses/by-nc-nd/4.0/
- Abstract: We present data structures and algorithms for native implementations of
discrete convolution operators over Adaptive Particle Representations (APR) of
images on parallel computer architectures. The APR is a content-adaptive image
representation that locally adapts the sampling resolution to the image signal.
It has been developed as an alternative to pixel representations for large,
sparse images as they typically occur in fluorescence microscopy. It has been
shown to reduce the memory and runtime costs of storing, visualizing, and
processing such images. This, however, requires that image processing natively
operates on APRs, without intermediately reverting to pixels. Designing
efficient and scalable APR-native image processing primitives, however, is
complicated by the APR's irregular memory structure. Here, we provide the
algorithmic building blocks required to efficiently and natively process APR
images using a wide range of algorithms that can be formulated in terms of
discrete convolutions. We show that APR convolution naturally leads to
scale-adaptive algorithms that efficiently parallelize on multi-core CPU and
GPU architectures. We quantify the speedups in comparison to pixel-based
algorithms and convolutions on evenly sampled data. We achieve pixel-equivalent
throughputs of up to 1 TB/s on a single Nvidia GeForce RTX 2080 gaming GPU,
requiring up to two orders of magnitude less memory than a pixel-based
implementation.
- Abstract(参考訳): 本稿では,並列計算機アーキテクチャ上の画像の適応粒子表現(apr)上の離散畳み込み演算子のネイティブ実装のためのデータ構造とアルゴリズムを提案する。
APRは、サンプリング解像度を画像信号に局所的に適応するコンテンツ適応型画像表現である。
蛍光顕微鏡で通常発生するように、大きくスパースな画像に対するピクセル表現の代替として開発された。
このような画像の保存、視覚化、処理のメモリと実行コストを削減することが示されている。
しかし、これは、画像処理がAPR上でネイティブに動作し、ピクセルに中間反転しない必要がある。
しかし、APRの不規則なメモリ構造によって、効率的でスケーラブルなAPRネイティブ画像処理プリミティブを設計することは複雑である。
本稿では, 離散畳み込みを用いて定式化可能な幅広いアルゴリズムを用いて, apr画像の効率的かつネイティブな処理に必要なアルゴリズム構築ブロックを提案する。
apr畳み込みは,マルチコアcpuとgpuアーキテクチャを効率的に並列化するスケール適応アルゴリズムを自然に生み出す。
画素ベースのアルゴリズムと等しくサンプリングされたデータの畳み込みと比較して,スピードアップの定量化を行う。
我々は1台のNvidia GeForce RTX 2080ゲームGPU上で最大1TB/sのピクセル等価スループットを実現し、ピクセルベースの実装よりも最大2桁少ないメモリを必要とする。
関連論文リスト
- Accelerating Image Super-Resolution Networks with Pixel-Level Classification [29.010136088811137]
Pixel-level for Single Image SuperResolutionは、ピクセルレベルで計算資源を適応的に分配する新しい手法である。
提案手法では,再学習を伴わない推論における性能と計算コストのバランスが可能である。
論文 参考訳(メタデータ) (2024-07-31T08:53:10Z) - Image-GS: Content-Adaptive Image Representation via 2D Gaussians [55.15950594752051]
本稿では,コンテンツ適応型画像表現であるImage-GSを提案する。
異方性2Dガウスアンをベースとして、Image-GSは高いメモリ効率を示し、高速なランダムアクセスをサポートし、自然なレベルのディテールスタックを提供する。
画像-GSの一般的な効率性と忠実性は、最近のニューラルイメージ表現と業界標準テクスチャ圧縮機に対して検証される。
この研究は、機械認識、アセットストリーミング、コンテンツ生成など、適応的な品質とリソース制御を必要とする新しいアプリケーションを開発するための洞察を与えてくれることを願っている。
論文 参考訳(メタデータ) (2024-07-02T00:45:21Z) - Parameter-Inverted Image Pyramid Networks [49.35689698870247]
Inverted Image Pyramid Networks (PIIP) と呼ばれる新しいネットワークアーキテクチャを提案する。
私たちの中核となる考え方は、パラメータサイズの異なるモデルを使用して、画像ピラミッドの解像度の異なるレベルを処理することです。
PIIPは、オブジェクト検出、セグメンテーション、画像分類などのタスクにおいて優れたパフォーマンスを達成する。
論文 参考訳(メタデータ) (2024-06-06T17:59:10Z) - Mapping Image Transformations Onto Pixel Processor Arrays [4.857223862405921]
Pixel Processor Arrays (PPA) は、SIMD配列のプロセッサ要素からなる新しい視覚センサ/プロセッサアーキテクチャを提供する。
我々は, せん断, 回転, スケーリングを含む様々な画像変換が, PPA上で直接実行可能であることを示す。
論文 参考訳(メタデータ) (2024-03-25T17:56:41Z) - ImageSig: A signature transform for ultra-lightweight image recognition [0.0]
ImageSigは計算シグネチャに基づいており、畳み込み構造やアテンションベースのエンコーダを必要としない。
ImageSigはRaspberry PiやJetson-nanoのようなハードウェアで前例のないパフォーマンスを示している。
論文 参考訳(メタデータ) (2022-05-13T23:48:32Z) - Fast and High-Quality Image Denoising via Malleable Convolutions [72.18723834537494]
動的畳み込みの効率的な変種として、Malleable Convolution (MalleConv)を提案する。
以前の作品とは異なり、MalleConvは入力から空間的に変化するカーネルのより小さなセットを生成する。
また、MalleNetという造語であるMalleConvを用いて、効率的なdenoisingネットワークを構築した。
論文 参考訳(メタデータ) (2022-01-02T18:35:20Z) - Spatially-Adaptive Pixelwise Networks for Fast Image Translation [57.359250882770525]
高速かつ効率的な画像-画像変換を目的とした新しいジェネレータアーキテクチャを提案する。
私たちはピクセルワイズネットワークを使用します。つまり、各ピクセルは他のピクセルとは独立して処理されます。
私たちのモデルは最先端のベースラインよりも最大18倍高速です。
論文 参考訳(メタデータ) (2020-12-05T10:02:03Z) - Adversarial Generation of Continuous Images [31.92891885615843]
本稿では,INRに基づく画像デコーダ構築のための2つの新しいアーキテクチャ手法を提案する。
私たちは、最先端の連続画像GANを構築するためにそれらを使用します。
提案したINR-GANアーキテクチャは連続画像生成装置の性能を数倍改善する。
論文 参考訳(メタデータ) (2020-11-24T11:06:40Z) - Locally Masked Convolution for Autoregressive Models [107.4635841204146]
LMConvは標準的な2Dコンボリューションの簡単な修正であり、任意のマスクを画像の各位置の重みに適用することができる。
我々は,パラメータを共有するが生成順序が異なる分布推定器のアンサンブルを学習し,全画像密度推定の性能を向上させる。
論文 参考訳(メタデータ) (2020-06-22T17:59:07Z) - Visual Transformers: Token-based Image Representation and Processing for
Computer Vision [67.55770209540306]
Visual Transformer (VT) はセマンティックトークン空間で動作し、コンテキストに基づいて異なる画像部品に任意に参加する。
高度なトレーニングレシピを使うことで、私たちのVTは畳み込みよりも大幅に優れています。
LIPとCOCO-stuffのセマンティックセグメンテーションでは、VTベースの特徴ピラミッドネットワーク(FPN)は、FPNモジュールのFLOPを6.5倍減らしながら、mIoUの0.35ポイントを達成している。
論文 参考訳(メタデータ) (2020-06-05T20:49:49Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。