論文の概要: Parallel Discrete Convolutions on Adaptive Particle Representations of
Images
- arxiv url: http://arxiv.org/abs/2112.03592v1
- Date: Tue, 7 Dec 2021 09:40:05 GMT
- ステータス: 処理完了
- システム内更新日: 2021-12-08 16:00:57.999198
- Title: Parallel Discrete Convolutions on Adaptive Particle Representations of
Images
- Title(参考訳): 画像の適応粒子表現における並列離散畳み込み
- Authors: Joel Jonsson, Bevan L. Cheeseman, Suryanarayana Maddu, Krzysztof
Gonciarz, Ivo F. Sbalzarini
- Abstract要約: 適応粒子表現上の離散畳み込み演算子のネイティブ実装のためのデータ構造とアルゴリズムを提案する。
APRは、サンプリング解像度を画像信号に局所的に適応するコンテンツ適応型画像表現である。
APRの畳み込みは、マルチコアCPUとGPUアーキテクチャを効率的に並列化するスケール適応アルゴリズムを自然に導くことを示す。
- 参考スコア(独自算出の注目度): 2.362412515574206
- License: http://creativecommons.org/licenses/by-nc-nd/4.0/
- Abstract: We present data structures and algorithms for native implementations of
discrete convolution operators over Adaptive Particle Representations (APR) of
images on parallel computer architectures. The APR is a content-adaptive image
representation that locally adapts the sampling resolution to the image signal.
It has been developed as an alternative to pixel representations for large,
sparse images as they typically occur in fluorescence microscopy. It has been
shown to reduce the memory and runtime costs of storing, visualizing, and
processing such images. This, however, requires that image processing natively
operates on APRs, without intermediately reverting to pixels. Designing
efficient and scalable APR-native image processing primitives, however, is
complicated by the APR's irregular memory structure. Here, we provide the
algorithmic building blocks required to efficiently and natively process APR
images using a wide range of algorithms that can be formulated in terms of
discrete convolutions. We show that APR convolution naturally leads to
scale-adaptive algorithms that efficiently parallelize on multi-core CPU and
GPU architectures. We quantify the speedups in comparison to pixel-based
algorithms and convolutions on evenly sampled data. We achieve pixel-equivalent
throughputs of up to 1 TB/s on a single Nvidia GeForce RTX 2080 gaming GPU,
requiring up to two orders of magnitude less memory than a pixel-based
implementation.
- Abstract(参考訳): 本稿では,並列計算機アーキテクチャ上の画像の適応粒子表現(apr)上の離散畳み込み演算子のネイティブ実装のためのデータ構造とアルゴリズムを提案する。
APRは、サンプリング解像度を画像信号に局所的に適応するコンテンツ適応型画像表現である。
蛍光顕微鏡で通常発生するように、大きくスパースな画像に対するピクセル表現の代替として開発された。
このような画像の保存、視覚化、処理のメモリと実行コストを削減することが示されている。
しかし、これは、画像処理がAPR上でネイティブに動作し、ピクセルに中間反転しない必要がある。
しかし、APRの不規則なメモリ構造によって、効率的でスケーラブルなAPRネイティブ画像処理プリミティブを設計することは複雑である。
本稿では, 離散畳み込みを用いて定式化可能な幅広いアルゴリズムを用いて, apr画像の効率的かつネイティブな処理に必要なアルゴリズム構築ブロックを提案する。
apr畳み込みは,マルチコアcpuとgpuアーキテクチャを効率的に並列化するスケール適応アルゴリズムを自然に生み出す。
画素ベースのアルゴリズムと等しくサンプリングされたデータの畳み込みと比較して,スピードアップの定量化を行う。
我々は1台のNvidia GeForce RTX 2080ゲームGPU上で最大1TB/sのピクセル等価スループットを実現し、ピクセルベースの実装よりも最大2桁少ないメモリを必要とする。
関連論文リスト
- Beyond Learned Metadata-based Raw Image Reconstruction [86.1667769209103]
生画像は、線形性や微細な量子化レベルなど、sRGB画像に対して明確な利点がある。
ストレージの要求が大きいため、一般ユーザからは広く採用されていない。
本稿では,メタデータとして,潜在空間におけるコンパクトな表現を学習する新しいフレームワークを提案する。
論文 参考訳(メタデータ) (2023-06-21T06:59:07Z) - Efficient stereo matching on embedded GPUs with zero-means cross
correlation [8.446808526407738]
本稿では,Jetson Tx2組込みGPU上でのゼロ平均正規化クロス相関(ZNCC)マッチングコスト計算アルゴリズムの高速化手法を提案する。
本手法では,ZNCCの高速化のために,Zigzag方式で対象画像をスキャンし,隣接する画素に対して1ピクセルの計算を効率的に再利用する。
本システムでは,最大1280x384ピクセル画像のJetson Tx2 GPUにおいて,32fpsのリアルタイム処理速度を示した。
論文 参考訳(メタデータ) (2022-12-01T13:03:38Z) - ImageSig: A signature transform for ultra-lightweight image recognition [0.0]
ImageSigは計算シグネチャに基づいており、畳み込み構造やアテンションベースのエンコーダを必要としない。
ImageSigはRaspberry PiやJetson-nanoのようなハードウェアで前例のないパフォーマンスを示している。
論文 参考訳(メタデータ) (2022-05-13T23:48:32Z) - PixelFolder: An Efficient Progressive Pixel Synthesis Network for Image
Generation [88.55256389703082]
Pixelは画像生成のための有望な研究パラダイムである。
本稿では,Pixel のような効率的な画像生成に向けたプログレッシブピクセル合成ネットワークを提案する。
Pixelは支出を大幅に減らし、2つのベンチマークデータセットで新しい最先端(SOTA)パフォーマンスを得る。
論文 参考訳(メタデータ) (2022-04-02T10:55:11Z) - Fast and High-Quality Image Denoising via Malleable Convolutions [72.18723834537494]
動的畳み込みの効率的な変種として、Malleable Convolution (MalleConv)を提案する。
以前の作品とは異なり、MalleConvは入力から空間的に変化するカーネルのより小さなセットを生成する。
また、MalleNetという造語であるMalleConvを用いて、効率的なdenoisingネットワークを構築した。
論文 参考訳(メタデータ) (2022-01-02T18:35:20Z) - An Energy-Efficient Edge Computing Paradigm for Convolution-based Image
Upsampling [0.0]
リアルタイム深層学習に基づくイメージアップサンプリングアプリケーションには,エネルギー効率の高いエッジコンピューティングパラダイムが提案されている。
我々は、学習した畳み込みカーネルをデコンボリューションカーネルに変換し、機能的に等価なデコンボリューションとして推論のためにデプロイした。
論文 参考訳(メタデータ) (2021-07-15T23:49:37Z) - Spatially-Adaptive Pixelwise Networks for Fast Image Translation [57.359250882770525]
高速かつ効率的な画像-画像変換を目的とした新しいジェネレータアーキテクチャを提案する。
私たちはピクセルワイズネットワークを使用します。つまり、各ピクセルは他のピクセルとは独立して処理されます。
私たちのモデルは最先端のベースラインよりも最大18倍高速です。
論文 参考訳(メタデータ) (2020-12-05T10:02:03Z) - Adversarial Generation of Continuous Images [31.92891885615843]
本稿では,INRに基づく画像デコーダ構築のための2つの新しいアーキテクチャ手法を提案する。
私たちは、最先端の連続画像GANを構築するためにそれらを使用します。
提案したINR-GANアーキテクチャは連続画像生成装置の性能を数倍改善する。
論文 参考訳(メタデータ) (2020-11-24T11:06:40Z) - Locally Masked Convolution for Autoregressive Models [107.4635841204146]
LMConvは標準的な2Dコンボリューションの簡単な修正であり、任意のマスクを画像の各位置の重みに適用することができる。
我々は,パラメータを共有するが生成順序が異なる分布推定器のアンサンブルを学習し,全画像密度推定の性能を向上させる。
論文 参考訳(メタデータ) (2020-06-22T17:59:07Z) - Visual Transformers: Token-based Image Representation and Processing for
Computer Vision [67.55770209540306]
Visual Transformer (VT) はセマンティックトークン空間で動作し、コンテキストに基づいて異なる画像部品に任意に参加する。
高度なトレーニングレシピを使うことで、私たちのVTは畳み込みよりも大幅に優れています。
LIPとCOCO-stuffのセマンティックセグメンテーションでは、VTベースの特徴ピラミッドネットワーク(FPN)は、FPNモジュールのFLOPを6.5倍減らしながら、mIoUの0.35ポイントを達成している。
論文 参考訳(メタデータ) (2020-06-05T20:49:49Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。