Fugu-MT 論文翻訳(概要): Parallel Discrete Convolutions on Adaptive Particle Representations of Images

論文の概要: Parallel Discrete Convolutions on Adaptive Particle Representations of Images

arxiv url: http://arxiv.org/abs/2112.03592v1
Date: Tue, 7 Dec 2021 09:40:05 GMT
ステータス: 翻訳完了
システム内更新日: 2021-12-08 16:00:57.999198
Title: Parallel Discrete Convolutions on Adaptive Particle Representations of Images
Title（参考訳）: 画像の適応粒子表現における並列離散畳み込み
Authors: Joel Jonsson, Bevan L. Cheeseman, Suryanarayana Maddu, Krzysztof Gonciarz, Ivo F. Sbalzarini
Abstract要約: 適応粒子表現上の離散畳み込み演算子のネイティブ実装のためのデータ構造とアルゴリズムを提案する。 APRは、サンプリング解像度を画像信号に局所的に適応するコンテンツ適応型画像表現である。 APRの畳み込みは、マルチコアCPUとGPUアーキテクチャを効率的に並列化するスケール適応アルゴリズムを自然に導くことを示す。
参考スコア（独自算出の注目度）: 2.362412515574206
License: http://creativecommons.org/licenses/by-nc-nd/4.0/
Abstract: We present data structures and algorithms for native implementations of discrete convolution operators over Adaptive Particle Representations (APR) of images on parallel computer architectures. The APR is a content-adaptive image representation that locally adapts the sampling resolution to the image signal. It has been developed as an alternative to pixel representations for large, sparse images as they typically occur in fluorescence microscopy. It has been shown to reduce the memory and runtime costs of storing, visualizing, and processing such images. This, however, requires that image processing natively operates on APRs, without intermediately reverting to pixels. Designing efficient and scalable APR-native image processing primitives, however, is complicated by the APR's irregular memory structure. Here, we provide the algorithmic building blocks required to efficiently and natively process APR images using a wide range of algorithms that can be formulated in terms of discrete convolutions. We show that APR convolution naturally leads to scale-adaptive algorithms that efficiently parallelize on multi-core CPU and GPU architectures. We quantify the speedups in comparison to pixel-based algorithms and convolutions on evenly sampled data. We achieve pixel-equivalent throughputs of up to 1 TB/s on a single Nvidia GeForce RTX 2080 gaming GPU, requiring up to two orders of magnitude less memory than a pixel-based implementation.
Abstract（参考訳）: 本稿では,並列計算機アーキテクチャ上の画像の適応粒子表現(apr)上の離散畳み込み演算子のネイティブ実装のためのデータ構造とアルゴリズムを提案する。 APRは、サンプリング解像度を画像信号に局所的に適応するコンテンツ適応型画像表現である。蛍光顕微鏡で通常発生するように、大きくスパースな画像に対するピクセル表現の代替として開発された。このような画像の保存、視覚化、処理のメモリと実行コストを削減することが示されている。しかし、これは、画像処理がAPR上でネイティブに動作し、ピクセルに中間反転しない必要がある。しかし、APRの不規則なメモリ構造によって、効率的でスケーラブルなAPRネイティブ画像処理プリミティブを設計することは複雑である。本稿では, 離散畳み込みを用いて定式化可能な幅広いアルゴリズムを用いて, apr画像の効率的かつネイティブな処理に必要なアルゴリズム構築ブロックを提案する。 apr畳み込みは,マルチコアcpuとgpuアーキテクチャを効率的に並列化するスケール適応アルゴリズムを自然に生み出す。画素ベースのアルゴリズムと等しくサンプリングされたデータの畳み込みと比較して,スピードアップの定量化を行う。我々は1台のNvidia GeForce RTX 2080ゲームGPU上で最大1TB/sのピクセル等価スループットを実現し、ピクセルベースの実装よりも最大2桁少ないメモリを必要とする。

関連論文リスト

Primitive-Driven Acceleration of Hyperdimensional Computing for Real-Time Image Classification [0.07646713951724012]
局所的な画像パッチを空間情報に富んだハイパーベクターにマッピングする画像符号化アルゴリズムを開発した。これらのパッチレベルのハイパーベクターは、基本HDC演算を用いてグローバル表現にマージされる。このエンコーダは、MNISTで95.67%、Fashion-MNISTで85.14%の精度を達成し、HDCベースの画像エンコーダよりも優れていた。
論文参考訳（メタデータ） (2026-01-27T21:12:56Z)
Superpixel Integrated Grids for Fast Image Segmentation [0.07639235704257864]
セグメンテーションタスクにおけるフル解像度画像の代替として,新しいスーパーピクセルベースデータ構造SIGRIDを導入する。 SIGRIDは、古典的な形状記述子を活用することにより、入力寸法を著しく減少させながら、スーパーピクセルの色情報と形状情報を符号化する。
論文参考訳（メタデータ） (2025-10-07T22:02:48Z)
High-Frequency Prior-Driven Adaptive Masking for Accelerating Image Super-Resolution [87.56382172827526]
高周波領域は再建に最も重要である。本稿では,アクセラレーションのためのトレーニング不要適応マスキングモジュールを提案する。本手法は,最先端モデルのFLOPを24～43%削減する。
論文参考訳（メタデータ） (2025-05-11T13:18:03Z)
Image Coding for Machines via Feature-Preserving Rate-Distortion Optimization [27.97760974010369]
本稿では,特徴量間の距離を歪み指標として,タスク損失に対する圧縮の影響を低減する手法を提案する。我々は、ブロックベースのエンコーダを用いて歪み項を計算可能にするために、RDOの定式化を単純化する。 SSEに基づくRDOと比較して、同じコンピュータビジョンの精度で最大10%のビットレートを節約できる。
論文参考訳（メタデータ） (2025-04-03T02:11:26Z)
Accelerating Image Super-Resolution Networks with Pixel-Level Classification [29.010136088811137]
Pixel-level for Single Image SuperResolutionは、ピクセルレベルで計算資源を適応的に分配する新しい手法である。提案手法では,再学習を伴わない推論における性能と計算コストのバランスが可能である。
論文参考訳（メタデータ） (2024-07-31T08:53:10Z)
Image-GS: Content-Adaptive Image Representation via 2D Gaussians [55.15950594752051]
本稿では,コンテンツ適応型画像表現であるImage-GSを提案する。異方性2Dガウスアンをベースとして、Image-GSは高いメモリ効率を示し、高速なランダムアクセスをサポートし、自然なレベルのディテールスタックを提供する。画像-GSの一般的な効率性と忠実性は、最近のニューラルイメージ表現と業界標準テクスチャ圧縮機に対して検証される。この研究は、機械認識、アセットストリーミング、コンテンツ生成など、適応的な品質とリソース制御を必要とする新しいアプリケーションを開発するための洞察を与えてくれることを願っている。
論文参考訳（メタデータ） (2024-07-02T00:45:21Z)
Parameter-Inverted Image Pyramid Networks [49.35689698870247]
Inverted Image Pyramid Networks (PIIP) と呼ばれる新しいネットワークアーキテクチャを提案する。私たちの中核となる考え方は、パラメータサイズの異なるモデルを使用して、画像ピラミッドの解像度の異なるレベルを処理することです。 PIIPは、オブジェクト検出、セグメンテーション、画像分類などのタスクにおいて優れたパフォーマンスを達成する。
論文参考訳（メタデータ） (2024-06-06T17:59:10Z)
Mapping Image Transformations Onto Pixel Processor Arrays [4.857223862405921]
Pixel Processor Arrays (PPA) は、SIMD配列のプロセッサ要素からなる新しい視覚センサ/プロセッサアーキテクチャを提供する。我々は, せん断, 回転, スケーリングを含む様々な画像変換が, PPA上で直接実行可能であることを示す。
論文参考訳（メタデータ） (2024-03-25T17:56:41Z)
ImageSig: A signature transform for ultra-lightweight image recognition [0.0]
ImageSigは計算シグネチャに基づいており、畳み込み構造やアテンションベースのエンコーダを必要としない。 ImageSigはRaspberry PiやJetson-nanoのようなハードウェアで前例のないパフォーマンスを示している。
論文参考訳（メタデータ） (2022-05-13T23:48:32Z)
Fast and High-Quality Image Denoising via Malleable Convolutions [72.18723834537494]
動的畳み込みの効率的な変種として、Malleable Convolution (MalleConv)を提案する。以前の作品とは異なり、MalleConvは入力から空間的に変化するカーネルのより小さなセットを生成する。また、MalleNetという造語であるMalleConvを用いて、効率的なdenoisingネットワークを構築した。
論文参考訳（メタデータ） (2022-01-02T18:35:20Z)
Spatially-Adaptive Pixelwise Networks for Fast Image Translation [57.359250882770525]
高速かつ効率的な画像-画像変換を目的とした新しいジェネレータアーキテクチャを提案する。私たちはピクセルワイズネットワークを使用します。つまり、各ピクセルは他のピクセルとは独立して処理されます。私たちのモデルは最先端のベースラインよりも最大18倍高速です。
論文参考訳（メタデータ） (2020-12-05T10:02:03Z)
Adversarial Generation of Continuous Images [31.92891885615843]
本稿では,INRに基づく画像デコーダ構築のための2つの新しいアーキテクチャ手法を提案する。私たちは、最先端の連続画像GANを構築するためにそれらを使用します。提案したINR-GANアーキテクチャは連続画像生成装置の性能を数倍改善する。
論文参考訳（メタデータ） (2020-11-24T11:06:40Z)
Locally Masked Convolution for Autoregressive Models [107.4635841204146]
LMConvは標準的な2Dコンボリューションの簡単な修正であり、任意のマスクを画像の各位置の重みに適用することができる。我々は,パラメータを共有するが生成順序が異なる分布推定器のアンサンブルを学習し,全画像密度推定の性能を向上させる。
論文参考訳（メタデータ） (2020-06-22T17:59:07Z)
Visual Transformers: Token-based Image Representation and Processing for Computer Vision [67.55770209540306]
Visual Transformer (VT) はセマンティックトークン空間で動作し、コンテキストに基づいて異なる画像部品に任意に参加する。高度なトレーニングレシピを使うことで、私たちのVTは畳み込みよりも大幅に優れています。 LIPとCOCO-stuffのセマンティックセグメンテーションでは、VTベースの特徴ピラミッドネットワーク(FPN)は、FPNモジュールのFLOPを6.5倍減らしながら、mIoUの0.35ポイントを達成している。
論文参考訳（メタデータ） (2020-06-05T20:49:49Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。