論文の概要: Hermite coordinate interpolation kernels: application to image zooming
- arxiv url: http://arxiv.org/abs/2403.13195v1
- Date: Tue, 19 Mar 2024 23:06:10 GMT
- ステータス: 処理完了
- システム内更新日: 2024-03-21 18:27:31.937624
- Title: Hermite coordinate interpolation kernels: application to image zooming
- Title(参考訳): Hermite座標補間カーネル:画像ズームへの応用
- Authors: Konstantinos K. Delibasis, Iro Oikonomou, Aristides I. Kechriniotis, Georgios N. Tsigaridas,
- Abstract要約: 幾何変換のような多くの基本的な画像処理タスクは、ピクセル以下の画像値を必要とする。
この研究では、非等間隔線型格子上で定義される多次元エルミートスプラインを利用する。
補間体の複雑さが増大しているにもかかわらず、カーネルが構築されると、Hermiteスプラインは他のより複雑な方法と同様に効率的に画像に適用できることが示される。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by-nc-sa/4.0/
- Abstract: A number of basic image processing tasks, such as any geometric transformation require interpolation at subpixel image values. In this work we utilize the multidimensional coordinate Hermite spline interpolation defined on non-equal spaced, rectilinear grids and apply it to a very common image processing task, image zooming. Since Hermite interpolation utilizes function values, as well as partial derivative values, it is natural to apply it to image processing tasks as a special case of equi-spaced grid, using numerical approximations of the image partial derivatives at each pixel. Furthermore, the task of image interpolation requires the calculation of image values at positions with nono-zero fractional part. Thus, any spline interpolation can be written as convolution with an appropriate kernel. In this context we generate the Hermite kernels according to the derived $n-$dimensional interpolant of Theorem 2 in [1]. We show that despite the increased complexity of the interpolant, once the kernels are constructed, the Hermite spline interpolation can be applied to images as efficiently as any other less complicated method. Finally, we perform illustrative numerical examples to showcase the applicability and high accuracy of the proposed Hermite kernels for image zooming, compared to other interpolation methods, both traditional convolution-based, as well as employing deep learning, in terms of PSNR, as well as SSIM error metrics. The proposed Hermite spline kernels outperform all other methods in the majority of the test images, in experiments using many cascaded repetitions of the zoom operation. Interesting conclusions can be drawn considering all methods under comparison.
- Abstract(参考訳): 幾何変換のような多くの基本的な画像処理タスクは、サブピクセル画像の値の補間を必要とする。
本研究では,非等間隔の直線格子上に定義された多次元座標Hermite Spline補間を利用して,画像ズームという,非常に一般的な画像処理タスクに適用する。
Hermite補間は関数値や偏微分値を利用するため、各画素における画像偏微分の数値近似を用いて、等間隔格子の特別な場合として画像処理タスクに適用することは自然である。
さらに、画像補間処理のタスクは、nono-zero分数部分を持つ位置における画像値の計算を必要とする。
したがって、スプライン補間は適切なカーネルとの畳み込みとして記述することができる。
この文脈では、 [1] において定理 2 の導出した$n-$次元補間子に従ってエルミート核を生成する。
補間材の複雑さが増大しているにもかかわらず、カーネルが構築されると、ハーマイトスプライン補間は他のより複雑な方法と同様に効率的に画像に適用できることが示される。
最後に,従来の畳み込みに基づく他の補間法と比較し,PSNRやSSIM誤差の指標として深層学習を用いた場合と比較して,画像ズームのためのHermiteカーネルの適用性と高精度性を示すための実証的な数値例を示す。
提案したHermiteスプラインカーネルは、ズーム操作のカスケード繰り返しを用いた実験において、テスト画像の大部分において、他のすべての方法よりも優れている。
興味深い結論は、比較対象のすべての方法を考慮すると得られる。
関連論文リスト
- GlobalMamba: Global Image Serialization for Vision Mamba [73.50475621164037]
視覚マンバは、視覚トークンの数に対して線形複雑度で強い性能を示した。
既存のほとんどの方法はパッチベースの画像トークン化を採用し、因果処理のためにそれらを1Dシーケンスにフラット化する。
本稿では,グローバルな画像シリアライズ手法を提案し,その画像を因果トークンのシーケンスに変換する。
論文 参考訳(メタデータ) (2024-10-14T09:19:05Z) - Video Frame Interpolation with Many-to-many Splatting and Spatial
Selective Refinement [83.60486465697318]
本稿では,フレームを効率的に補間するM2Mスプレイティングフレームワークを提案する。
入力フレームペアごとに、M2Mは任意の数のフレーム間を補間する際の計算オーバーヘッドが極小である。
フレキシブルな空間選択リファインメント(Spatial Selective Refinement)コンポーネントを導入して,M2M++フレームワークを拡張した。
論文 参考訳(メタデータ) (2023-10-29T09:09:32Z) - Padding-free Convolution based on Preservation of Differential
Characteristics of Kernels [1.3597551064547502]
本稿では,カーネルの差分特性の保存に基づくサイズ保持畳み込み法を提案する。
主なアイデアは、不完全なスライドウィンドウ上の畳み込みを、その中心画素で局所的に評価された線形微分作用素に"崩壊"させることである。
論文 参考訳(メタデータ) (2023-09-12T16:36:12Z) - Dynamic Implicit Image Function for Efficient Arbitrary-Scale Image
Representation [24.429100808481394]
任意の解像度の画像を高速かつ効率的に表現できる動的インプリシット画像関数(DIIF)を提案する。
本稿では,座標スライスから画素値スライスへのデコードを可能にする座標グルーピングとスライス戦略を提案する。
動的座標スライシングにより、DIIFは任意のスケールのSRに遭遇する際の計算コストを大幅に削減する。
論文 参考訳(メタデータ) (2023-06-21T15:04:34Z) - Efficient Image Denoising by Low-Rank Singular Vector Approximations of Geodesics' Gramian Matrix [2.3499129784547654]
画像の騒音汚染は、人々の間で準標準的期待をもたらす。
画像のデノイングは、必要不可欠な前処理ステップです。
本稿では,測地学のグラミアン行列の特異ベクトルを主に利用した多様体に基づくノイズフィルタリング法を提案する。
論文 参考訳(メタデータ) (2022-09-27T01:03:36Z) - Adaptive Local Implicit Image Function for Arbitrary-scale
Super-resolution [61.95533972380704]
局所暗黙画像関数(LIIF)は、対応する座標を入力として、画素値が拡張される連続関数として画像を表す。
LIIFは任意のスケールの超解像タスクに適用でき、その結果、様々なアップスケーリング要因に対して単一の効率的かつ効率的なモデルが得られる。
この問題を軽減するために,新しい適応型局所像関数(A-LIIF)を提案する。
論文 参考訳(メタデータ) (2022-08-07T11:23:23Z) - Two-Stream Graph Convolutional Network for Intra-oral Scanner Image
Segmentation [133.02190910009384]
本稿では,2ストリームグラフ畳み込みネットワーク(TSGCN)を提案する。
TSGCNは3次元歯(表面)セグメンテーションにおいて最先端の方法よりも優れています。
論文 参考訳(メタデータ) (2022-04-19T10:41:09Z) - Many-to-many Splatting for Efficient Video Frame Interpolation [80.10804399840927]
モーションベースのビデオフレームは、入力から所望の瞬間までの画素をワープするための光学フローに依存している。
many-to-Many (M2M) スプレイティングフレームワークはフレームを効率的に補間する。
M2Mは任意の数のフレーム間を補間する際の計算オーバーヘッドが極小である。
論文 参考訳(メタデータ) (2022-04-07T15:29:42Z) - Interpolating Points on a Non-Uniform Grid using a Mixture of Gaussians [0.0]
ガウス混合モデルに基づく一様でない画像を生成する手法を提案する。
従来の画像方法は、補間したい座標が一様格子上に配置されていると仮定します。
論文 参考訳(メタデータ) (2020-12-24T13:59:39Z) - Locally Masked Convolution for Autoregressive Models [107.4635841204146]
LMConvは標準的な2Dコンボリューションの簡単な修正であり、任意のマスクを画像の各位置の重みに適用することができる。
我々は,パラメータを共有するが生成順序が異なる分布推定器のアンサンブルを学習し,全画像密度推定の性能を向上させる。
論文 参考訳(メタデータ) (2020-06-22T17:59:07Z) - The Semantic Mutex Watershed for Efficient Bottom-Up Semantic Instance
Segmentation [15.768804877756384]
本稿では,共同グラフ分割とラベリングのためのグリーディアルゴリズムを提案する。
アルゴリズムの効率のため、イメージをスーパーピクセルにオーバーセグメンテーションすることなく、直接ピクセル上で操作することができる。
論文 参考訳(メタデータ) (2019-12-29T19:48:39Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。