論文の概要: Full Quaternion Representation of Color images: A Case Study on
QSVD-based Color Image Compression
- arxiv url: http://arxiv.org/abs/2007.09758v1
- Date: Sun, 19 Jul 2020 19:13:21 GMT
- ステータス: 処理完了
- システム内更新日: 2022-11-09 00:51:09.154560
- Title: Full Quaternion Representation of Color images: A Case Study on
QSVD-based Color Image Compression
- Title(参考訳): カラー画像の全四次表現:QSVDに基づくカラー画像圧縮の一事例
- Authors: Alireza Parchami, Mojtaba Mahdavi
- Abstract要約: カラー画像を四元数で表現する手法を提案する。
オートエンコーダニューラルネットワークを用いて、カラー画像をフル四元行列に変換するグローバルモデルを生成する。
- 参考スコア(独自算出の注目度): 0.38073142980732994
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: For many years, channels of a color image have been processed individually,
or the image has been converted to grayscale one with respect to color image
processing. Pure quaternion representation of color images solves this issue as
it allows images to be processed in a holistic space. Nevertheless, it brings
additional costs due to the extra fourth dimension. In this paper, we propose
an approach for representing color images with full quaternion numbers that
enables us to process color images holistically without additional cost in
time, space and computation. With taking auto- and cross-correlation of color
channels into account, an autoencoder neural network is used to generate a
global model for transforming a color image into a full quaternion matrix. To
evaluate the model, we use UCID dataset, and the results indicate that the
model has an acceptable performance on color images. Moreover, we propose a
compression method based on the generated model and QSVD as a case study. The
method is compared with the same compression method using pure quaternion
representation and is assessed with UCID dataset. The results demonstrate that
the compression method using the proposed full quaternion representation fares
better than the other in terms of time, quality, and size of compressed files.
- Abstract(参考訳): 長年にわたり、カラー画像のチャネルを個別に処理してきたり、カラー画像処理に関してグレースケールに変換されたりしてきた。
カラー画像の純四元数表現は、画像が全体空間で処理できるため、この問題を解決する。
それでも、余剰4次元のために追加費用がかかる。
本稿では,カラー画像の処理を時間,空間,計算に余計なコストがかかることなく,全四元数で表現する手法を提案する。
カラーチャネルの自己相関と相互相関を考慮して、オートエンコーダニューラルネットワークを使用して、カラーイメージを完全な四元数行列に変換するグローバルモデルを生成する。
このモデルを評価するために,ucidデータセットを用いて,カラー画像に対して許容できる性能を有することを示す。
さらに,生成されたモデルとqsvdに基づく圧縮手法を事例として提案する。
本手法は、純四元数表現を用いて同じ圧縮法と比較し、UCIDデータセットを用いて評価する。
その結果,提案した全四元数表現を用いた圧縮手法は,圧縮ファイルの時間,品質,サイズにおいて,他よりも優れていた。
関連論文リスト
- Control Color: Multimodal Diffusion-based Interactive Image Colorization [81.68817300796644]
Control Color (Ctrl Color) は、事前訓練された安定拡散(SD)モデルを利用する多モードカラー化手法である。
ユーザのストロークをエンコードして、局所的な色操作を正確に行うための効果的な方法を提案する。
また、カラーオーバーフローと不正確な色付けの長年の問題に対処するために、自己注意に基づく新しいモジュールとコンテンツ誘導型変形可能なオートエンコーダを導入する。
論文 参考訳(メタデータ) (2024-02-16T17:51:13Z) - Quaternion tensor left ring decomposition and application for color
image inpainting [14.601163837840675]
TR分解の強力で一般化された表現能力を継承する四元数テンソル左環(QTLR)分解を提案する。
さらに,定義QTLR分解に基づくカラー画像インペイントのための低ランク四元数テンソル補完(LRQTC)モデルを提案する。
論文 参考訳(メタデータ) (2023-07-20T06:37:47Z) - Color Learning for Image Compression [1.2330326247154968]
本稿では,画像圧縮のタスクを2つのサブタスクに分割した新しいディープラーニングモデルアーキテクチャを提案する。
モデルは2つの別々の分岐を持ち、輝度と彩色成分を処理する。
このアプローチのメリットを実証し、パフォーマンスを他のコーデックと比較します。
論文 参考訳(メタデータ) (2023-06-30T08:16:48Z) - Beyond Learned Metadata-based Raw Image Reconstruction [86.1667769209103]
生画像は、線形性や微細な量子化レベルなど、sRGB画像に対して明確な利点がある。
ストレージの要求が大きいため、一般ユーザからは広く採用されていない。
本稿では,メタデータとして,潜在空間におけるコンパクトな表現を学習する新しいフレームワークを提案する。
論文 参考訳(メタデータ) (2023-06-21T06:59:07Z) - 4D LUT: Learnable Context-Aware 4D Lookup Table for Image Enhancement [50.49396123016185]
学習可能なコンテキスト対応4次元ルックアップテーブル(4D LUT)を提案する。
写真コンテキストを適応的に学習することで、各画像内の異なる内容のコンテンツ依存的な拡張を実現する。
従来の3D LUT、すなわちRGBへのRGBマッピングと比較して、4D LUTは画像ごとに異なる内容の画素の色変換をより細かく制御できる。
論文 参考訳(メタデータ) (2022-09-05T04:00:57Z) - ParaColorizer: Realistic Image Colorization using Parallel Generative
Networks [1.7778609937758327]
グレースケール画像のカラー化は、情報復元のためのAIの魅力的な応用である。
並列なGANベースのカラー化フレームワークを提案する。
マルチモーダル問題を評価するために一般的に使用される非知覚的評価指標の欠点を示す。
論文 参考訳(メタデータ) (2022-08-17T13:49:44Z) - Neural Color Operators for Sequential Image Retouching [62.99812889713773]
本稿では,新たに導入したトレーニング可能なニューラルカラー演算子のシーケンスとして,リタッチ処理をモデル化して,新しい画像リタッチ手法を提案する。
ニューラルカラー演算子は、従来のカラー演算子の振舞いを模倣し、その強度をスカラーで制御しながらピクセルワイズな色変換を学習する。
定量的な測定と視覚的品質の両面で,SOTA法と比較して常に最良の結果が得られている。
論文 参考訳(メタデータ) (2022-07-17T05:33:19Z) - Astronomical Image Colorization and upscaling with Generative
Adversarial Networks [0.0]
本研究の目的は、非常に特定の画像領域、すなわち天文学的な画像に焦点をあてることにより、この問題に自動的アプローチを提供することである。
我々は、RGBとL*a*bという2つの異なる色空間における様々なモデルの使用について検討する。
このモデルは、画像に存在しない高解像度で色付けされたデータを幻覚させる視覚的に魅力的な画像を生成する。
論文 参考訳(メタデータ) (2021-12-27T19:01:20Z) - Quaternion higher-order singular value decomposition and its
applications in color image processing [1.1929584800629671]
HOSVDを四元数領域に一般化し、四元数に基づくHOSVD(QHOSVD)を定義する。
四元数乗算の非可換性のため、QHOSVD は HOSVD の自明な拡張ではない。
カラー画像処理における定義QHOSVDの2つの応用として、マルチフォーカスカラー画像融合とカラー画像復調について述べる。
論文 参考訳(メタデータ) (2021-01-02T03:54:56Z) - Probabilistic Color Constancy [88.85103410035929]
我々は、異なる画像領域の寄与を重み付けすることで、シーンの照度を推定するためのフレームワークを定義する。
提案手法は,INTEL-TAUデータセット上での最先端技術と比較して,競合性能を実現する。
論文 参考訳(メタデータ) (2020-05-06T11:03:05Z) - Learning to Structure an Image with Few Colors [59.34619548026885]
そこで,カラー量子化ネットワークであるColorCNNを提案する。
1ビットのカラースペース(すなわち2色)だけで、提案されたネットワークはCIFAR10データセット上で82.1%のトップ-1の精度を達成した。
アプリケーションの場合、PNGでエンコードされた場合、提案したカラー量子化は、極低ビットレート方式の他の画像圧縮方法よりも優れていることを示す。
論文 参考訳(メタデータ) (2020-03-17T17:56:15Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。