論文の概要: Hybrid Model-based / Data-driven Graph Transform for Image Coding
- arxiv url: http://arxiv.org/abs/2203.01186v1
- Date: Wed, 2 Mar 2022 15:36:44 GMT
- ステータス: 処理完了
- システム内更新日: 2022-03-03 20:11:48.065114
- Title: Hybrid Model-based / Data-driven Graph Transform for Image Coding
- Title(参考訳): 画像符号化のためのハイブリッドモデルベース/データ駆動グラフ変換
- Authors: Saghar Bagheri, Tam Thuc Do, Gene Cheung, Antonio Ortega
- Abstract要約: 予測内残差ブロックを符号化するハイブリッドモデルベース/データ駆動方式を提案する。
変換行列の最初の$K$固有ベクトルは、安定性のための非対称離散正弦変換(ADST)のような統計モデルから導かれる。
WebPをベースライン画像として使用することにより、我々のハイブリッドグラフ変換は、デフォルトの離散コサイン変換(DCT)よりもエネルギーの圧縮が良く、KLTよりも安定性がよいことを示す。
- 参考スコア(独自算出の注目度): 54.31406300524195
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Transform coding to sparsify signal representations remains crucial in an
image compression pipeline. While the Karhunen-Lo\`{e}ve transform (KLT)
computed from an empirical covariance matrix $\bar{C}$ is theoretically optimal
for a stationary process, in practice, collecting sufficient statistics from a
non-stationary image to reliably estimate $\bar{C}$ can be difficult. In this
paper, to encode an intra-prediction residual block, we pursue a hybrid
model-based / data-driven approach: the first $K$ eigenvectors of a transform
matrix are derived from a statistical model, e.g., the asymmetric discrete sine
transform (ADST), for stability, while the remaining $N-K$ are computed from
$\bar{C}$ for performance. The transform computation is posed as a graph
learning problem, where we seek a graph Laplacian matrix minimizing a graphical
lasso objective inside a convex cone sharing the first $K$ eigenvectors in a
Hilbert space of real symmetric matrices. We efficiently solve the problem via
augmented Lagrangian relaxation and proximal gradient (PG). Using WebP as a
baseline image codec, experimental results show that our hybrid graph transform
achieved better energy compaction than default discrete cosine transform (DCT)
and better stability than KLT.
- Abstract(参考訳): 信号表現をスパシフィケートするトランスフォーメーションコーディングは、画像圧縮パイプラインにおいて依然として不可欠である。
経験的共分散行列 $\bar{C}$ から計算した Karhunen-Lo\`{e}ve 変換 (KLT) は定常過程に理論的に最適であるが、実際には非定常像から十分な統計データを収集して$\bar{C}$ を確実に推定することは困難である。
本稿では、予測内残差ブロックを符号化するために、変換行列の最初の$K$固有ベクトルは安定性のために非対称離散正弦変換(ADST)から導出され、残りの$N-K$は性能のために$\bar{C}$から計算されるハイブリッドモデルベース/データ駆動アプローチを追求する。
変換計算はグラフ学習問題として提案され、実対称行列のヒルベルト空間において最初の$k$固有ベクトルを共有する凸錐の内部でグラフィカルラッソ対象を最小化するグラフラプラシアン行列を求める。
拡張ラグランジュ緩和と近位勾配(PG)を用いて効率よく問題を解く。
webp をベースラインイメージコーデックとして使用した結果,本手法のハイブリッドグラフ変換はデフォルト離散コサイン変換 (dct) よりもエネルギー圧縮性が向上し,klt よりも安定性が向上した。
関連論文リスト
- Variable-size Symmetry-based Graph Fourier Transforms for image compression [65.7352685872625]
可変サイズのグラフフーリエ変換を符号化フレームワークに導入する。
提案アルゴリズムは,ノード間の特定の対称接続を追加することにより,グリッド上の対称グラフを生成する。
実験により、SBGFTは、明示的な多重変換選択に統合された一次変換よりも優れていることが示された。
論文 参考訳(メタデータ) (2024-11-24T13:00:44Z) - Interpretable Lightweight Transformer via Unrolling of Learned Graph Smoothness Priors [16.04850782310842]
我々は反復最適化アルゴリズムをアンロールすることで、解釈可能で軽量なトランスフォーマーのようなニューラルネットワークを構築する。
正規化信号依存グラフ学習モジュールは、従来の変圧器の基本自己保持機構の変種に相当する。
論文 参考訳(メタデータ) (2024-06-06T14:01:28Z) - Learning Sparse High-Dimensional Matrix-Valued Graphical Models From Dependent Data [12.94486861344922]
スパース,高次元,定常行列-ガウス時系列の条件独立グラフ(CIG)を推定する問題を考察する。
我々は、Kronecker分解性パワースペクトル密度(PSD)による問題をスパースベースで定式化することを考える。
合成データと実データの両方を利用した数値例を用いて,本手法について述べる。
論文 参考訳(メタデータ) (2024-04-29T19:32:50Z) - Transformers as Support Vector Machines [54.642793677472724]
自己アテンションの最適化幾何と厳密なSVM問題との間には,形式的等価性を確立する。
勾配降下に最適化された1層変圧器の暗黙バイアスを特徴付ける。
これらの発見は、最適なトークンを分離し選択するSVMの階層としてのトランスフォーマーの解釈を刺激していると信じている。
論文 参考訳(メタデータ) (2023-08-31T17:57:50Z) - Linear Convergence of ISTA and FISTA [8.261388753972234]
疎表現を用いた線形逆問題の解法として,反復縮小保持アルゴリズム (ISTA) のクラスを再検討する。
滑らかな部分を凸とする以前の仮定は最小二乗モデルを弱める。
目的値と2乗近位下次ノルムの両方において、線形収束を合成最適化に一般化する。
論文 参考訳(メタデータ) (2022-12-13T02:02:50Z) - Learning Sparse Graph with Minimax Concave Penalty under Gaussian Markov
Random Fields [51.07460861448716]
本稿では,データから学ぶための凸解析フレームワークを提案する。
三角凸分解はその上部に対応する変換によって保証されることを示す。
論文 参考訳(メタデータ) (2021-09-17T17:46:12Z) - Unfolding Projection-free SDP Relaxation of Binary Graph Classifier via
GDPA Linearization [59.87663954467815]
アルゴリズムの展開は、モデルベースのアルゴリズムの各イテレーションをニューラルネットワーク層として実装することにより、解釈可能で類似のニューラルネットワークアーキテクチャを生成する。
本稿では、Gershgorin disc perfect alignment (GDPA)と呼ばれる最近の線形代数定理を利用して、二進グラフの半定値プログラミング緩和(SDR)のためのプロジェクションフリーアルゴリズムをアンロールする。
実験結果から,我々の未学習ネットワークは純粋モデルベースグラフ分類器よりも優れ,純粋データ駆動ネットワークに匹敵する性能を示したが,パラメータははるかに少なかった。
論文 参考訳(メタデータ) (2021-09-10T07:01:15Z) - Why Approximate Matrix Square Root Outperforms Accurate SVD in Global
Covariance Pooling? [59.820507600960745]
本稿では,前方通過のSVDと後方伝播のPad'e近似を用いて勾配を計算する新しいGCPメタ層を提案する。
提案するメタレイヤは,さまざまなCNNモデルに統合され,大規模および微細なデータセット上で最先端のパフォーマンスを実現する。
論文 参考訳(メタデータ) (2021-05-06T08:03:45Z) - On Box-Cox Transformation for Image Normality and Pattern Classification [0.6548580592686074]
本稿では,2次元データ変換のための前処理ステップとして,そのようなツールの有用性について論じる。
我々は、この軽量なBox-Cox変換の効果を、最先端の低光画像強調技術と比較した。
また,画像の視覚的外観を汎用的に改善するために,複数のテストベッドデータセットによるアプローチの有効性を実証した。
論文 参考訳(メタデータ) (2020-04-15T17:10:18Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。