論文の概要: OMR-NET: a two-stage octave multi-scale residual network for screen content image compression
- arxiv url: http://arxiv.org/abs/2407.08545v1
- Date: Thu, 11 Jul 2024 14:30:46 GMT
- ステータス: 処理完了
- システム内更新日: 2024-07-12 17:10:08.235223
- Title: OMR-NET: a two-stage octave multi-scale residual network for screen content image compression
- Title(参考訳): OMR-NET:スクリーンコンテンツ画像圧縮のための2段階オクターブマルチスケール残差ネットワーク
- Authors: Shiqi Jiang, Ting Ren, Congrui Fu, Shuai Li, Hui Yuan,
- Abstract要約: スクリーンコンテンツ(SC)は、ノイズフリー、反復パターン、高コントラストといったユニークな特徴を持つ自然シーン(NS)とは異なる。
高速・低周波特徴抽出のための改良された2段オクターブ畳み込み残差ブロック(IToRB)を提案する。
また、特に画像中の高コントラスト領域の画素相関を捉えるために、ウィンドウベースアテンションモジュール(WAM)を用いる。
- 参考スコア(独自算出の注目度): 11.518417977364377
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Screen content (SC) differs from natural scene (NS) with unique characteristics such as noise-free, repetitive patterns, and high contrast. Aiming at addressing the inadequacies of current learned image compression (LIC) methods for SC, we propose an improved two-stage octave convolutional residual blocks (IToRB) for high and low-frequency feature extraction and a cascaded two-stage multi-scale residual blocks (CTMSRB) for improved multi-scale learning and nonlinearity in SC. Additionally, we employ a window-based attention module (WAM) to capture pixel correlations, especially for high contrast regions in the image. We also construct a diverse SC image compression dataset (SDU-SCICD2K) for training, including text, charts, graphics, animation, movie, game and mixture of SC images and NS images. Experimental results show our method, more suited for SC than NS data, outperforms existing LIC methods in rate-distortion performance on SC images. The code is publicly available at https://github.com/SunshineSki/OMR Net.git.
- Abstract(参考訳): スクリーンコンテンツ(SC)は、ノイズフリー、反復パターン、高コントラストといったユニークな特徴を持つ自然シーン(NS)とは異なる。
SCにおける現在の学習画像圧縮(lic)手法の欠如に対処するために,高頻度特徴抽出のための改良された2段階オクターブ畳み込み残差ブロック(IToRB)と,SCのマルチスケール学習と非線形性を改善するためのカスケードされた2段階多段階残差ブロック(CTMSRB)を提案する。
さらに、特に画像の高コントラスト領域において、ウィンドウベースのアテンションモジュール(WAM)を用いて画素相関をキャプチャする。
また、テキスト、チャート、グラフィック、アニメーション、映画、ゲーム、SC画像とNS画像の混合を含む、多様なSC画像圧縮データセット(SDU-SCICD2K)を構築した。
実験の結果,提案手法は NS データよりもSC に適しており,SC 画像の速度歪み性能において既存の LIC 手法よりも優れていた。
コードはhttps://github.com/SunshineSki/OMR Net.gitで公開されている。
関連論文リスト
- You Only Need One Color Space: An Efficient Network for Low-light Image Enhancement [50.37253008333166]
低照度画像強調(LLIE)タスクは、劣化した低照度画像から詳細と視覚情報を復元する傾向がある。
水平/垂直インテンシティ(HVI)と呼ばれる新しいトレーニング可能なカラー空間を提案する。
輝度と色をRGBチャネルから切り離して、拡張中の不安定性を緩和するだけでなく、トレーニング可能なパラメータによって異なる照明範囲の低照度画像にも適応する。
論文 参考訳(メタデータ) (2024-02-08T16:47:43Z) - Unsupervised HDR Image and Video Tone Mapping via Contrastive Learning [19.346284003982035]
教師なし画像とビデオトーンマッピングのための統合フレームワーク(IVTMNet)を提案する。
ビデオトーンマッピングでは,時間的相関を効率的に活用するための時間的特徴置換(TFR)モジュールを提案する。
実験結果から,本手法は最先端画像やビデオトーンマッピング法よりも優れていた。
論文 参考訳(メタデータ) (2023-03-13T17:45:39Z) - Scalable Neural Video Representations with Learnable Positional Features [73.51591757726493]
我々は,学習可能な位置特徴(NVP)を用いて,映像を潜時符号として効果的に再生するニューラル表現の訓練方法を示す。
一般的なUVGベンチマークにおけるNVPの優位性を実証し,先行技術と比較して,NVPは2倍の速度(5分以内)で走行するだけでなく,符号化品質も34.07rightarrow$34.57(PSNR測定値で測定)に上回っている。
論文 参考訳(メタデータ) (2022-10-13T08:15:08Z) - Coil2Coil: Self-supervised MR image denoising using phased-array coil
images [23.595716054832916]
クリーンな画像の取得やペアのノイズ破損画像の学習を必要としない,自己教師型デノベーション手法Coil2Coil(C2C)を提案する。
C2Cは、いくつかの自己教師付きメソッドに対して最高のパフォーマンスを示し、教師付きメソッドに匹敵する結果を報告している。
クリーン画像やペア画像にスキャンを加える必要がないという大きな利点があるため、様々な臨床応用に容易に利用できる。
論文 参考訳(メタデータ) (2022-08-16T05:57:24Z) - Rank-Enhanced Low-Dimensional Convolution Set for Hyperspectral Image
Denoising [50.039949798156826]
本稿では,ハイパースペクトル(HS)画像の難解化問題に対処する。
ランク付き低次元畳み込み集合(Re-ConvSet)を提案する。
次に、Re-ConvSetを広く使われているU-Netアーキテクチャに組み込んで、HS画像復号法を構築する。
論文 参考訳(メタデータ) (2022-07-09T13:35:12Z) - Multi-scale frequency separation network for image deblurring [10.511076996096117]
本稿では,マルチスケール周波数分離ネットワーク (MSFS-Net) を用いた画像分解手法を提案する。
MSFS-Netは複数のスケールで画像の低周波・高周波情報をキャプチャする。
ベンチマークデータセットの実験により,提案したネットワークが最先端の性能を達成することが示された。
論文 参考訳(メタデータ) (2022-06-01T23:48:35Z) - Coarse-to-Fine Sparse Transformer for Hyperspectral Image Reconstruction [138.04956118993934]
本稿では, サース・トゥ・ファインス・スパース・トランス (CST) を用いた新しいトランス方式を提案する。
HSI再構成のための深層学習にHSI空間を埋め込んだCST
特に,CSTは,提案したスペクトル認識スクリーニング機構(SASM)を粗いパッチ選択に使用し,選択したパッチを,細かなピクセルクラスタリングと自己相似性キャプチャのために,カスタマイズしたスペクトル集約ハッシュ型マルチヘッド自己アテンション(SAH-MSA)に入力する。
論文 参考訳(メタデータ) (2022-03-09T16:17:47Z) - Spatial-Separated Curve Rendering Network for Efficient and
High-Resolution Image Harmonization [59.19214040221055]
本稿では,空間分離型曲線描画ネットワーク(S$2$CRNet)を提案する。
提案手法は従来の手法と比較して90%以上のパラメータを減少させる。
提案手法は,既存の手法よりも10ドル以上高速な高解像度画像をリアルタイムにスムーズに処理することができる。
論文 参考訳(メタデータ) (2021-09-13T07:20:16Z) - Learned Image Compression with Gaussian-Laplacian-Logistic Mixture Model
and Concatenated Residual Modules [22.818632387206257]
学習画像圧縮の2つの重要な要素は、潜在表現のエントロピーモデルと符号化/復号化ネットワークアーキテクチャである。
本稿では,よりフレキシブルなガウス・ラプラシア・ロジスティック混合モデル(GLLMM)を提案する。
符号化/復号化ネットワーク設計部では、複数の残差ブロックを追加のショートカット接続で直列接続する残差ブロック(CRB)を提案する。
論文 参考訳(メタデータ) (2021-07-14T02:54:22Z) - Asymmetric CNN for image super-resolution [102.96131810686231]
深層畳み込みニューラルネットワーク(CNN)は、過去5年間で低レベルビジョンに広く適用されています。
画像超解像のための非対称ブロック(AB)、mem?ory拡張ブロック(MEB)、高周波数特徴強調ブロック(HFFEB)からなる非対称CNN(ACNet)を提案する。
我々のACNetは、ブラインドノイズの単一画像超解像(SISR)、ブラインドSISR、ブラインドSISRを効果的に処理できる。
論文 参考訳(メタデータ) (2021-03-25T07:10:46Z) - Learned Multi-Resolution Variable-Rate Image Compression with
Octave-based Residual Blocks [15.308823742699039]
一般化オクターブ畳み込み(GoConv)と一般化オクターブ畳み込み(GoTConv)を用いた新しい可変レート画像圧縮フレームワークを提案する。
単一モデルが異なるビットレートで動作し、複数レートの画像特徴を学習できるようにするため、新しい目的関数が導入される。
実験結果から,H.265/HEVCベースのBPGや最先端の学習に基づく可変レート法などの標準コーデックよりも高い性能を示した。
論文 参考訳(メタデータ) (2020-12-31T06:26:56Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。