論文の概要: COIN: COmpression with Implicit Neural representations
- arxiv url: http://arxiv.org/abs/2103.03123v1
- Date: Wed, 3 Mar 2021 10:58:39 GMT
- ステータス: 処理完了
- システム内更新日: 2021-03-05 15:02:03.652289
- Title: COIN: COmpression with Implicit Neural representations
- Title(参考訳): COIN:暗黙のニューラル表現による圧縮
- Authors: Emilien Dupont, Adam Goli\'nski, Milad Alizadeh, Yee Whye Teh, Arnaud
Doucet
- Abstract要約: 画像圧縮のための新しい簡易手法を提案する。
画像の各ピクセルのRGB値を格納する代わりに、画像に過度に適合したニューラルネットワークの重みを格納する。
- 参考スコア(独自算出の注目度): 64.02694714768691
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: We propose a new simple approach for image compression: instead of storing
the RGB values for each pixel of an image, we store the weights of a neural
network overfitted to the image. Specifically, to encode an image, we fit it
with an MLP which maps pixel locations to RGB values. We then quantize and
store the weights of this MLP as a code for the image. To decode the image, we
simply evaluate the MLP at every pixel location. We found that this simple
approach outperforms JPEG at low bit-rates, even without entropy coding or
learning a distribution over weights. While our framework is not yet
competitive with state of the art compression methods, we show that it has
various attractive properties which could make it a viable alternative to other
neural data compression approaches.
- Abstract(参考訳): 画像の各画素のrgb値を格納する代わりに、画像に過剰に適合したニューラルネットワークの重みを格納する。
具体的には、イメージをエンコードするために、ピクセル位置をRGB値にマップするMLPと適合します。
次に、画像のコードとしてこのMLPの重みを定量化し、保存します。
画像をデコードするには、すべてのピクセル位置でMLPを評価するだけです。
この単純なアプローチは、エントロピーコーディングや重みよりも分布を学習することなく、JPEGを低ビットレートで上回ります。
我々のフレームワークはまだ最先端の圧縮手法と競合していないが、他のニューラルデータ圧縮手法の代替となるような、様々な魅力的な特性があることが示される。
関連論文リスト
- Transformer based Pluralistic Image Completion with Reduced Information Loss [72.92754600354199]
トランスフォーマーをベースとした手法は,近年,イメージインペイントにおいて大きな成功を収めている。
彼らは各ピクセルをトークンとみなし、情報損失の問題に悩まされる。
我々はPUTと呼ばれる新しいトランスフォーマーベースのフレームワークを提案する。
論文 参考訳(メタデータ) (2024-03-31T01:20:16Z) - Exploring the Limits of Semantic Image Compression at Micro-bits per
Pixel [8.518076792914039]
我々はOpenAIのGPT-4VとDALL-E3を使って画像圧縮のための品質圧縮フロンティアを探索する。
我々は、反復的なリフレクションプロセスを導入することで、セマンティック圧縮を100$mu$bpp(JPEGより1万ドル以上安い)まで低くします。
さらに、この100$mu$bppレベルは、標準的な画像解像度におけるセマンティック圧縮のソフトな制限を表すと仮定する。
論文 参考訳(メタデータ) (2024-02-21T05:14:30Z) - You Can Mask More For Extremely Low-Bitrate Image Compression [80.7692466922499]
近年,学習画像圧縮(lic)法は大きな進歩を遂げている。
licメソッドは、画像圧縮に不可欠な画像構造とテクスチャコンポーネントを明示的に探索することができない。
原画像の構造とテクスチャに基づいて可視パッチをサンプリングするDA-Maskを提案する。
極めて低ビットレート圧縮のために, lic と lic のエンドツーエンドを統一する最初のフレームワークである, 単純で効果的なマスク付き圧縮モデル (MCM) を提案する。
論文 参考訳(メタデータ) (2023-06-27T15:36:22Z) - GamutMLP: A Lightweight MLP for Color Loss Recovery [40.273821032576606]
GamutMLPは最適化に約2秒かかり、23KBのストレージしか必要としない。
色回復のためのアプローチの有効性を実証し、代替戦略と比較する。
この取り組みの一環として、トレーニングとテストのために2200個の広域/小域画像からなる新しい色域データセットを導入する。
論文 参考訳(メタデータ) (2023-04-23T20:26:11Z) - CoordFill: Efficient High-Resolution Image Inpainting via Parameterized
Coordinate Querying [52.91778151771145]
本稿では,近年の連続的暗黙表現の発達により,その限界を初めて破ろうとする。
実験の結果,提案手法はGTX 2080 Ti GPUを用いて2048$times$2048の画像をリアルタイムに処理できることがわかった。
論文 参考訳(メタデータ) (2023-03-15T11:13:51Z) - Hyperspectral Image Compression Using Implicit Neural Representation [1.4721615285883425]
本稿では,暗黙的ニューラル表現を用いたハイパースペクトル画像圧縮法を提案する。
提案手法はJPEG,JPEG2000,PCA-DCTよりも低速で圧縮できることを示す。
論文 参考訳(メタデータ) (2023-02-08T15:27:00Z) - SINCO: A Novel structural regularizer for image compression using
implicit neural representations [10.251120382395332]
Inlicit Neural representations (INR) は、画像圧縮のためのディープラーニング(DL)ベースのソリューションとして最近提案されている。
本稿では、画像圧縮のための新しいINR法として、INR圧縮(SINCO)の構造正則化を提案する。
論文 参考訳(メタデータ) (2022-10-26T18:35:54Z) - PS-NeRV: Patch-wise Stylized Neural Representations for Videos [13.14511356472246]
PS-NeRVは、動画をパッチと対応するパッチ座標の関数として表現する。
画像ワイド手法の利点を自然に受け継ぎ、高速な復号化速度で優れた復号化性能を実現する。
論文 参考訳(メタデータ) (2022-08-07T14:45:30Z) - RepMLP: Re-parameterizing Convolutions into Fully-connected Layers for
Image Recognition [123.59890802196797]
画像認識のための多層パーセプトロン型ニューラルネットワーク構築ブロックであるRepMLPを提案する。
トレーニング中にRepMLP内に畳み込み層を構築し,それをFCにマージして推論を行う。
従来のCNNにRepMLPを挿入することで、ImageNetでは1.8%の精度、顔認識では2.9%、FLOPの低いCityscapeでは2.3%のmIoUを改善します。
論文 参考訳(メタデータ) (2021-05-05T06:17:40Z) - Discernible Image Compression [124.08063151879173]
本稿では、外観と知覚の整合性の両方を追求し、圧縮画像を作成することを目的とする。
エンコーダ・デコーダ・フレームワークに基づいて,事前学習したCNNを用いて,オリジナル画像と圧縮画像の特徴を抽出する。
ベンチマーク実験により,提案手法を用いて圧縮した画像は,その後の視覚認識・検出モデルでもよく認識できることが示された。
論文 参考訳(メタデータ) (2020-02-17T07:35:08Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。