論文の概要: Learning to Structure an Image with Few Colors
- arxiv url: http://arxiv.org/abs/2003.07848v2
- Date: Tue, 11 May 2021 07:41:13 GMT
- ステータス: 処理完了
- システム内更新日: 2022-12-22 21:41:35.680079
- Title: Learning to Structure an Image with Few Colors
- Title(参考訳): 少ない色で画像を構成することを学ぶ
- Authors: Yunzhong Hou, Liang Zheng, Stephen Gould
- Abstract要約: そこで,カラー量子化ネットワークであるColorCNNを提案する。
1ビットのカラースペース(すなわち2色)だけで、提案されたネットワークはCIFAR10データセット上で82.1%のトップ-1の精度を達成した。
アプリケーションの場合、PNGでエンコードされた場合、提案したカラー量子化は、極低ビットレート方式の他の画像圧縮方法よりも優れていることを示す。
- 参考スコア(独自算出の注目度): 59.34619548026885
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Color and structure are the two pillars that construct an image. Usually, the
structure is well expressed through a rich spectrum of colors, allowing objects
in an image to be recognized by neural networks. However, under extreme
limitations of color space, the structure tends to vanish, and thus a neural
network might fail to understand the image. Interested in exploring this
interplay between color and structure, we study the scientific problem of
identifying and preserving the most informative image structures while
constraining the color space to just a few bits, such that the resulting image
can be recognized with possibly high accuracy. To this end, we propose a color
quantization network, ColorCNN, which learns to structure the images from the
classification loss in an end-to-end manner. Given a color space size, ColorCNN
quantizes colors in the original image by generating a color index map and an
RGB color palette. Then, this color-quantized image is fed to a pre-trained
task network to evaluate its performance. In our experiment, with only a 1-bit
color space (i.e., two colors), the proposed network achieves 82.1% top-1
accuracy on the CIFAR10 dataset, outperforming traditional color quantization
methods by a large margin. For applications, when encoded with PNG, the
proposed color quantization shows superiority over other image compression
methods in the extremely low bit-rate regime. The code is available at:
https://github.com/hou-yz/color_distillation.
- Abstract(参考訳): 色と構造はイメージを構成する2つの柱である。
通常、この構造は豊かな色スペクトルを通してよく表現され、画像内の物体がニューラルネットワークによって認識される。
しかし、色空間の極端な制限の下では、構造は消失しがちであるため、ニューラルネットワークは画像を理解することができない可能性がある。
色と構造の間のこの相互作用を探求することに興味を持ち、色空間をほんの数ビットに制限しながら最も情報性の高い画像構造を特定し保存する科学的問題について研究し、その結果を高い精度で認識できるようにする。
そこで本研究では,カラー量子化ネットワークであるColorCNNを提案する。
色空間サイズが与えられると、colorcnnはカラーインデックスマップとrgbカラーパレットを生成して元の画像内の色を定量化する。
そして、このカラー量子化画像を予め訓練されたタスクネットワークに供給し、その性能を評価する。
この実験では、1ビットの色空間(すなわち2色)のみでcifar10データセット上で82.1%のtop-1精度を達成し、従来の色量子化法を大差で上回った。
アプリケーションの場合、PNGで符号化された色量子化は、極低ビットレート方式の他の画像圧縮方法よりも優れている。
コードはhttps://github.com/hou-yz/color_distillationで入手できる。
関連論文リスト
- Training Neural Networks on RAW and HDR Images for Restoration Tasks [59.41340420564656]
本研究は,3つの画像復元アプリケーション(デノイング,デブロアリング,シングルイメージ超解像)に対するアプローチを検証した。
その結果、ニューラルネットワークは、表示色空間で表現されるHDRおよびRAW画像において、かなりよく訓練されていることが示唆された。
トレーニング戦略へのこの小さな変更は、最大10~15dBのパフォーマンスを大幅に向上させることができます。
論文 参考訳(メタデータ) (2023-12-06T17:47:16Z) - DDColor: Towards Photo-Realistic Image Colorization via Dual Decoders [19.560271615736212]
DDColorは画像カラー化のためのデュアルデコーダを備えたエンドツーエンドの手法である。
我々のアプローチには、ピクセルデコーダとクエリベースのカラーデコーダが含まれる。
我々の2つのデコーダは、色とマルチスケールの意味表現の相関を確立するために協力する。
論文 参考訳(メタデータ) (2022-12-22T11:17:57Z) - Name Your Colour For the Task: Artificially Discover Colour Naming via
Colour Quantisation Transformer [62.75343115345667]
そこで本研究では,色空間を定量化しつつ,画像上での認識を維持しつつ,色空間を定量化する新しい色量子化変換器CQFormerを提案する。
人工色システムと人間の言語における基本色用語との一貫性のある進化パターンを観察する。
我々のカラー量子化法は、画像記憶を効果的に圧縮する効率的な量子化法も提供する。
論文 参考訳(メタデータ) (2022-12-07T03:39:18Z) - Learning to Structure an Image with Few Colors and Beyond [59.34619548026885]
カラー量子化ネットワークであるColorCNNを提案し、分類損失を最小限に抑えて、限られた色空間で画像を構成することを学習する。
複数の色空間サイズ構成をサポートするColorCNN+を導入し、大色空間における認識精度の低下と望ましくない視覚的忠実度に関する過去の問題に対処する。
潜在的な応用として、ネットワーク認識のための画像圧縮手法としてColorCNNが利用可能であることを示す。
論文 参考訳(メタデータ) (2022-08-17T17:59:15Z) - Influence of Color Spaces for Deep Learning Image Colorization [2.3705923859070217]
既存のカラー化手法は、RGB、YUV、Labなど、さまざまな色空間に依存している。
本章では,深層ニューラルネットワークのトレーニングによって得られる結果に対する影響について検討する。
RGB,YUV,Labの色空間と同一の深層ニューラルネットワークアーキテクチャを用いて得られた結果を比較した。
論文 参考訳(メタデータ) (2022-04-06T14:14:07Z) - TUCaN: Progressively Teaching Colourisation to Capsules [13.50327471049997]
TUCaN(Tiny UCapsNet)という新しいダウンサンプリングアップサンプリングアーキテクチャを提案する。
我々は,色を量化空間内のビンとして識別するピクセルごとの色分類タスクとして,この問題に対処する。
ネットワークをトレーニングするために、標準的なエンドツーエンド学習法とは対照的に、オブジェクトのコンテキストを抽出するプログレッシブラーニング方式を提案する。
論文 参考訳(メタデータ) (2021-06-29T08:44:15Z) - Semantic-driven Colorization [78.88814849391352]
最近の着色は、白黒画像の着色を学習しながら意味情報を暗黙的に予測する。
そこで本研究では,まず,人間の動作をシミュレートして,画像の理解を学習し,色づけする。
論文 参考訳(メタデータ) (2020-06-13T08:13:30Z) - Instance-aware Image Colorization [51.12040118366072]
本稿では,インスタンス認識のカラー化を実現する手法を提案する。
我々のネットワークアーキテクチャは、市販のオブジェクト検出器を利用して、収穫されたオブジェクト画像を取得する。
類似したネットワークを用いて、フルイメージの特徴を抽出し、融合モジュールを適用して最終色を予測する。
論文 参考訳(メタデータ) (2020-05-21T17:59:23Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。