論文の概要: Equalization and Brightness Mapping Modes of Color-to-Gray Projection
Operators
- arxiv url: http://arxiv.org/abs/2208.09950v1
- Date: Sun, 21 Aug 2022 19:23:06 GMT
- ステータス: 処理完了
- システム内更新日: 2022-08-23 14:10:05.105643
- Title: Equalization and Brightness Mapping Modes of Color-to-Gray Projection
Operators
- Title(参考訳): カラープロジェクション演算子の等化と輝度マッピングモード
- Authors: Diego Frias
- Abstract要約: カラーRGB画像のグレースケールへの変換は、3色チャネルを1つに投影するのに使用される数学的演算子を特徴付ける。
EQモードの3つのクラスとBMモードの2つのクラスが線形演算子で発見され、6クラス分類が定義された。
その結果、2つのBMモードのクラスのうちの1つを評価するのに、色と粒の変換の質を評価するために使われている現在の指標のほとんどが、人間のチームによって選択された理想的な演算子は、他のクラスに属していることがわかった。
- 参考スコア(独自算出の注目度): 0.0
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: In this article, the conversion of color RGB images to grayscale is covered
by characterizing the mathematical operators used to project 3 color channels
to a single one. Based on the fact that most operators assign each of the
$256^3$ colors a single gray level, ranging from 0 to 255, they are clustering
algorithms that distribute the color population into 256 clusters of increasing
brightness. To visualize the way operators work the sizes of the clusters and
the average brightness of each cluster are plotted. The equalization mode (EQ)
introduced in this work focuses on cluster sizes, while the brightness mapping
(BM) mode describes the CIE L* luminance distribution per cluster. Three
classes of EQ modes and two classes of BM modes were found in linear operators,
defining a 6-class taxonomy. The theoretical/methodological framework
introduced was applied in a case study considering the equal-weights uniform
operator, the NTSC standard operator, and an operator chosen as ideal to
lighten the faces of black people to improve facial recognition in current
biased classifiers. It was found that most current metrics used to assess the
quality of color-to-gray conversions better assess one of the two BM mode
classes, but the ideal operator chosen by a human team belongs to the other
class. Therefore, this cautions against using these general metrics for
specific purpose color-to-gray conversions. It should be noted that eventual
applications of this framework to non-linear operators can give rise to new
classes of EQ and BM modes. The main contribution of this article is to provide
a tool to better understand color to gray converters in general, even those
based on machine learning, within the current trend of better explainability of
models.
- Abstract(参考訳): 本稿では,3色チャネルを1つに投影する数学的演算子を特徴付けることにより,カラーRGB画像のグレースケールへの変換を行う。
ほとんどのオペレータが256^3$の色を1つのグレーレベル(0から255まで)に割り当てているという事実に基づいて、彼らは色人口を256クラスタに分散して輝度を増加させるクラスタリングアルゴリズムである。
オペレーターの働き方を視覚化し、クラスタのサイズと各クラスタの平均輝度をプロットする。
この研究で導入された等化モード(EQ)はクラスタサイズに焦点をあて、一方、輝度マッピング(BM)モードはクラスタごとのCIE L*輝度分布を記述する。
eqモードの3つのクラスとbmモードの2つのクラスが線形作用素に存在し、6-クラス分類を定義する。
理論的・方法論的枠組みは、一様一様演算子、NTSC標準演算子、および黒人の顔に光を当てて現在の偏見分類器の顔認識を改善するために選択された演算子を考慮したケーススタディで適用された。
色からグレーへの変換の質を評価するために用いられる現在のメトリクスのほとんどは、bmモードの2つのクラスのうちの1つをよりよく評価するが、人間のチームによって選択された理想的なオペレータは他のクラスに属することが判明した。
したがって、これらの一般的なメトリクスを特定の目的のカラー・ツー・グレイ変換に使用することに注意する。
このフレームワークの非線形演算子への最終的な応用は、新しいEQおよびBMモードのクラスを生み出すことに注意する必要がある。
この記事では、モデルの説明可能性の向上という現在のトレンドの中で、機械学習に基づくものであっても、グレーのコンバータに色をよりよく理解するためのツールを提供する。
関連論文リスト
- Learning Color Equivariant Representations [1.9594704501292781]
色変化に同値なグループ畳み込みニューラルネットワーク(GCNN)を導入する。
GCNNは、2次元と3次元の回転群からスケールのような半群への様々な幾何学的変換のために設計されている。
論文 参考訳(メタデータ) (2024-06-13T21:02:03Z) - Embracing Diversity: Interpretable Zero-shot classification beyond one vector per class [16.101460010750458]
クラス内の多様性を表現するために、ゼロショット分類は単一のベクトルを超えるべきであると論じる。
そこで本研究では,ゼロショット設定において,推論属性を用いたクラス内の多様性のエンコードと説明を行う手法を提案する。
提案手法は,大規模なデータセット群に対して,標準ゼロショット分類よりも一貫して優れることがわかった。
論文 参考訳(メタデータ) (2024-04-25T16:29:06Z) - CCC++: Optimized Color Classified Colorization with Segment Anything Model (SAM) Empowered Object Selective Color Harmonization [0.0]
カラー化問題を多項分類問題に定式化し、次に重み付き関数をクラスに適用する。
クラスを最適化するために、カラークラス変換のために異なるビンサイズで実験する。
カラークラスアクティベーション比(CCAR)とTrue Activation比(TAR)の2つの新しいカラー画像評価指標を提案する。
論文 参考訳(メタデータ) (2024-03-18T05:58:13Z) - Superpixel Graph Contrastive Clustering with Semantic-Invariant
Augmentations for Hyperspectral Images [64.72242126879503]
ハイパースペクトル画像(HSI)クラスタリングは重要な課題だが難しい課題である。
まず3次元と2次元のハイブリッド畳み込みニューラルネットワークを用いてHSIの高次空間およびスペクトルの特徴を抽出する。
次に,超画素グラフの対比クラスタリングモデルを設計し,識別的超画素表現を学習する。
論文 参考訳(メタデータ) (2024-03-04T07:40:55Z) - CCC: Color Classified Colorization [0.0]
カラー化問題を多項分類問題に定式化し、次に重み付き関数をクラスに適用する。
カラー値をカラークラスに変換するための式セットを提案し,その逆も提案する。
提案したモデルと5つの異なるデータセットを用いた最先端モデルを比較した。
論文 参考訳(メタデータ) (2024-03-03T11:00:15Z) - Class Gradient Projection For Continual Learning [99.105266615448]
破滅的な忘れは継続的学習(CL)における最も重要な課題の1つです。
タスクではなく個々のクラスから勾配部分空間を計算するクラスグラディエント・プロジェクション(CGP)を提案する。
論文 参考訳(メタデータ) (2023-11-25T02:45:56Z) - An Explainable Model-Agnostic Algorithm for CNN-based Biometrics
Verification [55.28171619580959]
本稿では,生体認証環境下でのLIME(Local Interpretable Model-Agnostic Explanations)AI手法の適用について述べる。
論文 参考訳(メタデータ) (2023-07-25T11:51:14Z) - Unicom: Universal and Compact Representation Learning for Image
Retrieval [65.96296089560421]
大規模LAION400Mを,CLIPモデルにより抽出された共同テキストと視覚的特徴に基づいて,100万の擬似クラスにクラスタリングする。
このような矛盾を緩和するために、我々は、マージンベースのソフトマックス損失を構築するために、ランダムにクラス間の部分的なプロトタイプを選択する。
提案手法は,複数のベンチマークにおいて,教師なし,教師なしの画像検索手法よりも優れていた。
論文 参考訳(メタデータ) (2023-04-12T14:25:52Z) - Neural Color Operators for Sequential Image Retouching [62.99812889713773]
本稿では,新たに導入したトレーニング可能なニューラルカラー演算子のシーケンスとして,リタッチ処理をモデル化して,新しい画像リタッチ手法を提案する。
ニューラルカラー演算子は、従来のカラー演算子の振舞いを模倣し、その強度をスカラーで制御しながらピクセルワイズな色変換を学習する。
定量的な測定と視覚的品質の両面で,SOTA法と比較して常に最良の結果が得られている。
論文 参考訳(メタデータ) (2022-07-17T05:33:19Z) - "Just Drive": Colour Bias Mitigation for Semantic Segmentation in the
Context of Urban Driving [8.147652597876862]
畳み込みニューラルネットワークは、幾何学よりも色やテクスチャに頼っていることが示されている。
本稿では,都会の運転シーンにおけるセマンティックセグメンテーションモデルによって生じるバイアスを,反復的に訓練された未学習アルゴリズムを用いて緩和する。
論文 参考訳(メタデータ) (2021-12-02T10:56:19Z) - Learning and Evaluating Representations for Deep One-class
Classification [59.095144932794646]
ディープワンクラス分類のための2段階フレームワークを提案する。
まず,一級データから自己教師付き表現を学習し,学習した表現に基づいて一級分類器を構築する。
実験では、視覚領域の1クラス分類ベンチマークで最先端の性能を示す。
論文 参考訳(メタデータ) (2020-11-04T23:33:41Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。