論文の概要: Learning a Deep Color Difference Metric for Photographic Images
- arxiv url: http://arxiv.org/abs/2303.14964v1
- Date: Mon, 27 Mar 2023 07:54:09 GMT
- ステータス: 処理完了
- システム内更新日: 2023-03-28 16:37:55.531066
- Title: Learning a Deep Color Difference Metric for Photographic Images
- Title(参考訳): 写真画像における深い色差測定値の学習
- Authors: Haoyu Chen, Zhihua Wang, Yang Yang, Qilin Sun, Kede Ma
- Abstract要約: 我々は、4つの望ましい特性を持つ写真画像の深度CDメトリクスを学習する。
写真画像間の正確なCDを計算し、主に色相が異なる。
特徴変換のためのマルチスケール自己回帰正規化フローを学習することで,これらの特性を一度に満たせることを示す。
- 参考スコア(独自算出の注目度): 36.66506502182684
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Most well-established and widely used color difference (CD) metrics are
handcrafted and subject-calibrated against uniformly colored patches, which do
not generalize well to photographic images characterized by natural scene
complexities. Constructing CD formulae for photographic images is still an
active research topic in imaging/illumination, vision science, and color
science communities. In this paper, we aim to learn a deep CD metric for
photographic images with four desirable properties. First, it well aligns with
the observations in vision science that color and form are linked inextricably
in visual cortical processing. Second, it is a proper metric in the
mathematical sense. Third, it computes accurate CDs between photographic
images, differing mainly in color appearances. Fourth, it is robust to mild
geometric distortions (e.g., translation or due to parallax), which are often
present in photographic images of the same scene captured by different digital
cameras. We show that all these properties can be satisfied at once by learning
a multi-scale autoregressive normalizing flow for feature transform, followed
by the Euclidean distance which is linearly proportional to the human
perceptual CD. Quantitative and qualitative experiments on the large-scale SPCD
dataset demonstrate the promise of the learned CD metric.
- Abstract(参考訳): 最もよく確立され広く使われている色差(cd)の指標は手作りで、均一に着色されたパッチに対して主観的に調整されており、自然の風景の複雑さを特徴とする写真画像にはあまり一般化していない。
写真画像のためのCD公式の構築は、画像や照明、視覚科学、色科学のコミュニティにおいて活発な研究課題である。
本稿では,4つの望ましい特性を持つ写真画像の深度CDメトリクスを学習することを目的とする。
第一に、視覚科学における観察とよく一致し、色と形は視覚皮質処理において不可分にリンクされている。
第二に、数学的な意味での適切な計量である。
第3に、写真画像間の正確なCDを計算し、主に色相が異なる。
第4に、異なるデジタルカメラで撮影された同じシーンの写真画像にしばしば現れる、穏やかな幾何学的歪み(例えば、翻訳やパララックスによる)に対して堅牢である。
特徴変換のためのマルチスケールの自己回帰正規化フローを学習し、続いて人間の知覚CDに線形に比例したユークリッド距離を学習することにより、これらの特性を一度に満たせることを示す。
大規模SPCDデータセットの定量的および定性的実験は、学習したCDメトリックの可能性を実証する。
関連論文リスト
- A Nerf-Based Color Consistency Method for Remote Sensing Images [0.5735035463793009]
暗黙の表現を用いて画像特徴を一緒に織り込み、次に特徴空間を再照らし、新しい視点で融合画像を生成する、多視点画像のためのNeRFに基づく色整合法を提案する。
実験結果から,本手法により生成した合成画像は,エッジにおける視覚効果とスムーズな色遷移に優れることがわかった。
論文 参考訳(メタデータ) (2024-11-08T13:26:07Z) - Multiscale Sliced Wasserstein Distances as Perceptual Color Difference Measures [34.8728594246521]
マルチスケールスライスされたワッサースタイン距離に基づく知覚CD測度について述べる。
実験結果から,写真画像のCD評価においてCD測定が好適であることが示唆された。
数学的な意味では測度として機能し、画像やビデオのカラー転送タスクの損失関数としてその可能性を示す。
論文 参考訳(メタデータ) (2024-07-14T12:48:16Z) - Curved Diffusion: A Generative Model With Optical Geometry Control [56.24220665691974]
最終シーンの外観に対する異なる光学系の影響は、しばしば見過ごされる。
本研究では,画像レンダリングに使用される特定のレンズとテキスト画像拡散モデルを密接に統合するフレームワークを提案する。
論文 参考訳(メタデータ) (2023-11-29T13:06:48Z) - 4D LUT: Learnable Context-Aware 4D Lookup Table for Image Enhancement [50.49396123016185]
学習可能なコンテキスト対応4次元ルックアップテーブル(4D LUT)を提案する。
写真コンテキストを適応的に学習することで、各画像内の異なる内容のコンテンツ依存的な拡張を実現する。
従来の3D LUT、すなわちRGBへのRGBマッピングと比較して、4D LUTは画像ごとに異なる内容の画素の色変換をより細かく制御できる。
論文 参考訳(メタデータ) (2022-09-05T04:00:57Z) - Deep Metric Color Embeddings for Splicing Localization in Severely
Degraded Images [10.091921099426294]
本研究では,画像に最適なスプライシング検出法を提案する。
我々は、照明色やカメラの白点推定に敏感な深度距離空間を学習するが、一方、対象色の変化には敏感である。
本評価では,強い圧縮とダウンサンプリングの対象となる画像に対して,提案手法の組込み空間が技量を上回り,その性能が向上することを示す。
論文 参考訳(メタデータ) (2022-06-21T21:28:40Z) - Measuring Perceptual Color Differences of Smartphone Photographs [55.9434603885868]
知覚CD評価のための最大の画像データセットをまとめた。
我々は、軽量ニューラルネットワークに基づいて、エンドツーエンドで学習可能なCD公式を構築するための最初の試みの1つである。
論文 参考訳(メタデータ) (2022-05-26T16:57:04Z) - Learning Enriched Illuminants for Cross and Single Sensor Color
Constancy [182.4997117953705]
ネットワークをトレーニングするためのクロスセンサ自己教師型トレーニングを提案する。
センサに依存しない方法で人工発光体をランダムにサンプリングすることでネットワークを訓練する。
実験により、我々のクロスセンサモデルとシングルセンサーモデルは、他の最先端手法よりも大きなマージンで優れていることが示された。
論文 参考訳(メタデータ) (2022-03-21T15:45:35Z) - Colour alignment for relative colour constancy via non-standard
references [11.92389176996629]
相対色濃度は、多くの科学的イメージング応用に必須の要件である。
カメラ画像形成をブラックボックスとみなすカラーアライメントモデルを提案する。
カラーアライメントは、カメラ応答校正、応答線形化、色マッチングという3段階のプロセスとして定式化される。
論文 参考訳(メタデータ) (2021-12-30T15:58:55Z) - Single-shot Hyperspectral-Depth Imaging with Learned Diffractive Optics [72.9038524082252]
単発単眼単眼ハイパースペクトル(HS-D)イメージング法を提案する。
本手法では, 回折光学素子 (DOE) を用いる。
DOE の学習を容易にするため,ベンチトップ HS-D イメージラーを構築することで,最初の HS-D データセットを提案する。
論文 参考訳(メタデータ) (2020-09-01T14:19:35Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。