論文の概要: Image color consistency in datasets: the Smooth-TPS3D method
- arxiv url: http://arxiv.org/abs/2409.05159v1
- Date: Sun, 8 Sep 2024 16:58:56 GMT
- ステータス: 処理完了
- システム内更新日: 2024-09-10 17:08:26.856857
- Title: Image color consistency in datasets: the Smooth-TPS3D method
- Title(参考訳): データセットにおける画像色整合性:Smooth-TPS3D法
- Authors: Ismael Benito-Altamirano, David Martínez-Carpena, Hanna Lizarzaburu-Aguilar, Carles Ventura, Cristian Fàbrega, Joan Daniel Prades,
- Abstract要約: カラーチャート(例えば、Macbeth ColorChecker)や他の機械可読パターンと組み合わせて使用する3次元薄膜スプライン(TPS3D)色補正法を提案する。
Smooth-TPS法は元の方法よりも20%高速であることを示す。
- 参考スコア(独自算出の注目度): 0.9126120966154119
- License: http://creativecommons.org/licenses/by-sa/4.0/
- Abstract: Image color consistency is the key problem in digital imaging consistency when creating datasets. Here, we propose an improved 3D Thin-Plate Splines (TPS3D) color correction method to be used, in conjunction with color charts (i.e. Macbeth ColorChecker) or other machine-readable patterns, to achieve image consistency by post-processing. Also, we benchmark our method against its former implementation and the alternative methods reported to date with an augmented dataset based on the Gehler's ColorChecker dataset. Benchmark includes how corrected images resemble the ground-truth images and how fast these implementations are. Results demonstrate that the TPS3D is the best candidate to achieve image consistency. Furthermore, our Smooth-TPS3D method shows equivalent results compared to the original method and reduced the 11-15% of ill-conditioned scenarios which the previous method failed to less than 1%. Moreover, we demonstrate that the Smooth-TPS method is 20% faster than the original method. Finally, we discuss how different methods offer different compromises between quality, correction accuracy and computational load.
- Abstract(参考訳): 画像の色の一貫性は、データセットを作成する際のデジタル画像の一貫性の鍵となる問題である。
そこで本研究では,カラーチャート(Macbeth ColorChecker)や他の機械可読パターンと組み合わせて,改良された3次元薄膜スプライン(TPS3D)色補正法を提案し,後処理により画像の整合性を実現する。
また,提案手法を従来の実装と比較し,GehlerのColorCheckerデータセットに基づく拡張データセットを用いて,従来報告されていた代替手法と比較した。
ベンチマークには、修正済みのイメージが地味なイメージにどのように似ているか、そしてこれらの実装がどれだけ速くなっているかが含まれている。
その結果,TPS3Dは画像の整合性を達成するのに最適な候補であることがわかった。
さらに,Smooth-TPS3D法は,従来手法と同等の結果を示し,前手法が1%未満の未条件シナリオの11~15%を削減した。
また,Smooth-TPS法は従来の手法よりも20%高速であることを示す。
最後に,異なる手法が品質,補正精度,計算負荷の相違にどのように影響するかを論じる。
関連論文リスト
- Sketch3D: Style-Consistent Guidance for Sketch-to-3D Generation [55.73399465968594]
本稿では,テキスト記述と一致する色と入力スケッチに整合した形状のリアルな3Dアセットを生成するための,新しい生成パラダイムSketch3Dを提案する。
3つの戦略は、3次元ガウスの最適化、すなわち分布伝達機構による構造最適化、直感的なMSE損失による色最適化、CLIPに基づく幾何学的類似性損失によるスケッチ類似性最適化である。
論文 参考訳(メタデータ) (2024-04-02T11:03:24Z) - Consistent Mesh Diffusion [8.318075237885857]
UVパラメータ化による3Dメッシュを前提として,テキストプロンプトからテクスチャを生成する新しいアプローチを提案する。
当社のアプローチは、30メッシュを含むデータセット上で、メッシュ毎に約5分を要することを実証しています。
論文 参考訳(メタデータ) (2023-12-01T23:25:14Z) - Improving Video Colorization by Test-Time Tuning [79.67548221384202]
テスト時間チューニングによる映像の着色性向上を目的とした,効果的な手法を提案する。
提案手法は,テスト中に追加のトレーニングサンプルを構築するための基準を利用して,PSNRにおいて平均13dBの性能向上を実現している。
論文 参考訳(メタデータ) (2023-06-25T05:36:40Z) - Inter-Instance Similarity Modeling for Contrastive Learning [22.56316444504397]
視覚変換器(ViT)におけるコントラスト学習のための新しい画像混合手法であるPatchMixを提案する。
既存のサンプルミキシング手法と比較して、我々のPatchMixは2つ以上の画像を柔軟に効率的に混ぜることができる。
提案手法は,ImageNet-1KとCIFARの両方のデータセットにおいて,従来の最先端技術よりも大幅に優れていた。
論文 参考訳(メタデータ) (2023-06-21T13:03:47Z) - $PC^2$: Projection-Conditioned Point Cloud Diffusion for Single-Image 3D
Reconstruction [97.06927852165464]
単一のRGB画像から物体の3次元形状を再構築することは、コンピュータビジョンにおける長年の課題である。
条件付き偏光拡散プロセスによりスパース点雲を生成する単一像3次元再構成法を提案する。
論文 参考訳(メタデータ) (2023-02-21T13:37:07Z) - ParaColorizer: Realistic Image Colorization using Parallel Generative
Networks [1.7778609937758327]
グレースケール画像のカラー化は、情報復元のためのAIの魅力的な応用である。
並列なGANベースのカラー化フレームワークを提案する。
マルチモーダル問題を評価するために一般的に使用される非知覚的評価指標の欠点を示す。
論文 参考訳(メタデータ) (2022-08-17T13:49:44Z) - SSH: A Self-Supervised Framework for Image Harmonization [97.16345684998788]
我々は、編集せずに「自由」な自然画像だけで訓練できる新しい自己改善調和フレームワーク(SSH)を提案する。
提案したSSHは,基準指標,視覚的品質,主観的ユーザスタディにおいて,従来の最先端手法よりも優れていた。
論文 参考訳(メタデータ) (2021-08-15T19:51:33Z) - Refer-it-in-RGBD: A Bottom-up Approach for 3D Visual Grounding in RGBD
Images [69.5662419067878]
RGBD画像における接地参照表現は新たな分野である。
本稿では,参照する物体が閉塞により部分的にスキャンされる場合が多い単視点rgbd画像における3次元視覚グランド化の新たな課題を提案する。
提案手法はまず,RGBD画像内の関連領域をローカライズするヒートマップを生成するために,下層の言語と視覚的特徴を融合させる。
次に、ヒートマップに基づく適応的特徴学習を行い、他のビジオ言語融合とオブジェクトレベルのマッチングを行い、最後に参照したオブジェクトを接地する。
論文 参考訳(メタデータ) (2021-03-14T11:18:50Z) - Consistent Mesh Colors for Multi-View Reconstructed 3D Scenes [13.531166759820854]
カラーキャリブレーションなしで一貫したテクスチャマップを作成するためには,複数のビューを集約する手法が不可欠であることがわかった。
ビュー面とフェースビューの相互相関から事前に色を計算し、最適なパーフェースカラーを特定します。
論文 参考訳(メタデータ) (2021-01-26T11:59:23Z) - Fast, Self Supervised, Fully Convolutional Color Normalization of H&E
Stained Images [3.1329883315045106]
色の変化は、病理組織学における自動診断システムのためのディープラーニングベースのソリューションの展開に問題を引き起こす。
本稿では,自己教師付きトレーニングと推論において高速な色正規化手法を提案する。
本手法は,軽量な完全畳み込みニューラルネットワークをベースとして,深層学習に基づくパイプラインに前処理ブロックとして容易に取り付けることができる。
論文 参考訳(メタデータ) (2020-11-30T17:05:58Z) - Geometric Correspondence Fields: Learned Differentiable Rendering for 3D
Pose Refinement in the Wild [96.09941542587865]
野生の任意のカテゴリのオブジェクトに対する微分可能レンダリングに基づく新しい3次元ポーズ精細化手法を提案する。
このようにして、3DモデルとRGB画像のオブジェクトを正確に整列し、3Dポーズ推定を大幅に改善する。
我々は、Pix3Dデータセットの挑戦に対するアプローチを評価し、複数のメトリクスにおける最先端の精錬手法と比較して、最大55%の改善を実現した。
論文 参考訳(メタデータ) (2020-07-17T12:34:38Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。