論文の概要: IA-CLAHE: Image-Adaptive Clip Limit Estimation for CLAHE
- arxiv url: http://arxiv.org/abs/2604.16010v1
- Date: Fri, 17 Apr 2026 12:33:45 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-04-20 22:00:19.912003
- Title: IA-CLAHE: Image-Adaptive Clip Limit Estimation for CLAHE
- Title(参考訳): IA-CLAHE:CLAHEにおける画像適応型クリップ限界推定
- Authors: Rikuto Otsuka, Yuho Shoji, Yuka Ogino, Takahiro Toizumi, Atsushi Ito,
- Abstract要約: 画像適応コントラスト制限適応ヒストグラム等化(IA-CLAHE)
従来のCLAHEは様々なコンピュータビジョンタスクの性能向上に広く利用されている。
IA-CLAHEは、入力画像からタイル回りのクリップ制限を適応的に推定することで、この制限に対処する。
- 参考スコア(独自算出の注目度): 2.5282283486446753
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: This paper proposes image-adaptive contrast limited adaptive histogram equalization (IA-CLAHE). Conventional CLAHE is widely used to boost the performance of various computer vision tasks and to improve visual quality for human perception in practical industrial applications. CLAHE applies contrast limited histogram equalization to each local region to enhance local contrast. However, CLAHE often leads to over-enhancement, because the contrast-limiting parameter clip limit is fixed regardless of the histogram distribution of each local region. Our IA-CLAHE addresses this limitation by adaptively estimating tile-wise clip limits from the input image. To achieve this, we train a lightweight clip limits estimator with a differentiable extension of CLAHE, enabling end-to-end optimization. Unlike prior learning-based CLAHE methods, IA-CLAHE does not require pre-searched ground-truth clip limits or task-specific datasets, because it learns to map input image histograms toward a domain-invariant uniform distribution, enabling zero-shot generalization across diverse conditions. Experimental results show that IA-CLAHE consistently improves recognition performance, while simultaneously enhancing visual quality for human perception, without requiring any task-specific training data.
- Abstract(参考訳): 本稿では,画像適応コントラスト限定適応ヒストグラム等化(IA-CLAHE)を提案する。
従来のCLAHEは、様々なコンピュータビジョンタスクの性能を高め、実用的な産業アプリケーションにおける人間の知覚の視覚的品質を向上させるために広く使われている。
CLAHEは、局所的なコントラストを高めるために、各局所領域にコントラスト制限ヒストグラム等化を適用している。
しかし、CLAHEは、各局所領域のヒストグラム分布によらず、コントラスト制限パラメータクリップ制限が固定されているため、しばしば過強調につながる。
我々のIA-CLAHEは、入力画像からタイル回りのクリップ制限を適応的に推定することで、この制限に対処する。
そこで我々は,CLAHEの拡張性のある軽量クリップリミット推定器を訓練し,エンドツーエンドの最適化を実現する。
従来の学習ベースのCLAHE法とは異なり、IA-CLAHEは、入力画像ヒストグラムを領域不変の均一分布にマッピングすることを学び、様々な条件でゼロショットの一般化を可能にするため、事前に調査された地平線クリップ制限やタスク固有のデータセットを必要としない。
実験の結果、IA-CLAHEは、タスク固有のトレーニングデータを必要としないと同時に、人間の知覚の視覚的品質を向上しながら、認識性能を一貫して向上することが示された。
関連論文リスト
- Dual-Modal Prompting for Sketch-Based Image Retrieval [76.12076969949062]
本稿では、適応的なプロンプト戦略を設計したデュアルモーダルCLIP(DP-CLIP)ネットワークを提案する。
ターゲットカテゴリとテキストカテゴリラベル内に一連の画像を用いて,カテゴリ適応型プロンプトトークンとチャネルスケールをそれぞれ構成する。
我々のDP-CLIPは、Sketchyデータセット上のAcc.@1において、最先端の微細ゼロショット法を7.3%向上させる。
論文 参考訳(メタデータ) (2024-04-29T13:43:49Z) - Make Continual Learning Stronger via C-Flat [12.569738684003923]
連続学習(CL)に適した平坦な損失景観を特徴とする連続平坦度(C-Flat)手法を提案する。
C-Flatは1行のコードだけで簡単に呼び出すことができ、任意のCLメソッドにプラグ&プレイできる。
論文 参考訳(メタデータ) (2024-04-01T08:18:38Z) - CLIP Brings Better Features to Visual Aesthetics Learners [14.351572852317558]
Image Aesthetics Assessment (IAA) は主観的性格と高価な手作業による課題である。
Contrastive Language-Image Pre-Training (CLIP) のような近年の大規模視覚言語モデルでは、様々な下流タスクに期待できる表現能力を示している。
本稿では,CLIPの強力な一般化能力を活用しつつ,軽量なIAAモデルを学習することを目的とした,2相CLIPに基づく半教師付き知識蒸留パラダイムを提案する。
論文 参考訳(メタデータ) (2023-07-28T16:00:21Z) - Condition-Invariant Semantic Segmentation [77.10045325743644]
我々は現在最先端のドメイン適応アーキテクチャ上で条件不変セマンティック(CISS)を実装している。
本手法は,通常の都市景観$to$ACDCベンチマークにおいて,2番目に高い性能を実現する。
CISSはBDD100K-nightやACDC-nightのようなトレーニング中に見えない領域によく一般化している。
論文 参考訳(メタデータ) (2023-05-27T03:05:07Z) - CLIPood: Generalizing CLIP to Out-of-Distributions [73.86353105017076]
対照的に、CLIP(Language-image Pre-training)モデルでは、印象的なゼロショット能力を示しているが、下流タスクにおけるCLIPのさらなる適応は、OODのパフォーマンスを好ましくない劣化させる。
ドメインシフトとオープンクラスの両方が見えないテストデータ上で発生する可能性があるOOD状況にCLIPモデルを適用するための微調整手法であるCLIPoodを提案する。
さまざまなOODシナリオによるさまざまなデータセットの実験は、CLIPoodが既存の一般化テクニックを一貫して上回っていることを示している。
論文 参考訳(メタデータ) (2023-02-02T04:27:54Z) - No Token Left Behind: Explainability-Aided Image Classification and
Generation [79.4957965474334]
ここでは、CLIPが入力のすべての関連する意味的部分に焦点を当てることを保証するために、損失項を追加する新しい説明可能性に基づくアプローチを提案する。
本手法は, 追加訓練や微調整を伴わずに, 認識率の向上を図っている。
論文 参考訳(メタデータ) (2022-04-11T07:16:39Z) - Adaptive Cross-Layer Attention for Image Restoration [10.795382525098917]
非局所的な注意プロセスは各レイヤの特徴を別々に扱うため、異なるレイヤ間の特徴の相関を欠くリスクがある。
本稿では,新しいアダプティブ・クロスレイア・アテンション(ACLA)モジュールを提案する。
1) 各層における非局所的注意のためのキーを適応的に選択すること,(2)ACLAモジュールの挿入位置を自動的に検索すること,の2つの適応設計を提案する。
論文 参考訳(メタデータ) (2022-03-04T22:16:18Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。