論文の概要: CLIP-Optimized Multimodal Image Enhancement via ISP-CNN Fusion for Coal Mine IoVT under Uneven Illumination
- arxiv url: http://arxiv.org/abs/2502.19450v1
- Date: Wed, 26 Feb 2025 05:09:40 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-02-28 14:57:56.585399
- Title: CLIP-Optimized Multimodal Image Enhancement via ISP-CNN Fusion for Coal Mine IoVT under Uneven Illumination
- Title(参考訳): 均一照明下での石炭鉱山IoVT用ISP-CNN核融合によるCLIP最適化マルチモーダル画像強調
- Authors: Shuai Wang, Shihao Zhang, Jiaqi Wu, Zijian Tian, Wei Chen, Tongzhu Jin, Miaomiao Xue, Zehua Wang, Fei Richard Yu, Victor C. M. Leung,
- Abstract要約: 地下環境における低照度および不均一輝度は、画像品質を著しく低下させる。
本稿では,不均一照明に最適化されたISP-CNN融合アーキテクチャを用いて,炭鉱IoVTに適したマルチモーダル画像強調手法を提案する。
- 参考スコア(独自算出の注目度): 40.70282870053005
- License:
- Abstract: Clear monitoring images are crucial for the safe operation of coal mine Internet of Video Things (IoVT) systems. However, low illumination and uneven brightness in underground environments significantly degrade image quality, posing challenges for enhancement methods that often rely on difficult-to-obtain paired reference images. Additionally, there is a trade-off between enhancement performance and computational efficiency on edge devices within IoVT systems.To address these issues, we propose a multimodal image enhancement method tailored for coal mine IoVT, utilizing an ISP-CNN fusion architecture optimized for uneven illumination. This two-stage strategy combines global enhancement with detail optimization, effectively improving image quality, especially in poorly lit areas. A CLIP-based multimodal iterative optimization allows for unsupervised training of the enhancement algorithm. By integrating traditional image signal processing (ISP) with convolutional neural networks (CNN), our approach reduces computational complexity while maintaining high performance, making it suitable for real-time deployment on edge devices.Experimental results demonstrate that our method effectively mitigates uneven brightness and enhances key image quality metrics, with PSNR improvements of 2.9%-4.9%, SSIM by 4.3%-11.4%, and VIF by 4.9%-17.8% compared to seven state-of-the-art algorithms. Simulated coal mine monitoring scenarios validate our method's ability to balance performance and computational demands, facilitating real-time enhancement and supporting safer mining operations.
- Abstract(参考訳): クリーンな監視画像は、石炭採掘用インターネット・オブ・ビデオ・モノ(IoVT)システムの安全な運用に不可欠である。
しかし、地下環境における照明の低さと明るさの不均一さは、画像の品質を著しく低下させ、しばしば困難なペア化参照画像に依存する拡張手法の課題を提起している。
さらに、IoVTシステム内のエッジデバイス上での性能向上と計算効率のトレードオフがあり、不均一な照明に最適化されたISP-CNN融合アーキテクチャを用いて、炭鉱IoVTに適したマルチモーダル画像強調手法を提案する。
この2段階の戦略は、特に低照度領域において、グローバルエンハンスメントとディテール最適化を組み合わせ、画像品質を効果的に改善する。
CLIPベースのマルチモーダル反復最適化は、拡張アルゴリズムの教師なしトレーニングを可能にする。
従来の画像信号処理(ISP)を畳み込みニューラルネットワーク(CNN)と統合することにより,高性能を維持しながら計算複雑性を低減し,エッジデバイスへのリアルタイム展開に適していることを示す実験結果から,PSNRが2.9%-4.9%,SSIMが4.3%-11.4%,VIFが4.9%-17.8%向上した。
シミュレートされた炭鉱モニタリングシナリオは、我々の方法がパフォーマンスと計算要求のバランスをとる能力を検証し、リアルタイムの強化を促進し、より安全な鉱業活動を支援する。
関連論文リスト
- Learning Efficient and Effective Trajectories for Differential Equation-based Image Restoration [59.744840744491945]
我々は, この手法の軌道最適化を再構築し, 復元品質と効率の両立に焦点をあてる。
本稿では,複雑な経路を適応可能なサイズで複数の管理可能なステップに合理化するためのコスト対応トラジェクトリー蒸留法を提案する。
実験では提案手法の有意な優位性を示し, 最先端手法よりも最大2.1dBのPSNR改善を実現した。
論文 参考訳(メタデータ) (2024-10-07T07:46:08Z) - Rethinking the Atmospheric Scattering-driven Attention via Channel and Gamma Correction Priors for Low-Light Image Enhancement [0.0]
本稿では,Channel-Prior and Gamma-Estimation Network (CPGA-Net)の拡張版を紹介する。
CPGA-Net+は大気散乱モデルによって駆動される注意機構を組み込んでいる。
ガンマ補正を施したプラグインアテンションによるグローバル画像処理とローカル画像処理の両方に効果的に対処する。
論文 参考訳(メタデータ) (2024-09-09T01:50:01Z) - A Lightweight GAN-Based Image Fusion Algorithm for Visible and Infrared Images [4.473596922028091]
本稿では、可視光と赤外画像の融合に特化して設計された軽量画像融合アルゴリズムを提案する。
提案手法は,GAN (Generative Adversarial Network) において, Convolutional Block Attention Module を統合することでジェネレータを増強する。
M3FDデータセットを用いた実験により、提案アルゴリズムは、融合品質の点で類似した画像融合法より優れていることを示した。
論文 参考訳(メタデータ) (2024-09-07T18:04:39Z) - Unveiling Advanced Frequency Disentanglement Paradigm for Low-Light Image Enhancement [61.22119364400268]
周波数不整合最適化を改良した新しい低周波整合性手法を提案する。
注目すべき改善点は5つの人気のあるベンチマークで示されており、6つの最先端モデルで達成されたPSNRの7.68dBのゲインである。
提案手法は,88K余剰パラメータで効率を保ち,低照度画像強調の挑戦的な領域に新たな標準を設定する。
論文 参考訳(メタデータ) (2024-09-03T06:19:03Z) - A Non-Uniform Low-Light Image Enhancement Method with Multi-Scale
Attention Transformer and Luminance Consistency Loss [11.585269110131659]
低照度画像強調は、薄暗い環境で収集された画像の知覚を改善することを目的としている。
既存の方法では、識別された輝度情報を適応的に抽出することができず、露光過多や露光過多を容易に引き起こすことができる。
MSATrというマルチスケールアテンション変換器を提案し,光バランスの局所的・グローバル的特徴を十分に抽出し,視覚的品質を向上させる。
論文 参考訳(メタデータ) (2023-12-27T10:07:11Z) - Lightweight HDR Camera ISP for Robust Perception in Dynamic Illumination
Conditions via Fourier Adversarial Networks [35.532434169432776]
照明とノイズ除去の逐次的バランスをとる軽量な2段階画像強調アルゴリズムを提案する。
また、異なる照明条件下での一貫した画像強調のためのフーリエスペクトルベース対向フレームワーク(AFNet)を提案する。
また,定量的および定性的な評価に基づいて,画像強調技術が共通認識タスクの性能に与える影響について検討した。
論文 参考訳(メタデータ) (2022-04-04T18:48:51Z) - Image-specific Convolutional Kernel Modulation for Single Image
Super-resolution [85.09413241502209]
本稿では,新しい画像特異的畳み込み変調カーネル(IKM)を提案する。
我々は、画像や特徴のグローバルな文脈情報を利用して、畳み込みカーネルを適応的に調整するための注意重みを生成する。
単一画像超解像実験により,提案手法は最先端手法よりも優れた性能を示した。
論文 参考訳(メタデータ) (2021-11-16T11:05:10Z) - Asymmetric CNN for image super-resolution [102.96131810686231]
深層畳み込みニューラルネットワーク(CNN)は、過去5年間で低レベルビジョンに広く適用されています。
画像超解像のための非対称ブロック(AB)、mem?ory拡張ブロック(MEB)、高周波数特徴強調ブロック(HFFEB)からなる非対称CNN(ACNet)を提案する。
我々のACNetは、ブラインドノイズの単一画像超解像(SISR)、ブラインドSISR、ブラインドSISRを効果的に処理できる。
論文 参考訳(メタデータ) (2021-03-25T07:10:46Z) - Efficient texture-aware multi-GAN for image inpainting [5.33024001730262]
近年のGAN (Generative Adversarial Network) のインペイント手法は顕著に改善されている。
本稿では,性能とレンダリング効率の両方を改善するマルチGANアーキテクチャを提案する。
論文 参考訳(メタデータ) (2020-09-30T14:58:03Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。