論文の概要: Fieldscale: Locality-Aware Field-based Adaptive Rescaling for Thermal Infrared Image
- arxiv url: http://arxiv.org/abs/2405.15395v1
- Date: Fri, 24 May 2024 09:49:52 GMT
- ステータス: 処理完了
- システム内更新日: 2024-05-27 15:01:48.417285
- Title: Fieldscale: Locality-Aware Field-based Adaptive Rescaling for Thermal Infrared Image
- Title(参考訳): フィールドスケール:熱赤外画像の局所性を考慮した適応的再スケーリング
- Authors: Hyeonjae Gil, Myung-Hwan Jeon, Ayoung Kim,
- Abstract要約: 本研究では、局所性を考慮した2Dフィールドに基づく再スケーリングであるFieldscaleを提案する。
各領域の画素ゲインを適応的に決定し、空間的に一貫した8ビットの再スケール画像を生成する。
- 参考スコア(独自算出の注目度): 11.970228442183476
- License: http://creativecommons.org/licenses/by-nc-nd/4.0/
- Abstract: Thermal infrared (TIR) cameras are emerging as promising sensors in safety-related fields due to their robustness against external illumination. However, RAW TIR image has 14 bits of pixel depth and needs to be rescaled into 8 bits for general applications. Previous works utilize a global 1D look-up table to compute pixel-wise gain solely based on its intensity, which degrades image quality by failing to consider the local nature of the heat. We propose Fieldscale, a rescaling based on locality-aware 2D fields where both the intensity value and spatial context of each pixel within an image are embedded. It can adaptively determine the pixel gain for each region and produce spatially consistent 8-bit rescaled images with minimal information loss and high visibility. Consistent performance improvement on image quality assessment and two other downstream tasks support the effectiveness and usability of Fieldscale. All the codes are publicly opened to facilitate research advancements in this field. https://github.com/hyeonjaegil/fieldscale
- Abstract(参考訳): 熱赤外(TIR)カメラは、外部照明に対する堅牢性から、安全関連分野において有望なセンサーとして出現している。
しかし、RAW TIR画像は14ビットの画素深度を持ち、一般的な用途では8ビットに再スケールする必要がある。
これまでの作業では、グローバルな1Dルックアップテーブルを使用して、その強度のみに基づいてピクセル単位のゲインを計算することで、熱の局所的な性質を考慮せずに画質を劣化させる。
本研究では、画像内の各画素の強度値と空間コンテキストの両方を埋め込んだ局所性認識2Dフィールドに基づく再スケーリングであるFieldscaleを提案する。
各領域の画素ゲインを適応的に決定し、空間的に一貫した8ビットのリスケール画像を最小限の情報損失と高可視性で生成することができる。
画像品質評価と他の2つの下流タスクにおける一貫性のある性能改善は、Fieldscaleの有効性とユーザビリティをサポートする。
この分野での研究の進展を促進するために、すべてのコードが公開されています。
https://github.com/hyeonjaegil/fieldscale
関連論文リスト
- United Domain Cognition Network for Salient Object Detection in Optical Remote Sensing Images [21.76732661032257]
周波数領域と空間領域のグローバルローカル情報を共同で探索する新しい統一ドメイン認知ネットワーク(UDCNet)を提案する。
実験結果から提案したUDCNetが24種類の最先端モデルよりも優れていることが示された。
論文 参考訳(メタデータ) (2024-11-11T04:12:27Z) - Diffusion-based RGB-D Semantic Segmentation with Deformable Attention Transformer [10.982521876026281]
本稿では,RGB-Dセマンティックセグメンテーション問題に対処する拡散型フレームワークを提案する。
本研究では,デフォルマブルアテンション変換器をエンコーダとして利用し,奥行き画像から特徴を抽出することにより,デフォルマブルアテンション変換器の特性を効果的に把握できることを実証する。
論文 参考訳(メタデータ) (2024-09-23T15:23:01Z) - Learning deep illumination-robust features from multispectral filter array images [0.5439020425819]
本稿では, 原画像から直接, 識別的・照明的特徴を学習するための独自のアプローチを提案する。
MS画像分類実験により,本手法は手工芸法と近年の深層学習法の両方に優れることがわかった。
論文 参考訳(メタデータ) (2024-07-22T08:35:41Z) - Event Camera Demosaicing via Swin Transformer and Pixel-focus Loss [17.422153237516767]
RAW領域処理における画素値の欠落を解消するための,Swin-Transformerベースのバックボーンと画素焦点損失関数を提案する。
提案手法は,マルチスケール処理とスペース・ツー・ディープス技術を利用して,効率の確保と計算複雑性の低減を図る。
論文 参考訳(メタデータ) (2024-04-03T13:30:56Z) - Learning Heavily-Degraded Prior for Underwater Object Detection [59.5084433933765]
本稿では、検出器フレンドリーな画像から、転送可能な事前知識を求める。
これは、検出器フレンドリー(DFUI)と水中画像の高度に劣化した領域が、特徴分布のギャップがあることを統計的に観察したものである。
高速かつパラメータの少ない本手法は変圧器型検出器よりも優れた性能を保っている。
論文 参考訳(メタデータ) (2023-08-24T12:32:46Z) - Joint tone mapping and denoising of thermal infrared images via
multi-scale Retinex and multi-task learning [6.469120003158514]
16bppの熱赤外画像のトーンマッピングアルゴリズムについて検討した。
最適化されたマルチスケールRetinexアルゴリズムは、人気のあるU-Netアーキテクチャに基づくディープラーニングアプローチで近似される。
トーンマッピング後の画像の残音は、自己教師付きディープラーニングアプローチを用いて暗黙的に低減される。
論文 参考訳(メタデータ) (2023-05-01T07:14:32Z) - Accurate Image Restoration with Attention Retractable Transformer [50.05204240159985]
画像復元のためのアテンション・リトラクタブル・トランス (ART) を提案する。
ARTはネットワーク内の密集モジュールと疎開モジュールの両方を提示する。
画像超解像、デノナイジング、JPEG圧縮アーティファクト削減タスクについて広範な実験を行った。
論文 参考訳(メタデータ) (2022-10-04T07:35:01Z) - Illumination Adaptive Transformer [66.50045722358503]
軽量高速照明適応変換器(IAT)を提案する。
IATは、光変換パイプラインをローカルおよびグローバルISPコンポーネントに分解する。
我々は、複数の実世界のデータセット上でIATを広範囲に評価した。
論文 参考訳(メタデータ) (2022-05-30T06:21:52Z) - Learning Neural Light Fields with Ray-Space Embedding Networks [51.88457861982689]
我々は、コンパクトで、光線に沿った統合放射率を直接予測する新しいニューラル光場表現を提案する。
提案手法は,Stanford Light Field データセットのような,高密度の前方向きデータセットの最先端品質を実現する。
論文 参考訳(メタデータ) (2021-12-02T18:59:51Z) - Spatially-Adaptive Image Restoration using Distortion-Guided Networks [51.89245800461537]
空間的に変化する劣化に苦しむ画像の復元のための学習ベースソリューションを提案する。
本研究では、歪み局所化情報を活用し、画像中の困難な領域に動的に適応するネットワーク設計であるSPAIRを提案する。
論文 参考訳(メタデータ) (2021-08-19T11:02:25Z) - Low Light Image Enhancement via Global and Local Context Modeling [164.85287246243956]
低照度画像強調のためのコンテキスト認識ディープネットワークを導入。
まず、全空間領域上の補完的な手がかりを見つけるために空間相関をモデル化するグローバルコンテキストモジュールを特徴とする。
第二に、比較的大きな受容フィールドで局所的なコンテキストをキャプチャする密な残留ブロックを導入する。
論文 参考訳(メタデータ) (2021-01-04T09:40:54Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。