論文の概要: CLEAR-IR: Clarity-Enhanced Active Reconstruction of Infrared Imagery
- arxiv url: http://arxiv.org/abs/2510.04883v1
- Date: Mon, 06 Oct 2025 15:04:56 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-10-07 16:52:59.92454
- Title: CLEAR-IR: Clarity-Enhanced Active Reconstruction of Infrared Imagery
- Title(参考訳): CLEAR-IR:赤外画像の明瞭度向上能動再構成
- Authors: Nathan Shankar, Pawel Ladosz, Hujun Yin,
- Abstract要約: 本稿では,赤外線ストリームを用いた暗黒環境におけるロバストなロボット認識を実現するための新しいアプローチを提案する。
オブジェクト検出、トラッキング、ローカライゼーションといったハイレベルなタスクを妨げるアクティブエミッターパターンに支配されている。
U-Netベースのアーキテクチャでは、エミッタの入力からクリーンなIR画像を再構成し、画像品質と下流ロボットの性能を改善する。
- 参考スコア(独自算出の注目度): 3.490087692799367
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: This paper presents a novel approach for enabling robust robotic perception in dark environments using infrared (IR) stream. IR stream is less susceptible to noise than RGB in low-light conditions. However, it is dominated by active emitter patterns that hinder high-level tasks such as object detection, tracking and localisation. To address this, a U-Net-based architecture is proposed that reconstructs clean IR images from emitter-populated input, improving both image quality and downstream robotic performance. This approach outperforms existing enhancement techniques and enables reliable operation of vision-driven robotic systems across illumination conditions from well-lit to extreme low-light scenes.
- Abstract(参考訳): 本稿では,赤外線ストリームを用いた暗黒環境におけるロバストなロボット認識を実現するための新しいアプローチを提案する。
IRストリームは低照度環境ではRGBよりもノイズの影響を受けにくい。
しかし、オブジェクト検出、トラッキング、ローカライゼーションといったハイレベルなタスクを妨げるアクティブエミッターパターンに支配されている。
そこで,U-Netをベースとしたアーキテクチャでは,クリーンなIR画像をエミッタの入力から再構成し,画像品質と下流ロボット性能を改善する。
このアプローチは既存のエンハンスメント技術より優れており、照明条件を照らして視覚駆動型ロボットシステムの信頼性の高い操作を可能にする。
関連論文リスト
- TIR-Diffusion: Diffusion-based Thermal Infrared Image Denoising via Latent and Wavelet Domain Optimization [11.970228442183476]
本稿では拡散型TIR画像復調フレームワークを提案する。
提案手法は、遅延空間と離散ウェーブレット変換(DWT)/二重ツリー複合ウェーブレット変換(DTCWT)の損失を組み合わせた新しい損失関数を用いてモデルを微調整する。
ベンチマークデータセットの実験は、最先端のデノナイジング手法と比較して、我々のアプローチの優れた性能を示している。
論文 参考訳(メタデータ) (2025-07-30T06:27:32Z) - DifIISR: A Diffusion Model with Gradient Guidance for Infrared Image Super-Resolution [32.53713932204663]
DifIISRは、視覚品質と知覚性能に最適化された赤外線画像超解像拡散モデルである。
我々は、視力を維持するために赤外線熱スペクトル分布制御を導入する。
下流の視覚課題に対する知覚的ガイダンスとして,様々な視覚基盤モデルを組み込んだ。
論文 参考訳(メタデータ) (2025-03-03T05:20:57Z) - Bringing RGB and IR Together: Hierarchical Multi-Modal Enhancement for Robust Transmission Line Detection [67.02804741856512]
高速かつ高精度なTL検出のために,RGBとIRデータを統合したHMMEN(Hierarchical Multi-Modal Enhancement Network)を提案する。
提案手法では,(1)階層的RGBおよびIR特徴写像を大まかに融合・拡張するMMEB,(2)デコーダ出力とIR特徴写像の不整合を変形可能な畳み込みを利用して補正するFAB,の2つの重要な構成要素を紹介する。
論文 参考訳(メタデータ) (2025-01-25T06:21:06Z) - Rethinking High-speed Image Reconstruction Framework with Spike Camera [48.627095354244204]
スパイクカメラは連続的なスパイクストリームを生成し、従来のRGBカメラよりも低帯域幅でダイナミックレンジの高速シーンをキャプチャする。
従来のトレーニングパラダイムを超える新しいスパイク・ツー・イメージ再構築フレームワークであるSpikeCLIPを導入する。
実世界の低照度データセットに対する実験により、SpikeCLIPはテクスチャの詳細と回復した画像の輝度バランスを大幅に向上することが示された。
論文 参考訳(メタデータ) (2025-01-08T13:00:17Z) - Contourlet Refinement Gate Framework for Thermal Spectrum Distribution Regularized Infrared Image Super-Resolution [54.293362972473595]
画像超解像(SR)は、高解像度(HR)画像を低解像度(LR)画像から再構成することを目的としている。
SRタスクに対処する現在のアプローチは、RGB画像の特徴を抽出するか、同様の劣化パターンを仮定するものである。
スペクトル分布の忠実さを保ちつつ、赤外線変調特性を復元するコントゥーレット改質ゲートフレームワークを提案する。
論文 参考訳(メタデータ) (2024-11-19T14:24:03Z) - Near-Infrared and Low-Rank Adaptation of Vision Transformers in Remote Sensing [3.2088888904556123]
近赤外反射率(NIR)を測定するマルチスペクトルセンサを用いて植物の健康状態を動的に監視できる
このような可能性にもかかわらず、高解像度のNIR画像の取得と注釈付けは、ディープニューラルネットワークのトレーニングにおいて重要な課題となっている。
本研究では、RGB領域で事前訓練された視覚変換器(ViT)バックボーンの利点について検討し、NIR領域の下流タスクに対する低ランク適応について検討した。
論文 参考訳(メタデータ) (2024-05-28T07:24:07Z) - Thermal-NeRF: Neural Radiance Fields from an Infrared Camera [29.58060552299745]
本研究では,IR画像のみからNeRFの形でボリュームシーン表現を推定する最初の方法であるTherial-NeRFを紹介する。
本研究では,既存の方法よりも優れた品質が得られることを示すため,広範囲な実験を行った。
論文 参考訳(メタデータ) (2024-03-15T14:27:15Z) - Diffusion in the Dark: A Diffusion Model for Low-Light Text Recognition [78.50328335703914]
ディフュージョン・イン・ザ・ダーク (Diffusion in the Dark, DiD) は、テキスト認識のための低照度画像再構成のための拡散モデルである。
実画像上での低照度テキスト認識において,Digital DiDがSOTAの低照度手法より優れていることを示す。
論文 参考訳(メタデータ) (2023-03-07T23:52:51Z) - Seeing Through The Noisy Dark: Toward Real-world Low-Light Image
Enhancement and Denoising [125.56062454927755]
現実の低照度環境は通常、光やハードウェアの限界が不足しているため、視界が低く、騒音が重い。
我々は、RLED-Net(Real-world Low-light Enhancement & Denoising Network)と呼ばれる新しいエンドツーエンド手法を提案する。
論文 参考訳(メタデータ) (2022-10-02T14:57:23Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。