論文の概要: SLAM in the Dark: Self-Supervised Learning of Pose, Depth and Loop-Closure from Thermal Images
- arxiv url: http://arxiv.org/abs/2502.18932v1
- Date: Wed, 26 Feb 2025 08:34:23 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-02-27 14:56:44.170070
- Title: SLAM in the Dark: Self-Supervised Learning of Pose, Depth and Loop-Closure from Thermal Images
- Title(参考訳): 暗黒におけるSLAM: 温熱画像からの詩、深さ、ループクローズの自己教師付き学習
- Authors: Yangfan Xu, Qu Hao, Lilian Zhang, Jun Mao, Xiaofeng He, Wenqi Wu, Changhao Chen,
- Abstract要約: 複雑な照明条件下での非正規な深層学習に基づく単分子熱SLAMシステムであるDarkSLAMを提案する。
提案手法は,視覚計測におけるECA(Efficient Channel Attention)機構と深度推定におけるSKA(Selective Kernel Attention)機構を取り入れたものである。
夜間の挑戦的な環境においても、正確な位置決めと3D高密度マッピングを提供する。
- 参考スコア(独自算出の注目度): 14.322021490470414
- License:
- Abstract: Visual SLAM is essential for mobile robots, drone navigation, and VR/AR, but traditional RGB camera systems struggle in low-light conditions, driving interest in thermal SLAM, which excels in such environments. However, thermal imaging faces challenges like low contrast, high noise, and limited large-scale annotated datasets, restricting the use of deep learning in outdoor scenarios. We present DarkSLAM, a noval deep learning-based monocular thermal SLAM system designed for large-scale localization and reconstruction in complex lighting conditions.Our approach incorporates the Efficient Channel Attention (ECA) mechanism in visual odometry and the Selective Kernel Attention (SKA) mechanism in depth estimation to enhance pose accuracy and mitigate thermal depth degradation. Additionally, the system includes thermal depth-based loop closure detection and pose optimization, ensuring robust performance in low-texture thermal scenes. Extensive outdoor experiments demonstrate that DarkSLAM significantly outperforms existing methods like SC-Sfm-Learner and Shin et al., delivering precise localization and 3D dense mapping even in challenging nighttime environments.
- Abstract(参考訳): 視覚SLAMは、移動ロボット、ドローンナビゲーション、VR/ARに欠かせないが、従来のRGBカメラシステムは低照度環境で苦戦し、そのような環境に優れた熱SLAMへの関心を喚起している。
しかし、サーマルイメージングは、低コントラスト、高ノイズ、大規模アノテートデータセットの制限といった課題に直面し、屋外シナリオでのディープラーニングの使用を制限する。
複雑な照明条件下での大規模ローカライズと再構成を目的とした,能動的深層学習に基づく単分子熱SLAMシステムであるDarkSLAMについて述べる。
さらに、このシステムは、熱深度に基づくループクロージャ検出とポーズ最適化を含み、低テクスチャ熱シーンにおけるロバストな性能を保証する。
大規模な屋外実験により、DarkSLAMはSC-Sfm-LearnerやShin et alといった既存の手法を著しく上回り、夜間の挑戦的環境においても正確な位置決めと3D高密度マッピングを提供することを示した。
関連論文リスト
- Adaptive Stereo Depth Estimation with Multi-Spectral Images Across All Lighting Conditions [58.88917836512819]
本稿では,立体深度推定を取り入れた新しいフレームワークを提案し,正確な幾何学的制約を強制する。
照明の劣化がステレオマッチングに与える影響を軽減するために,劣化マスキングを導入する。
提案手法は,Multi-Spectral Stereo(MS2)データセット上でのSOTA(State-of-the-art)性能を実現する。
論文 参考訳(メタデータ) (2024-11-06T03:30:46Z) - QueensCAMP: an RGB-D dataset for robust Visual SLAM [0.0]
本稿では,VSLAMシステムのロバスト性を評価するために設計された新しいRGB-Dデータセットを提案する。
データセットは、動的オブジェクト、動きのぼかし、様々な照明を備えた現実世界の屋内シーンで構成されている。
我々は、任意の画像にカメラ障害を注入するためのオープンソースのスクリプトを提供し、さらなるカスタマイズを可能にします。
論文 参考訳(メタデータ) (2024-10-16T12:58:08Z) - Low-Light Image Enhancement with Illumination-Aware Gamma Correction and
Complete Image Modelling Network [69.96295927854042]
低照度環境は通常、情報の少ない大規模な暗黒地帯に繋がる。
本稿では,ガンマ補正の有効性を深層ネットワークのモデリング能力と統合することを提案する。
指数関数演算は高い計算複雑性をもたらすので、Taylor Series を用いてガンマ補正を近似することを提案する。
論文 参考訳(メタデータ) (2023-08-16T08:46:51Z) - Spatiotemporally Consistent HDR Indoor Lighting Estimation [66.26786775252592]
本研究では,屋内照明推定問題を解決するための物理動機付きディープラーニングフレームワークを提案する。
深度マップを用いた1枚のLDR画像から,任意の画像位置における空間的に一貫した照明を予測できる。
我々のフレームワークは、最先端の単一画像やビデオベースの手法と比較して、高画質で光リアリスティック照明予測を実現する。
論文 参考訳(メタデータ) (2023-05-07T20:36:29Z) - Low-Light Hyperspectral Image Enhancement [90.84144276935464]
本研究は,暗黒領域に隠された空間スペクトル情報を明らかにすることを目的とした,低照度HSI強調タスクに焦点を当てた。
ラプラシアのピラミッドの分解と再構成に基づいて, エンド・ツー・エンドのデータ駆動型低照度HSIエンハンスメント(HSIE)手法を開発した。
定量的評価と視覚効果の両面でのHSIEの有効性と効果を実証した。
論文 参考訳(メタデータ) (2022-08-05T08:45:52Z) - INFWIDE: Image and Feature Space Wiener Deconvolution Network for
Non-blind Image Deblurring in Low-Light Conditions [32.35378513394865]
画像と特徴空間Wener deconvolution Network (INFWIDE) と呼ばれる新しい非盲点分解法を提案する。
INFWIDEは、画像空間におけるノイズを除去し、飽和領域を幻覚し、特徴空間におけるリングアーティファクトを抑制する。
合成データと実データを用いた実験は,提案手法の優れた性能を示す。
論文 参考訳(メタデータ) (2022-07-17T15:22:31Z) - Wild ToFu: Improving Range and Quality of Indirect Time-of-Flight Depth
with RGB Fusion in Challenging Environments [56.306567220448684]
本稿では,ノイズの多い生のI-ToF信号とRGB画像を用いた学習に基づくエンド・ツー・エンドの深度予測ネットワークを提案する。
最終深度マップでは,ベースラインアプローチと比較して40%以上のRMSE改善が見られた。
論文 参考訳(メタデータ) (2021-12-07T15:04:14Z) - Unsupervised Depth and Ego-motion Estimation for Monocular Thermal Video
using Multi-spectral Consistency Loss [76.77673212431152]
本研究では,全日深度とエゴモーション推定のための教師なし学習手法を提案する。
提案手法はマルチスペクトル整合性損失を利用してネットワークを補完的に監視する。
提案手法で訓練されたネットワークは、低照度およびゼロ照度条件下での単眼熱ビデオの深度とポーズを堅牢に推定する。
論文 参考訳(メタデータ) (2021-03-01T05:29:04Z) - Extreme Low-Light Imaging with Multi-granulation Cooperative Networks [18.438827277749525]
低照度画像は、信号対雑音比の低さ、複雑な画像内容、および極低照度の撮影シーンの多様性により、暗くノイズのように見えるため、低照度画像は困難である。
極低照度条件下での撮像品質向上のための多くの手法が提案されているが、良好な結果を得ることは困難である。
論文 参考訳(メタデータ) (2020-05-16T14:26:06Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。