論文の概要: ThermalLoc: A Vision Transformer-Based Approach for Robust Thermal Camera Relocalization in Large-Scale Environments
- arxiv url: http://arxiv.org/abs/2506.18268v1
- Date: Mon, 23 Jun 2025 03:52:35 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-06-24 19:06:36.839886
- Title: ThermalLoc: A Vision Transformer-Based Approach for Robust Thermal Camera Relocalization in Large-Scale Environments
- Title(参考訳): ThermalLoc:大規模環境におけるロバスト熱カメラ再局在のための視覚変換器によるアプローチ
- Authors: Yu Liu, Yangtao Meng, Xianfei Pan, Jie Jiang, Changhao Chen,
- Abstract要約: 熱カメラは、熱放射によって環境データをキャプチャする。
従来の視覚的再局在法は熱画像に直接適用できない。
本研究では,熱画像再局在化のための新しいエンドツーエンド深層学習手法であるHeatherLocを紹介する。
- 参考スコア(独自算出の注目度): 11.322440891972901
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Thermal cameras capture environmental data through heat emission, a fundamentally different mechanism compared to visible light cameras, which rely on pinhole imaging. As a result, traditional visual relocalization methods designed for visible light images are not directly applicable to thermal images. Despite significant advancements in deep learning for camera relocalization, approaches specifically tailored for thermal camera-based relocalization remain underexplored. To address this gap, we introduce ThermalLoc, a novel end-to-end deep learning method for thermal image relocalization. ThermalLoc effectively extracts both local and global features from thermal images by integrating EfficientNet with Transformers, and performs absolute pose regression using two MLP networks. We evaluated ThermalLoc on both the publicly available thermal-odometry dataset and our own dataset. The results demonstrate that ThermalLoc outperforms existing representative methods employed for thermal camera relocalization, including AtLoc, MapNet, PoseNet, and RobustLoc, achieving superior accuracy and robustness.
- Abstract(参考訳): 熱カメラは、ピンホールイメージングに依存する可視光カメラと根本的に異なるメカニズムである熱放射によって環境データをキャプチャする。
その結果、可視光画像のために設計された従来の視覚的再局在法は、熱画像に直接適用されない。
カメラ再ローカライゼーションのためのディープラーニングの進歩にもかかわらず、特にサーマルカメラによる再ローカライゼーションに適したアプローチはいまだに探索されていない。
このギャップに対処するために、熱画像再局在のための新しいエンドツーエンド深層学習手法であるThermoLocを紹介する。
ThermalLocは、EfficientNetとTransformersを統合することで、熱画像から局所的特徴と大域的特徴の両方を効果的に抽出し、2つのMLPネットワークを用いて絶対的なポーズ回帰を行う。
利用可能なサーマルオロメトリデータセットと,我々のデータセットの両方を用いて,HeatherLocを評価した。
この結果から,AtLoc,MapNet,PoseNet,RobostLocなどのサーマルカメラ再ローカライゼーションにおいて,既存の代表的手法よりも優れ,精度とロバスト性に優れていたことが示唆された。
関連論文リスト
- RS-vHeat: Heat Conduction Guided Efficient Remote Sensing Foundation Model [59.37279559684668]
本稿では,効率的なマルチモーダルリモートセンシング基盤モデルであるRS-vHeatを紹介する。
具体的には、RS-vHeatは、O(N1.5)$の複雑さを持つ熱伝導演算子(HCO)と、大域的受容場を適用している。
注意に基づくリモートセンシング基礎モデルと比較して、メモリ使用量を84%削減し、FLOPを24%削減し、スループットを2.7倍改善する。
論文 参考訳(メタデータ) (2024-11-27T01:43:38Z) - T-FAKE: Synthesizing Thermal Images for Facial Landmarking [8.20594611891252]
疎密で密集したランドマークを持つ大規模合成熱データセットであるT-FAKEデータセットを紹介した。
本稿では,RGB面を熱的スタイルにドメイン適応的に移動可能な新しいRGB2熱損失関数を提案する。
我々のモデルは、スパース70点のランドマークと密度478点のランドマークアノテーションの両方で優れた性能を示している。
論文 参考訳(メタデータ) (2024-08-27T15:07:58Z) - Building Vision Models upon Heat Conduction [66.1594989193046]
本研究は, 物理的熱伝導原理に基づく熱伝導演算子 (HCO) について紹介する。
HCOは熱源としてイメージパッチを概念化し、適応的な熱エネルギー拡散を通じて相関をモデル化する。
vHeatは、Swin-Transformerと比較して最大で3倍のスループット、GPUメモリ割り当ての80%削減、計算FLOPの35%削減を実現している。
論文 参考訳(メタデータ) (2024-05-26T12:58:04Z) - Segmentation Framework for Heat Loss Identification in Thermal Images:
Empowering Scottish Retrofitting and Thermographic Survey Companies [3.663784777941382]
本研究では,Mask領域提案畳み込みニューラルネットワーク(Mask RCNN)を用いたディープラーニング(DL)に基づくセグメンテーションフレームワークを提案する。
本フレームワークの目的は, 弱い断熱によって引き起こされる熱損失源を同定し, かつ, それらの画像に存在する閉塞物を除去することである。
論文 参考訳(メタデータ) (2023-08-07T14:36:49Z) - Simultaneous temperature estimation and nonuniformity correction from
multiple frames [0.0]
低コストのマイクロボロメーターベースの赤外線カメラは、空間的に不均一であり、温度測定でドリフトする傾向がある。
低コストマイクロボロメータカメラで捉えた複数フレームからの同時温度推定と非均一性補正(NUC)のための新しい手法を提案する。
論文 参考訳(メタデータ) (2023-07-23T11:28:25Z) - Precise Facial Landmark Detection by Reference Heatmap Transformer [52.417964103227696]
より正確に顔のランドマークを検出するための参照ヒートマップ変換器(RHT)を提案する。
評価実験の結果,提案手法は文献における最先端の手法よりも優れていることが示された。
論文 参考訳(メタデータ) (2023-03-14T12:26:48Z) - Does Thermal Really Always Matter for RGB-T Salient Object Detection? [153.17156598262656]
本稿では,RGB-T有意物体検出(SOD)タスクを解決するために,TNetというネットワークを提案する。
本稿では,画像のグローバル照度を推定するためのグローバル照度推定モジュールを提案する。
一方, 2段階の局所化と相補化モジュールを導入し, 熱的特徴の物体位置化キューと内部整合キューをRGBモダリティに転送する。
論文 参考訳(メタデータ) (2022-10-09T13:50:12Z) - Maximizing Self-supervision from Thermal Image for Effective
Self-supervised Learning of Depth and Ego-motion [78.19156040783061]
熱画像からの深度とエゴモーションの自己教師付き学習は、困難なシナリオ下で強い堅牢性と信頼性を示す。
弱いコントラスト、ぼやけたエッジ、ノイズなどの固有の熱画像特性は、熱画像から効果的な自己スーパービジョンを生成するために障害となる。
本研究では,時間的一貫性を維持しつつ,全体構造,コントラスト,詳細などの画像情報を大幅に向上させる有効熱画像マッピング手法を提案する。
論文 参考訳(メタデータ) (2022-01-12T09:49:24Z) - Robust pedestrian detection in thermal imagery using synthesized images [39.33977680993236]
熱領域における歩行者検出を2段階に分けて改善する手法を提案する。
まず、生成データ拡張アプローチを使用し、次いで、生成されたデータを用いたドメイン適応法は、RGB歩行者検出器に適応する。
我々の検出器は,最先端技術に関して,KAIST上で最高の単一モダリティ検出結果を達成する。
論文 参考訳(メタデータ) (2021-02-03T11:08:31Z) - Exploring Thermal Images for Object Detection in Underexposure Regions
for Autonomous Driving [67.69430435482127]
アンダーエクスポージャー地域は、安全な自動運転のための周囲の完全な認識を構築するのに不可欠である。
サーマルカメラが利用可能になったことで、他の光学センサーが解釈可能な信号を捉えていない地域を探索するための重要な代替手段となった。
本研究は,可視光画像から熱画像へ学習を伝達するためのスタイル伝達手法を用いたドメイン適応フレームワークを提案する。
論文 参考訳(メタデータ) (2020-06-01T09:59:09Z) - Unsupervised Image-generation Enhanced Adaptation for Object Detection
in Thermal images [4.810743887667828]
本稿では、熱画像における物体検出のための教師なし画像生成拡張適応法を提案する。
可視領域と熱領域のギャップを低減するため,提案手法は擬似熱画像を生成する。
提案手法の有効性と優位性を示す実験を行った。
論文 参考訳(メタデータ) (2020-02-17T04:53:30Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。