論文の概要: ThermalDiffusion: Visual-to-Thermal Image-to-Image Translation for Autonomous Navigation
- arxiv url: http://arxiv.org/abs/2506.20969v1
- Date: Thu, 26 Jun 2025 03:18:22 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-06-27 19:53:09.956572
- Title: ThermalDiffusion: Visual-to-Thermal Image-to-Image Translation for Autonomous Navigation
- Title(参考訳): Thermal Diffusion: 自律ナビゲーションのための視覚-熱間画像-画像間変換
- Authors: Shruti Bansal, Wenshan Wang, Yifei Liu, Parv Maheshwari,
- Abstract要約: 本稿では,合成熱データを用いたマルチモーダルデータセットの拡張手法を提案し,熱カメラの広範かつ迅速な適応を実現する。
本研究では、実世界の物体の熱特性を学習するために、自己アテンションを用いて既存のRGB画像を熱画像に変換するための条件拡散モデルの利用について検討する。
- 参考スコア(独自算出の注目度): 6.524847658755803
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Autonomous systems rely on sensors to estimate the environment around them. However, cameras, LiDARs, and RADARs have their own limitations. In nighttime or degraded environments such as fog, mist, or dust, thermal cameras can provide valuable information regarding the presence of objects of interest due to their heat signature. They make it easy to identify humans and vehicles that are usually at higher temperatures compared to their surroundings. In this paper, we focus on the adaptation of thermal cameras for robotics and automation, where the biggest hurdle is the lack of data. Several multi-modal datasets are available for driving robotics research in tasks such as scene segmentation, object detection, and depth estimation, which are the cornerstone of autonomous systems. However, they are found to be lacking in thermal imagery. Our paper proposes a solution to augment these datasets with synthetic thermal data to enable widespread and rapid adaptation of thermal cameras. We explore the use of conditional diffusion models to convert existing RGB images to thermal images using self-attention to learn the thermal properties of real-world objects.
- Abstract(参考訳): 自律システムは周囲の環境を推定するためにセンサーに依存している。
しかし、カメラ、LiDAR、RADARには独自の制限がある。
夜間や霧、霧、ほこりなどの劣化した環境では、熱カメラは熱信号による関心のある物体の存在に関する貴重な情報を提供することができる。
通常、周囲と比べて気温が高い人や車を容易に識別できる。
本稿では、ロボットと自動化のためのサーマルカメラの適応に焦点を当て、最大のハードルはデータの欠如である。
いくつかのマルチモーダルデータセットは、シーンセグメンテーション、オブジェクト検出、深さ推定といった、自律システムの基盤となるタスクにおけるロボット研究を駆動するために利用可能である。
しかし、熱画像に欠けていたことが判明した。
本稿では、これらのデータセットを合成熱データで拡張し、熱カメラの広範かつ迅速な適応を可能にする方法を提案する。
本研究では、実世界の物体の熱特性を学習するために、自己アテンションを用いて既存のRGB画像を熱画像に変換するための条件拡散モデルの利用について検討する。
関連論文リスト
- Dataset and Benchmark: Novel Sensors for Autonomous Vehicle Perception [7.474695739346621]
本稿では,このトピックの今後の研究を促進するために,自律走行認識のための新しいセンサーについて紹介する。
データは2つの8kmルートを繰り返すことで収集され、様々な照明条件と反対の視点を含む。
我々の知る限り、NSAVPデータセットは、ステレオイベントとモノクロカメラと共にステレオサーマルカメラを初めて組み込んだものだ。
論文 参考訳(メタデータ) (2024-01-24T23:25:23Z) - MIPI 2022 Challenge on RGB+ToF Depth Completion: Dataset and Report [92.61915017739895]
本稿では,新しい画像センサと撮像アルゴリズムに着目した5つのトラックを含むMIPIの最初の課題を紹介する。
参加者にはTetrasRGBDという,高品質な合成RGB+Depthトレーニングデータ18万組と,混合ソースからの2.3万組のテストデータを含む,新たなデータセットが提供される。
最終結果は客観的指標と平均オピニオンスコア(MOS)を主観的に評価する。
論文 参考訳(メタデータ) (2022-09-15T05:31:53Z) - Drone Detection and Tracking in Real-Time by Fusion of Different Sensing
Modalities [66.4525391417921]
マルチセンサ・ドローン検知システムの設計と評価を行う。
われわれのソリューションは、魚眼カメラを統合し、空の広い部分を監視し、他のカメラを興味ある対象に向けて操縦する。
このサーマルカメラは、たとえこのカメラが解像度が低いとしても、ビデオカメラと同じくらい実現可能なソリューションであることが示されている。
論文 参考訳(メタデータ) (2022-07-05T10:00:58Z) - Machine Learning-Based Automated Thermal Comfort Prediction: Integration
of Low-Cost Thermal and Visual Cameras for Higher Accuracy [3.2872586139884623]
利用者の快適さに関するデータを提供するためには,リアルタイムフィードバックシステムが必要である。
非侵襲型サーマルスキャンに対して、より包括的視点をもたらすためには、新しいソリューションが必要である。
論文 参考訳(メタデータ) (2022-04-14T15:30:16Z) - Meta-UDA: Unsupervised Domain Adaptive Thermal Object Detection using
Meta-Learning [64.92447072894055]
赤外線(IR)カメラは、照明条件や照明条件が悪ければ頑丈である。
既存のUDA手法を改善するためのアルゴリズムメタ学習フレームワークを提案する。
KAISTおよびDSIACデータセットのための最先端熱検出器を作成した。
論文 参考訳(メタデータ) (2021-10-07T02:28:18Z) - Lidar Light Scattering Augmentation (LISA): Physics-based Simulation of
Adverse Weather Conditions for 3D Object Detection [60.89616629421904]
ライダーベースの物体検出器は、自動運転車のような自律ナビゲーションシステムにおいて、3D知覚パイプラインの重要な部分である。
降雨、雪、霧などの悪天候に敏感で、信号-雑音比(SNR)と信号-背景比(SBR)が低下している。
論文 参考訳(メタデータ) (2021-07-14T21:10:47Z) - The Use of AI for Thermal Emotion Recognition: A Review of Problems and
Limitations in Standard Design and Data [36.33347149799959]
コビッド19のスクリーニングに熱画像に注目が集まる中、公共セクターはコンピュータービジョンとAIのモダリティとして熱を利用する新たな機会があると信じているかもしれない。
本稿では、熱FERにおける機械学習の短いレビューと、AIトレーニングのための熱FERデータの収集・開発限界について述べる。
論文 参考訳(メタデータ) (2020-09-22T14:58:59Z) - Exploring Thermal Images for Object Detection in Underexposure Regions
for Autonomous Driving [67.69430435482127]
アンダーエクスポージャー地域は、安全な自動運転のための周囲の完全な認識を構築するのに不可欠である。
サーマルカメラが利用可能になったことで、他の光学センサーが解釈可能な信号を捉えていない地域を探索するための重要な代替手段となった。
本研究は,可視光画像から熱画像へ学習を伝達するためのスタイル伝達手法を用いたドメイン適応フレームワークを提案する。
論文 参考訳(メタデータ) (2020-06-01T09:59:09Z) - Learning Camera Miscalibration Detection [83.38916296044394]
本稿では,視覚センサ,特にRGBカメラの誤校正検出を学習するためのデータ駆動型アプローチに焦点を当てた。
コントリビューションには、RGBカメラの誤校正基準と、この基準に基づく新しい半合成データセット生成パイプラインが含まれる。
深層畳み込みニューラルネットワークをトレーニングすることにより、カメラ固有のパラメータの再校正が必要か否かを判断するパイプラインの有効性を実証する。
論文 参考訳(メタデータ) (2020-05-24T10:32:49Z) - SurfelGAN: Synthesizing Realistic Sensor Data for Autonomous Driving [27.948417322786575]
本稿では,現実的なシナリオセンサデータを生成するための,シンプルで効果的な手法を提案する。
われわれのアプローチでは、テクスチャマップされたサーフを使用して、初期車両のパスやセットのパスからシーンを効率的に再構築する。
次に、SurfelGANネットワークを利用して、現実的なカメライメージを再構築し、自動運転車の新たな位置と方向を推定する。
論文 参考訳(メタデータ) (2020-05-08T04:01:14Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。