論文の概要: See the past: Time-Reversed Scene Reconstruction from Thermal Traces Using Visual Language Models
- arxiv url: http://arxiv.org/abs/2510.05408v1
- Date: Mon, 06 Oct 2025 21:57:26 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-10-08 17:57:08.004835
- Title: See the past: Time-Reversed Scene Reconstruction from Thermal Traces Using Visual Language Models
- Title(参考訳): 過去を見よ:視覚言語モデルを用いた熱的トレースからの時間反転シーン再構成
- Authors: Kebin Contreras, Luis Toscano-Palomino, Mauro Dalla Mura, Jorge Bacca,
- Abstract要約: 本研究は,RGBと熱画像を組み合わせて数秒前からシーン状態を復元する時間反転再構成フレームワークを提案する。
この手法は3つの制御シナリオで評価され、最大120秒前に可視過去のフレームを再構築可能であることを示す。
- 参考スコア(独自算出の注目度): 14.937446839215868
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Recovering the past from present observations is an intriguing challenge with potential applications in forensics and scene analysis. Thermal imaging, operating in the infrared range, provides access to otherwise invisible information. Since humans are typically warmer (37 C -98.6 F) than their surroundings, interactions such as sitting, touching, or leaning leave residual heat traces. These fading imprints serve as passive temporal codes, allowing for the inference of recent events that exceed the capabilities of RGB cameras. This work proposes a time-reversed reconstruction framework that uses paired RGB and thermal images to recover scene states from a few seconds earlier. The proposed approach couples Visual-Language Models (VLMs) with a constrained diffusion process, where one VLM generates scene descriptions and another guides image reconstruction, ensuring semantic and structural consistency. The method is evaluated in three controlled scenarios, demonstrating the feasibility of reconstructing plausible past frames up to 120 seconds earlier, providing a first step toward time-reversed imaging from thermal traces.
- Abstract(参考訳): 現在の観測から過去を復元することは、法医学とシーン分析の潜在的な応用において興味深い課題である。
赤外線領域で動作する熱画像は、他の見えない情報へのアクセスを提供する。
人間は概して周囲よりも暖かい(37C-98.6F)ため、座る、触る、傾くなどの相互作用は残留した熱跡を残す。
これらの流行するインプリントはパッシブ・テンポラル・コードとして機能し、RGBカメラの能力を超える最近の出来事を推測することができる。
本研究は,RGBと熱画像を組み合わせて数秒前からシーン状態を復元する時間反転再構成フレームワークを提案する。
提案手法は、視覚言語モデル(VLM)と制約付き拡散過程を結合し、一方のVLMがシーン記述を生成し、もう一方のVLMが画像再構成をガイドし、意味的および構造的整合性を確保する。
この方法は3つの制御されたシナリオで評価され、最大120秒前に可塑性過去のフレームを再構築できる可能性を示し、熱痕跡からの時間反転イメージングに向けた第一歩となる。
関連論文リスト
- Coherent 3D Scene Diffusion From a Single RGB Image [68.31336308924477]
単一のRGB画像からのコヒーレントな3次元シーン再構成のための拡散に基づく新しい手法を提案する。
本手法は,シーン内のすべてのオブジェクトの3次元ポーズとジオメトリを同時に認識する。
一つのRGB画像3Dシーン再構成のタスクを条件付き拡散プロセスとしてフレーミングすることにより,本手法は最先端の手法を超越する。
論文 参考訳(メタデータ) (2024-12-13T17:26:45Z) - Leveraging Thermal Modality to Enhance Reconstruction in Low-Light Conditions [25.14690752484963]
ニューラル・ラジアンス・フィールド(NeRF)は、多視点画像からシーンの暗黙的な表現を学習することにより、写真リアリスティックなノベルビュー合成を実現する。
既存のアプローチは、生画像から低照度シーンを再構築するが、暗黒領域におけるテクスチャや境界の詳細の回復に苦慮している。
本研究では,熱的・可視的な原像を入力とし,同時に可視的・熱的視点合成を実現する熱-NeRFを提案する。
論文 参考訳(メタデータ) (2024-03-21T00:35:31Z) - ThermoNeRF: Joint RGB and Thermal Novel View Synthesis for Building Facades using Multimodal Neural Radiance Fields [5.66229031510643]
熱環境の再構築は、建築エネルギー消費の分析や非破壊的なインフラ試験の実行など、様々な用途において大きな可能性を秘めている。
既存の手法は通常、密集したシーン計測を必要とし、しばしばRGBの画像を3次元の幾何学的再構成に頼り、再建後の熱情報を投影する。
本研究では,新しいRGBとシーンの熱像を共同で描画するニューラルラジアンス場に基づく新しいアプローチであるThermoNeRFと,建築ファサードの8つのシーンと日常の8つのシーンからなる2つのRGB+熱画像のデータセットであるThermoScenesを提案する。
論文 参考訳(メタデータ) (2024-03-18T18:10:34Z) - Visible to Thermal image Translation for improving visual task in low
light conditions [0.0]
Parrot Anafi Thermalのドローンを使って、2つの場所から画像を収集した。
我々は2ストリームネットワークを作成し、前処理、拡張、画像データを作成し、ジェネレータと識別器モデルをゼロから訓練した。
その結果, RGB トレーニングデータを GAN を用いて熱データに変換することが可能であることが示唆された。
論文 参考訳(メタデータ) (2023-10-31T05:18:53Z) - Neural Scene Chronology [79.51094408119148]
我々は、視点、照明、時間の独立した制御で写真リアルなレンダリングをレンダリングできる、時間変化の3Dモデルを再構築することを目指している。
本研究では,画像ごとの照明を埋め込んだ時空間放射場として,時間的に変化するシーン変化を学習ステップ関数のセットを用いて符号化する。
論文 参考訳(メタデータ) (2023-06-13T17:59:58Z) - What Happened 3 Seconds Ago? Inferring the Past with Thermal Imaging [22.923237551192834]
人体動作解析のための最初のRGBサーマルデータセットを収集した。
我々は過去の人間のポーズ推定を正確にするための3段階ニューラルネットワークモデルを開発した。
論文 参考訳(メタデータ) (2023-04-26T16:23:10Z) - T2V-DDPM: Thermal to Visible Face Translation using Denoising Diffusion
Probabilistic Models [71.94264837503135]
本稿では,熱可視(T2V)画像翻訳のための解法として,DDPM(Denoising Diffusion Probabilistic Model)を提案する。
トレーニング中、モデルは、対応する熱画像から可視像の条件分布を学習する。
複数のデータセットで最先端の結果が得られます。
論文 参考訳(メタデータ) (2022-09-19T07:59:32Z) - Learning Dynamic View Synthesis With Few RGBD Cameras [60.36357774688289]
本稿では,RGBDカメラを用いて動的屋内シーンのフリー視点映像を合成することを提案する。
我々は、RGBDフレームから点雲を生成し、それをニューラル機能を介して、自由視点ビデオにレンダリングする。
そこで本研究では,未完成の深度を適応的に塗布して新規なビューを描画する,シンプルなRegional Depth-Inpaintingモジュールを提案する。
論文 参考訳(メタデータ) (2022-04-22T03:17:35Z) - Thermal to Visible Image Synthesis under Atmospheric Turbulence [67.99407460140263]
バイオメトリックスや監視では、低照度と夜間の条件下での撮像に熱画像モダリティがしばしば用いられる。
このような画像システムは、しばしば大気の乱れに悩まされ、撮像された画像に激しいぼやけや変形のアーチファクトをもたらす。
熱画像を直接可視光画像に変換するエンド・ツー・エンドの再構成法を提案する。
論文 参考訳(メタデータ) (2022-04-06T19:47:41Z) - A Large-Scale, Time-Synchronized Visible and Thermal Face Dataset [62.193924313292875]
DEVCOM Army Research Laboratory Visible-Thermal Faceデータセット(ARL-VTF)を発表します。
395人の被験者から50万枚以上の画像が得られたARL-VTFデータセットは、これまでで最大の可視画像とサーマルフェイス画像の収集データだ。
本論文では,ALL-VTFデータセットを用いたサーマルフェースランドマーク検出とサーマル・トゥ・ヴィジブルフェース検証のベンチマーク結果と分析について述べる。
論文 参考訳(メタデータ) (2021-01-07T17:17:12Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。