論文の概要: What Happened 3 Seconds Ago? Inferring the Past with Thermal Imaging
- arxiv url: http://arxiv.org/abs/2304.13651v1
- Date: Wed, 26 Apr 2023 16:23:10 GMT
- ステータス: 処理完了
- システム内更新日: 2023-04-27 13:44:23.782464
- Title: What Happened 3 Seconds Ago? Inferring the Past with Thermal Imaging
- Title(参考訳): 3秒前に何があった?
サーマルイメージングによる過去の推定
- Authors: Zitian Tang, Wenjie Ye, Wei-Chiu Ma, Hang Zhao
- Abstract要約: 人体動作解析のための最初のRGBサーマルデータセットを収集した。
我々は過去の人間のポーズ推定を正確にするための3段階ニューラルネットワークモデルを開発した。
- 参考スコア(独自算出の注目度): 22.923237551192834
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Inferring past human motion from RGB images is challenging due to the
inherent uncertainty of the prediction problem. Thermal images, on the other
hand, encode traces of past human-object interactions left in the environment
via thermal radiation measurement. Based on this observation, we collect the
first RGB-Thermal dataset for human motion analysis, dubbed Thermal-IM. Then we
develop a three-stage neural network model for accurate past human pose
estimation. Comprehensive experiments show that thermal cues significantly
reduce the ambiguities of this task, and the proposed model achieves remarkable
performance. The dataset is available at
https://github.com/ZitianTang/Thermal-IM.
- Abstract(参考訳): RGB画像から過去の人間の動きを推定することは、予測問題の本質的な不確実性のために困難である。
一方、熱画像は、過去の人間と物体の相互作用の痕跡を熱放射測定によって符号化する。
この観測に基づいて,ヒトの動作解析のための最初のRGBサーマルデータセットを収集した。
次に,過去のポーズ推定のための3段階ニューラルネットワークモデルを開発した。
総合実験により, この課題のあいまいさを著しく低減し, 提案モデルにより顕著な性能が得られた。
データセットはhttps://github.com/ZitianTang/Thermal-IMで公開されている。
関連論文リスト
- Thermal3D-GS: Physics-induced 3D Gaussians for Thermal Infrared Novel-view Synthesis [11.793425521298488]
本稿では,熱3D-GSという物理誘導型3次元ガウススプラッティング法を提案する。
The first large-scale benchmark dataset for this field called Thermal Infrared Novel-view Synthesis dataset (TI-NSD)。
その結果,本手法はPSNRの3.03dB改善によりベースライン法よりも優れていた。
論文 参考訳(メタデータ) (2024-09-12T13:46:53Z) - ThermalGaussian: Thermal 3D Gaussian Splatting [25.536611434289647]
本研究では,RGBの高画質画像と熱モダリティのレンダリングが可能な,最初のサーマル3DGS手法であるMaterialGaussianを提案する。
本研究では,熱画像のフォトリアリスティックレンダリングを実現し,RGB画像のレンダリング品質を向上させるための総合的な実験を行った。
論文 参考訳(メタデータ) (2024-09-11T11:45:57Z) - T-FAKE: Synthesizing Thermal Images for Facial Landmarking [8.20594611891252]
スパースと密集したランドマークを持つ新しい大規模合成熱データセットであるT-FAKEデータセットを紹介する。
我々のモデルは、スパース70点のランドマークと密度478点のランドマークアノテーションの両方で優れた性能を示している。
論文 参考訳(メタデータ) (2024-08-27T15:07:58Z) - CattleFace-RGBT: RGB-T Cattle Facial Landmark Benchmark [4.463254896517738]
CattleFace-RGBTは、合計4,600枚からなる2,300枚のRGB-T画像からなるRGB-T Cattle Facial Landmarkデータセットである。
AIを熱画像に適用することは、直接熱訓練と実現不可能なRGB熱的アライメントによる最適以下の結果によって困難である。
我々は、RGBで訓練されたモデルを熱画像に転送し、AIアシストアノテーションツールを使用してそれらを洗練する。
論文 参考訳(メタデータ) (2024-06-05T16:29:13Z) - ThermoNeRF: Multimodal Neural Radiance Fields for Thermal Novel View Synthesis [5.66229031510643]
本研究では,新しいRGBとサーマルビューを共同でレンダリングする手法であるThermoNeRFを提案する。
熱画像のテクスチャの欠如を克服するために,RGBと熱画像を組み合わせてシーン密度を学習する。
また、シーン再構築に利用可能なRGB+熱的データセットの欠如を緩和する新しいデータセットであるThermoScenesも導入した。
論文 参考訳(メタデータ) (2024-03-18T18:10:34Z) - Zolly: Zoom Focal Length Correctly for Perspective-Distorted Human Mesh
Reconstruction [66.10717041384625]
Zollyは、視点歪みの画像に焦点を当てた最初の3DHMR法である。
人体の2次元密度ゆらぎスケールを記述した新しいカメラモデルと新しい2次元歪み画像を提案する。
このタスク用に調整された2つの現実世界のデータセットを拡張します。
論文 参考訳(メタデータ) (2023-03-24T04:22:41Z) - Does Thermal Really Always Matter for RGB-T Salient Object Detection? [153.17156598262656]
本稿では,RGB-T有意物体検出(SOD)タスクを解決するために,TNetというネットワークを提案する。
本稿では,画像のグローバル照度を推定するためのグローバル照度推定モジュールを提案する。
一方, 2段階の局所化と相補化モジュールを導入し, 熱的特徴の物体位置化キューと内部整合キューをRGBモダリティに転送する。
論文 参考訳(メタデータ) (2022-10-09T13:50:12Z) - Learning Dynamic View Synthesis With Few RGBD Cameras [60.36357774688289]
本稿では,RGBDカメラを用いて動的屋内シーンのフリー視点映像を合成することを提案する。
我々は、RGBDフレームから点雲を生成し、それをニューラル機能を介して、自由視点ビデオにレンダリングする。
そこで本研究では,未完成の深度を適応的に塗布して新規なビューを描画する,シンプルなRegional Depth-Inpaintingモジュールを提案する。
論文 参考訳(メタデータ) (2022-04-22T03:17:35Z) - Real-time RGBD-based Extended Body Pose Estimation [57.61868412206493]
3DヒトポーズのリアルタイムRGBDに基づく推定システムを提案する。
パラメトリック3次元変形可能なヒューマンメッシュモデル(SMPL-X)を表現として使用する。
身体のポーズと表情パラメータの推定子を訓練する。
論文 参考訳(メタデータ) (2021-03-05T13:37:50Z) - A Large-Scale, Time-Synchronized Visible and Thermal Face Dataset [62.193924313292875]
DEVCOM Army Research Laboratory Visible-Thermal Faceデータセット(ARL-VTF)を発表します。
395人の被験者から50万枚以上の画像が得られたARL-VTFデータセットは、これまでで最大の可視画像とサーマルフェイス画像の収集データだ。
本論文では,ALL-VTFデータセットを用いたサーマルフェースランドマーク検出とサーマル・トゥ・ヴィジブルフェース検証のベンチマーク結果と分析について述べる。
論文 参考訳(メタデータ) (2021-01-07T17:17:12Z) - I2L-MeshNet: Image-to-Lixel Prediction Network for Accurate 3D Human
Pose and Mesh Estimation from a Single RGB Image [79.040930290399]
I2L-MeshNetを提案する。
提案したI2L-MeshNetは、パラメータを直接回帰するのではなく、各メッシュ座標の1Dヒートマップ上のリセル当たりの確率を予測する。
我々のリセルベースの1Dヒートマップは入力画像の空間的関係を保存し、予測の不確かさをモデル化する。
論文 参考訳(メタデータ) (2020-08-09T12:13:31Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。