論文の概要: What Happened 3 Seconds Ago? Inferring the Past with Thermal Imaging
- arxiv url: http://arxiv.org/abs/2304.13651v1
- Date: Wed, 26 Apr 2023 16:23:10 GMT
- ステータス: 処理完了
- システム内更新日: 2023-04-27 13:44:23.782464
- Title: What Happened 3 Seconds Ago? Inferring the Past with Thermal Imaging
- Title(参考訳): 3秒前に何があった?
サーマルイメージングによる過去の推定
- Authors: Zitian Tang, Wenjie Ye, Wei-Chiu Ma, Hang Zhao
- Abstract要約: 人体動作解析のための最初のRGBサーマルデータセットを収集した。
我々は過去の人間のポーズ推定を正確にするための3段階ニューラルネットワークモデルを開発した。
- 参考スコア(独自算出の注目度): 22.923237551192834
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Inferring past human motion from RGB images is challenging due to the
inherent uncertainty of the prediction problem. Thermal images, on the other
hand, encode traces of past human-object interactions left in the environment
via thermal radiation measurement. Based on this observation, we collect the
first RGB-Thermal dataset for human motion analysis, dubbed Thermal-IM. Then we
develop a three-stage neural network model for accurate past human pose
estimation. Comprehensive experiments show that thermal cues significantly
reduce the ambiguities of this task, and the proposed model achieves remarkable
performance. The dataset is available at
https://github.com/ZitianTang/Thermal-IM.
- Abstract(参考訳): RGB画像から過去の人間の動きを推定することは、予測問題の本質的な不確実性のために困難である。
一方、熱画像は、過去の人間と物体の相互作用の痕跡を熱放射測定によって符号化する。
この観測に基づいて,ヒトの動作解析のための最初のRGBサーマルデータセットを収集した。
次に,過去のポーズ推定のための3段階ニューラルネットワークモデルを開発した。
総合実験により, この課題のあいまいさを著しく低減し, 提案モデルにより顕著な性能が得られた。
データセットはhttps://github.com/ZitianTang/Thermal-IMで公開されている。
関連論文リスト
- Closing the Gap in Human Behavior Analysis: A Pipeline for Synthesizing
Trimodal Data [1.8024397171920885]
本稿では,RGB,熱,深度,人間中心のデータセットを新たに生成する手法を提案する。
この技術は、RGB画像から得られる人間のセグメンテーションマスクと、自動的に出力される熱的背景と深さ的背景を組み合わせて活用する。
このアプローチを用いることで、限られたデータ、悪い雷条件、プライバシに敏感な領域の設定のためのモデルのトレーニングに利用できるトリモーダルデータを生成する。
論文 参考訳(メタデータ) (2024-02-02T16:27:45Z) - Zolly: Zoom Focal Length Correctly for Perspective-Distorted Human Mesh
Reconstruction [66.10717041384625]
Zollyは、視点歪みの画像に焦点を当てた最初の3DHMR法である。
人体の2次元密度ゆらぎスケールを記述した新しいカメラモデルと新しい2次元歪み画像を提案する。
このタスク用に調整された2つの現実世界のデータセットを拡張します。
論文 参考訳(メタデータ) (2023-03-24T04:22:41Z) - Does Thermal Really Always Matter for RGB-T Salient Object Detection? [153.17156598262656]
本稿では,RGB-T有意物体検出(SOD)タスクを解決するために,TNetというネットワークを提案する。
本稿では,画像のグローバル照度を推定するためのグローバル照度推定モジュールを提案する。
一方, 2段階の局所化と相補化モジュールを導入し, 熱的特徴の物体位置化キューと内部整合キューをRGBモダリティに転送する。
論文 参考訳(メタデータ) (2022-10-09T13:50:12Z) - A Novel Fully Annotated Thermal Infrared Face Dataset: Recorded in
Various Environment Conditions and Distances From The Camera [3.2872586139884623]
本稿では,シャーロット・サーマルフェイス(Charlotte-ThermalFace)と呼ぶ顔サーモグラフィに関する新しいデータセットについて述べる。
シャーロット・サーマルフェイスは、様々な熱条件、カメラからの距離、異なる頭部位置において、100000以上の赤外線熱画像を含んでいる。
データは、顔のランドマーク、周囲の温度、相対湿度、部屋の空気速度、カメラの距離、各画像の撮影時の熱感で完全に注釈付けされている。
論文 参考訳(メタデータ) (2022-04-29T17:57:54Z) - Learning Dynamic View Synthesis With Few RGBD Cameras [60.36357774688289]
本稿では,RGBDカメラを用いて動的屋内シーンのフリー視点映像を合成することを提案する。
我々は、RGBDフレームから点雲を生成し、それをニューラル機能を介して、自由視点ビデオにレンダリングする。
そこで本研究では,未完成の深度を適応的に塗布して新規なビューを描画する,シンプルなRegional Depth-Inpaintingモジュールを提案する。
論文 参考訳(メタデータ) (2022-04-22T03:17:35Z) - A Cloud-Edge-Terminal Collaborative System for Temperature Measurement
in COVID-19 Prevention [13.593364699001693]
新型コロナウイルス(COVID-19)の感染拡大を防ぐために、公共の場での予備温度測定とマスク検出を実施している。
軽量赤外線温度測定モデルを用いたクラウド-エッジ-端末協調システムを提案する。
実験により、検出モデルは6.1Mのみであり、平均検出速度は257msであることがわかった。
論文 参考訳(メタデータ) (2021-07-11T16:15:15Z) - Lifting Monocular Events to 3D Human Poses [22.699272716854967]
本稿では,非同期イベントの単一ストリームを入力として用いる新しい3次元ポーズ推定手法を提案する。
単一のイベントストリームから3D人間のポーズを学習する最初の方法を提案します。
実験により,本手法は,標準RGBとイベントベースビジョン間の性能ギャップを狭め,精度が向上することを示した。
論文 参考訳(メタデータ) (2021-04-21T16:07:12Z) - Real-time RGBD-based Extended Body Pose Estimation [57.61868412206493]
3DヒトポーズのリアルタイムRGBDに基づく推定システムを提案する。
パラメトリック3次元変形可能なヒューマンメッシュモデル(SMPL-X)を表現として使用する。
身体のポーズと表情パラメータの推定子を訓練する。
論文 参考訳(メタデータ) (2021-03-05T13:37:50Z) - A Large-Scale, Time-Synchronized Visible and Thermal Face Dataset [62.193924313292875]
DEVCOM Army Research Laboratory Visible-Thermal Faceデータセット(ARL-VTF)を発表します。
395人の被験者から50万枚以上の画像が得られたARL-VTFデータセットは、これまでで最大の可視画像とサーマルフェイス画像の収集データだ。
本論文では,ALL-VTFデータセットを用いたサーマルフェースランドマーク検出とサーマル・トゥ・ヴィジブルフェース検証のベンチマーク結果と分析について述べる。
論文 参考訳(メタデータ) (2021-01-07T17:17:12Z) - The Use of AI for Thermal Emotion Recognition: A Review of Problems and
Limitations in Standard Design and Data [36.33347149799959]
コビッド19のスクリーニングに熱画像に注目が集まる中、公共セクターはコンピュータービジョンとAIのモダリティとして熱を利用する新たな機会があると信じているかもしれない。
本稿では、熱FERにおける機械学習の短いレビューと、AIトレーニングのための熱FERデータの収集・開発限界について述べる。
論文 参考訳(メタデータ) (2020-09-22T14:58:59Z) - I2L-MeshNet: Image-to-Lixel Prediction Network for Accurate 3D Human
Pose and Mesh Estimation from a Single RGB Image [79.040930290399]
I2L-MeshNetを提案する。
提案したI2L-MeshNetは、パラメータを直接回帰するのではなく、各メッシュ座標の1Dヒートマップ上のリセル当たりの確率を予測する。
我々のリセルベースの1Dヒートマップは入力画像の空間的関係を保存し、予測の不確かさをモデル化する。
論文 参考訳(メタデータ) (2020-08-09T12:13:31Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。