論文の概要: Synthetic Thermal and RGB Videos for Automatic Pain Assessment utilizing a Vision-MLP Architecture
- arxiv url: http://arxiv.org/abs/2407.19811v1
- Date: Mon, 29 Jul 2024 09:04:11 GMT
- ステータス: 処理完了
- システム内更新日: 2024-07-30 14:35:40.302870
- Title: Synthetic Thermal and RGB Videos for Automatic Pain Assessment utilizing a Vision-MLP Architecture
- Title(参考訳): 視覚MLPアーキテクチャを用いた痛覚自動評価のための合成熱・RGBビデオ
- Authors: Stefanos Gkikas, Manolis Tsiknakis,
- Abstract要約: 本研究は、認知パイプラインに組み込まれたジェネレーティブ・アドバイサル・ネットワークによって生成された合成熱ビデオについて述べる。
Vision-MLPとTransformerベースのモジュールからなるフレームワークを使用し、RGBおよび合成熱ビデオを用いて、単調およびマルチモーダルな設定を行う。
- 参考スコア(独自算出の注目度): 0.9668407688201359
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Pain assessment is essential in developing optimal pain management protocols to alleviate suffering and prevent functional decline in patients. Consequently, reliable and accurate automatic pain assessment systems are essential for continuous and effective patient monitoring. This study presents synthetic thermal videos generated by Generative Adversarial Networks integrated into the pain recognition pipeline and evaluates their efficacy. A framework consisting of a Vision-MLP and a Transformer-based module is utilized, employing RGB and synthetic thermal videos in unimodal and multimodal settings. Experiments conducted on facial videos from the BioVid database demonstrate the effectiveness of synthetic thermal videos and underline the potential advantages of it.
- Abstract(参考訳): 痛み評価は、患者の痛みを緩和し、機能低下を防ぐ最適な痛み管理プロトコルを開発するために不可欠である。
その結果, 持続的かつ効果的な患者モニタリングには, 信頼性, 正確な自動鎮痛評価システムが不可欠である。
本研究は, 鎮痛パイプラインに組み込まれたジェネレーティブ・アドバイサル・ネットワークが生成した合成熱ビデオについて検討し, その有効性を評価する。
Vision-MLPとTransformerベースのモジュールからなるフレームワークを使用し、RGBおよび合成熱ビデオを用いて、単調およびマルチモーダルな設定を行う。
BioVidデータベースによる顔ビデオ実験は、合成熱ビデオの有効性を実証し、その潜在的な利点を浮き彫りにした。
関連論文リスト
- Towards Synthetic Data Generation for Improved Pain Recognition in Videos under Patient Constraints [11.515273901289472]
本研究では、合成データを活用して、ビデオに基づく痛み認識モデルを強化する新しいアプローチを提案する。
本稿では,小さな参加者プールからニュアンスな顔の動きを捉え,リアルな3次元顔モデルを合成するパイプラインを提案する。
このプロセスは8,600個の合成顔を生成し、様々な角度と視点から本物の痛み表現を正確に反映する。
論文 参考訳(メタデータ) (2024-09-24T18:33:57Z) - Transformer with Leveraged Masked Autoencoder for video-based Pain Assessment [11.016004057765185]
我々は、トランスフォーマーに基づくディープラーニングモデルにおいて、顔画像解析を用いて、痛み認識を強化する。
強力なMasked AutoencoderとTransformersベースの分類器を組み合わせることで,表現とマイクロ表現の両方を通じて痛みレベルインジケータを効果的にキャプチャする。
論文 参考訳(メタデータ) (2024-09-08T13:14:03Z) - Twins-PainViT: Towards a Modality-Agnostic Vision Transformer Framework for Multimodal Automatic Pain Assessment using Facial Videos and fNIRS [0.9668407688201359]
The First Multimodal Sensing Grand Challenge for Next-Gen Pain Assessment (AI4PAIN)に応募した。
提案するマルチモーダルフレームワークは,顔ビデオとfNIRSを利用して,ドメイン固有モデルの必要性を軽減し,モダリティに依存しないアプローチを提案する。
論文 参考訳(メタデータ) (2024-07-29T09:02:43Z) - Machine Learning for ALSFRS-R Score Prediction: Making Sense of the Sensor Data [44.99833362998488]
筋萎縮性側索硬化症(Amyotrophic Lateral Sclerosis、ALS)は、急速に進行する神経変性疾患である。
iDPP@CLEF 2024チャレンジを先導した今回の調査は,アプリから得られるセンサデータを活用することに焦点を当てている。
論文 参考訳(メタデータ) (2024-07-10T19:17:23Z) - CathFlow: Self-Supervised Segmentation of Catheters in Interventional Ultrasound Using Optical Flow and Transformers [66.15847237150909]
縦型超音波画像におけるカテーテルのセグメンテーションのための自己教師型ディープラーニングアーキテクチャを提案する。
ネットワークアーキテクチャは、Attention in Attentionメカニズムで構築されたセグメンテーショントランスフォーマであるAiAReSeg上に構築されている。
我々は,シリコンオルタファントムから収集した合成データと画像からなる実験データセット上で,我々のモデルを検証した。
論文 参考訳(メタデータ) (2024-03-21T15:13:36Z) - Learning to Estimate Critical Gait Parameters from Single-View RGB
Videos with Transformer-Based Attention Network [0.0]
本稿では,一眼レフカメラで撮影したRGBビデオから重要な歩行パラメータを推定するトランスフォーマーネットワークを提案する。
脳性麻痺患者の公的データセットに関する実証的な評価は、このフレームワークが現在の最先端のアプローチを超越していることを示している。
論文 参考訳(メタデータ) (2023-12-01T07:45:27Z) - MC-ViViT: Multi-branch Classifier-ViViT to detect Mild Cognitive
Impairment in older adults using facial videos [44.72781467904852]
本稿では, 顔の特徴を解析することによって, 正常な認知能力を持つ者との区別を目的とした, マルチブランチ・ビデオ・ビジョン・トランスフォーマ (MCViViT) モデルを提案する。
このデータは、頻繁なビデオチャットを提供することで認知機能を改善することを目的とした行動介入試験であるI-CONECTから得られたものだ。
I-CONECTデータセットの実験結果は、MC-ViViTがMCIを90.63%の精度で予測する大きな可能性を示している。
論文 参考訳(メタデータ) (2023-04-11T15:42:20Z) - Tele-EvalNet: A Low-cost, Teleconsultation System for Home based
Rehabilitation of Stroke Survivors using Multiscale CNN-LSTM Architecture [7.971065005161566]
本稿では,ライブフィードバックモデルと全体的なパフォーマンス評価モデルという,2つのコンポーネントからなる新しいシステムであるTele-EvalNetを提案する。
ライブフィードバックモデルは、カラーマーカーを使用してハイライトされた指示を簡単に理解し、エクササイズ正しさに関するフィードバックを示す。
総合的なパフォーマンス評価モデルでは,臨床医の成績に応じて,関節データのスコアへのマッピングを学習する。
論文 参考訳(メタデータ) (2021-12-06T16:58:00Z) - Lung Cancer Lesion Detection in Histopathology Images Using Graph-Based
Sparse PCA Network [93.22587316229954]
ヘマトキシリンとエオシン(H&E)で染色した組織学的肺スライドにおける癌病変の自動検出のためのグラフベーススパース成分分析(GS-PCA)ネットワークを提案する。
我々は,SVM K-rasG12D肺がんモデルから得られたH&Eスライダーの精度・リコール率,Fスコア,谷本係数,レシーバ演算子特性(ROC)の曲線下領域を用いて,提案アルゴリズムの性能評価を行った。
論文 参考訳(メタデータ) (2021-10-27T19:28:36Z) - One-shot action recognition towards novel assistive therapies [63.23654147345168]
この作業は、アクション模倣ゲームを含む医療療法の自動分析によって動機づけられます。
提案手法は、異種運動データ条件を標準化する前処理ステップを組み込んだものである。
自閉症者に対するセラピー支援のための自動ビデオ分析の実際の利用事例について検討した。
論文 参考訳(メタデータ) (2021-02-17T19:41:37Z) - Two-Stream Deep Feature Modelling for Automated Video Endoscopy Data
Analysis [45.19890687786009]
内視鏡画像解析のための2ストリームモデルを提案する。
本モデルでは,2つの深い特徴入力を融合させ,それらの関係関係を新たな関係ネットワークモデルによりマッピングする。
論文 参考訳(メタデータ) (2020-07-12T05:24:08Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。