論文の概要: Synthetic Thermal and RGB Videos for Automatic Pain Assessment utilizing a Vision-MLP Architecture
- arxiv url: http://arxiv.org/abs/2407.19811v1
- Date: Mon, 29 Jul 2024 09:04:11 GMT
- ステータス: 翻訳完了
- システム内更新日: 2024-07-30 14:35:40.302870
- Title: Synthetic Thermal and RGB Videos for Automatic Pain Assessment utilizing a Vision-MLP Architecture
- Title(参考訳): 視覚MLPアーキテクチャを用いた痛覚自動評価のための合成熱・RGBビデオ
- Authors: Stefanos Gkikas, Manolis Tsiknakis,
- Abstract要約: 本研究は、認知パイプラインに組み込まれたジェネレーティブ・アドバイサル・ネットワークによって生成された合成熱ビデオについて述べる。
Vision-MLPとTransformerベースのモジュールからなるフレームワークを使用し、RGBおよび合成熱ビデオを用いて、単調およびマルチモーダルな設定を行う。
- 参考スコア(独自算出の注目度): 0.9668407688201359
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Pain assessment is essential in developing optimal pain management protocols to alleviate suffering and prevent functional decline in patients. Consequently, reliable and accurate automatic pain assessment systems are essential for continuous and effective patient monitoring. This study presents synthetic thermal videos generated by Generative Adversarial Networks integrated into the pain recognition pipeline and evaluates their efficacy. A framework consisting of a Vision-MLP and a Transformer-based module is utilized, employing RGB and synthetic thermal videos in unimodal and multimodal settings. Experiments conducted on facial videos from the BioVid database demonstrate the effectiveness of synthetic thermal videos and underline the potential advantages of it.
- Abstract(参考訳): 痛み評価は、患者の痛みを緩和し、機能低下を防ぐ最適な痛み管理プロトコルを開発するために不可欠である。
その結果, 持続的かつ効果的な患者モニタリングには, 信頼性, 正確な自動鎮痛評価システムが不可欠である。
本研究は, 鎮痛パイプラインに組み込まれたジェネレーティブ・アドバイサル・ネットワークが生成した合成熱ビデオについて検討し, その有効性を評価する。
Vision-MLPとTransformerベースのモジュールからなるフレームワークを使用し、RGBおよび合成熱ビデオを用いて、単調およびマルチモーダルな設定を行う。
BioVidデータベースによる顔ビデオ実験は、合成熱ビデオの有効性を実証し、その潜在的な利点を浮き彫りにした。
関連論文リスト
- Mamba-3D as Masked Autoencoders for Accurate and Data-Efficient Analysis of Medical Ultrasound Videos [11.589704875476325]
ビデオデータの3次元構造を保存したデータ効率の良いビジョンマンバネットワークであるE-ViM$3$を紹介する。
本モデルでは, 臨床応用への潜在的な影響を明らかにするとともに, ラベルの限定による競争性能の向上を図っている。
論文 参考訳(メタデータ) (2025-03-26T05:54:13Z) - DEAL: Data-Efficient Adversarial Learning for High-Quality Infrared Imaging [47.22313650077835]
温度劣化シミュレーションをミニマックス最適化によりトレーニングプロセスに統合する。
シミュレーションは、目的関数を最大化するために動的であり、これにより、劣化したデータ分布の幅広いスペクトルをキャプチャする。
このアプローチにより、限られたデータによるトレーニングが可能になり、モデルのパフォーマンスが向上する。
論文 参考訳(メタデータ) (2025-03-02T14:15:44Z) - A Full Transformer-based Framework for Automatic Pain Estimation using Videos [0.9668407688201359]
本稿では,トランスフォーマーモデル(TNT)と,クロスアテンションブロックと自己アテンションブロックを利用するトランスフォーマーで構成される,新しいフルトランスフォーマーベースのフレームワークを提案する。
本研究は、すべての主痛推定タスクにおける有効性、効率、一般化能力を示す、最先端のパフォーマンスを示す。
論文 参考訳(メタデータ) (2024-12-19T17:45:08Z) - Synthetic Time Series Data Generation for Healthcare Applications: A PCG Case Study [43.28613210217385]
我々は、PCGデータを生成するために、最先端の3つの生成モデルを採用し、比較する。
その結果,生成したPCGデータは元のデータセットによく似ていることがわかった。
今後の研究では、この手法をデータ拡張パイプラインに組み込んで、異常なPCG信号を心臓の大腿骨で合成する予定である。
論文 参考訳(メタデータ) (2024-12-17T18:07:40Z) - Clinical Evaluation of Medical Image Synthesis: A Case Study in Wireless Capsule Endoscopy [63.39037092484374]
人工知能(AI)に基づく合成データ生成は、臨床医学の届け方を変えることができる。
本研究は,無線カプセル内視鏡(WCE)画像を用いた炎症性腸疾患(IBD)の診断における概念実証による医療用SDGの臨床評価に焦点を当てた。
その結果、TIDE-IIは、最先端の生成モデルと比較して品質が向上し、臨床的に可塑性で、非常に現実的なWCE画像を生成することがわかった。
論文 参考訳(メタデータ) (2024-10-31T19:48:50Z) - Towards Synthetic Data Generation for Improved Pain Recognition in Videos under Patient Constraints [11.515273901289472]
本研究では、合成データを活用して、ビデオに基づく痛み認識モデルを強化する新しいアプローチを提案する。
本稿では,小さな参加者プールからニュアンスな顔の動きを捉え,リアルな3次元顔モデルを合成するパイプラインを提案する。
このプロセスは8,600個の合成顔を生成し、様々な角度と視点から本物の痛み表現を正確に反映する。
論文 参考訳(メタデータ) (2024-09-24T18:33:57Z) - Transformer with Leveraged Masked Autoencoder for video-based Pain Assessment [11.016004057765185]
我々は、トランスフォーマーに基づくディープラーニングモデルにおいて、顔画像解析を用いて、痛み認識を強化する。
強力なMasked AutoencoderとTransformersベースの分類器を組み合わせることで,表現とマイクロ表現の両方を通じて痛みレベルインジケータを効果的にキャプチャする。
論文 参考訳(メタデータ) (2024-09-08T13:14:03Z) - Twins-PainViT: Towards a Modality-Agnostic Vision Transformer Framework for Multimodal Automatic Pain Assessment using Facial Videos and fNIRS [0.9668407688201359]
The First Multimodal Sensing Grand Challenge for Next-Gen Pain Assessment (AI4PAIN)に応募した。
提案するマルチモーダルフレームワークは,顔ビデオとfNIRSを利用して,ドメイン固有モデルの必要性を軽減し,モダリティに依存しないアプローチを提案する。
論文 参考訳(メタデータ) (2024-07-29T09:02:43Z) - Machine Learning for ALSFRS-R Score Prediction: Making Sense of the Sensor Data [44.99833362998488]
筋萎縮性側索硬化症(Amyotrophic Lateral Sclerosis、ALS)は、急速に進行する神経変性疾患である。
iDPP@CLEF 2024チャレンジを先導した今回の調査は,アプリから得られるセンサデータを活用することに焦点を当てている。
論文 参考訳(メタデータ) (2024-07-10T19:17:23Z) - CathFlow: Self-Supervised Segmentation of Catheters in Interventional Ultrasound Using Optical Flow and Transformers [66.15847237150909]
縦型超音波画像におけるカテーテルのセグメンテーションのための自己教師型ディープラーニングアーキテクチャを提案する。
ネットワークアーキテクチャは、Attention in Attentionメカニズムで構築されたセグメンテーショントランスフォーマであるAiAReSeg上に構築されている。
我々は,シリコンオルタファントムから収集した合成データと画像からなる実験データセット上で,我々のモデルを検証した。
論文 参考訳(メタデータ) (2024-03-21T15:13:36Z) - Learning to Estimate Critical Gait Parameters from Single-View RGB
Videos with Transformer-Based Attention Network [0.0]
本稿では,一眼レフカメラで撮影したRGBビデオから重要な歩行パラメータを推定するトランスフォーマーネットワークを提案する。
脳性麻痺患者の公的データセットに関する実証的な評価は、このフレームワークが現在の最先端のアプローチを超越していることを示している。
論文 参考訳(メタデータ) (2023-12-01T07:45:27Z) - MC-ViViT: Multi-branch Classifier-ViViT to detect Mild Cognitive
Impairment in older adults using facial videos [44.72781467904852]
本稿では, 顔の特徴を解析することによって, 正常な認知能力を持つ者との区別を目的とした, マルチブランチ・ビデオ・ビジョン・トランスフォーマ (MCViViT) モデルを提案する。
このデータは、頻繁なビデオチャットを提供することで認知機能を改善することを目的とした行動介入試験であるI-CONECTから得られたものだ。
I-CONECTデータセットの実験結果は、MC-ViViTがMCIを90.63%の精度で予測する大きな可能性を示している。
論文 参考訳(メタデータ) (2023-04-11T15:42:20Z) - Tele-EvalNet: A Low-cost, Teleconsultation System for Home based
Rehabilitation of Stroke Survivors using Multiscale CNN-LSTM Architecture [7.971065005161566]
本稿では,ライブフィードバックモデルと全体的なパフォーマンス評価モデルという,2つのコンポーネントからなる新しいシステムであるTele-EvalNetを提案する。
ライブフィードバックモデルは、カラーマーカーを使用してハイライトされた指示を簡単に理解し、エクササイズ正しさに関するフィードバックを示す。
総合的なパフォーマンス評価モデルでは,臨床医の成績に応じて,関節データのスコアへのマッピングを学習する。
論文 参考訳(メタデータ) (2021-12-06T16:58:00Z) - Lung Cancer Lesion Detection in Histopathology Images Using Graph-Based
Sparse PCA Network [93.22587316229954]
ヘマトキシリンとエオシン(H&E)で染色した組織学的肺スライドにおける癌病変の自動検出のためのグラフベーススパース成分分析(GS-PCA)ネットワークを提案する。
我々は,SVM K-rasG12D肺がんモデルから得られたH&Eスライダーの精度・リコール率,Fスコア,谷本係数,レシーバ演算子特性(ROC)の曲線下領域を用いて,提案アルゴリズムの性能評価を行った。
論文 参考訳(メタデータ) (2021-10-27T19:28:36Z) - One-shot action recognition towards novel assistive therapies [63.23654147345168]
この作業は、アクション模倣ゲームを含む医療療法の自動分析によって動機づけられます。
提案手法は、異種運動データ条件を標準化する前処理ステップを組み込んだものである。
自閉症者に対するセラピー支援のための自動ビデオ分析の実際の利用事例について検討した。
論文 参考訳(メタデータ) (2021-02-17T19:41:37Z) - Two-Stream Deep Feature Modelling for Automated Video Endoscopy Data
Analysis [45.19890687786009]
内視鏡画像解析のための2ストリームモデルを提案する。
本モデルでは,2つの深い特徴入力を融合させ,それらの関係関係を新たな関係ネットワークモデルによりマッピングする。
論文 参考訳(メタデータ) (2020-07-12T05:24:08Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。