論文の概要: Ambivalence/Hesitancy Recognition in Videos for Personalized Digital Health Interventions
- arxiv url: http://arxiv.org/abs/2604.11730v2
- Date: Tue, 14 Apr 2026 11:00:18 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-04-15 14:01:13.525857
- Title: Ambivalence/Hesitancy Recognition in Videos for Personalized Digital Health Interventions
- Title(参考訳): パーソナライズされたデジタルヘルス・インターベンションのためのビデオのアンビバレンス/ヒーシテンシー認識
- Authors: Manuela González-González, Soufiane Belharbi, Muhammad Osama Zeeshan, Masoumeh Sharafi, Muhammad Haseeb Aslam, Lorenzo Sia, Nicolas Richet, Marco Pedersoli, Alessandro Lameiras Koerich, Simon L Bacon, Eric Granger,
- Abstract要約: A/H(Ambivalence and Hesitancy)は、個人が健康介入を遅らせたり、避けたり、放棄したりする主要な役割を担っている。
専門家はA/Hを認識するように訓練することができるが、それらをデジタルヘルス介入に統合することは費用がかかり、効果が低い。
本稿では,ビデオにおけるA/H認識の深層学習モデルの適用について検討する。
- 参考スコア(独自算出の注目度): 51.74800196847922
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Using behavioural science, health interventions focus on behaviour change by providing a framework to help patients acquire and maintain healthy habits that improve medical outcomes. In-person interventions are costly and difficult to scale, especially in resource-limited regions. Digital health interventions offer a cost-effective approach, potentially supporting independent living and self-management. Automating such interventions, especially through machine learning, has gained considerable attention recently. Ambivalence and hesitancy (A/H) play a primary role for individuals to delay, avoid, or abandon health interventions. A/H are subtle and conflicting emotions that place a person in a state between positive and negative evaluations of a behaviour, or between acceptance and refusal to engage in it. They manifest as affective inconsistency across modalities or within a modality, such as language, facial, vocal expressions, and body language. While experts can be trained to recognize A/H, integrating them into digital health interventions is costly and less effective. Automatic A/H recognition is therefore critical for the personalization and cost-effectiveness of digital health interventions. Here, we explore the application of deep learning models for A/H recognition in videos, a multi-modal task by nature. In particular, this paper covers three learning setups: supervised learning, unsupervised domain adaptation for personalization, and zero-shot inference via large language models (LLMs). Our experiments are conducted on the unique and recently published BAH video dataset for A/H recognition. Our results show limited performance, suggesting that more adapted multi-modal models are required for accurate A/H recognition. Better methods for modeling spatio-temporal and multimodal fusion are necessary to leverage conflicts within/across modalities.
- Abstract(参考訳): 行動科学を用いて、健康的な介入は、患者が医学的結果を改善する健康的な習慣を習得し維持するのを助ける枠組みを提供することによって、行動の変化に焦点を当てる。
対人介入は費用がかかり、特に資源限定の地域ではスケールが困難である。
デジタルヘルスの介入は費用対効果があり、独立生活と自己管理を支援する可能性がある。
このような介入、特に機械学習による自動化は、最近かなりの注目を集めている。
A/H(Ambivalence and Hesitancy)は、個人が健康介入を遅らせたり、避けたり、放棄したりする主要な役割を担っている。
A/Hは微妙で矛盾する感情であり、行動の肯定的評価と否定的評価の間、あるいは受け入れとそれへの関与を拒否する状態にある。
それらは、モダリティや、言語、顔、声の表情、ボディランゲージといったモダリティにまたがる感情的な不整合として表される。
専門家はA/Hを認識するように訓練することができるが、それらをデジタルヘルス介入に統合することは費用がかかり、効果が低い。
したがって、デジタルヘルス介入のパーソナライズと費用対効果には、自動A/H認識が重要である。
本稿では,ビデオにおけるA/H認識の深層学習モデルの適用について検討する。
特に、教師付き学習、パーソナライズのための教師なしドメイン適応、および大規模言語モデル(LLM)によるゼロショット推論の3つの学習設定について述べる。
本稿では,A/H認識のためのBAHビデオデータセットについて実験を行った。
以上の結果から,より適応的なマルチモーダルモデルがA/H認識に必要であることが示唆された。
時空間とマルチモーダルの融合をモデル化するためのより良い手法は、モダリティ間の衝突を利用するために必要である。
関連論文リスト
- Generative Experiences for Digital Mental Health Interventions: Evidence from a Randomized Study [56.17549485306432]
GUIDEは、パーソナライズされた介入内容とマルチモーダルインタラクション構造を生成するシステムである。
N = 237人の参加者による事前登録調査では、GUIDEはストレスを著しく減らし、ユーザエクスペリエンスを改善した。
この研究は、デジタル設定でサポートをどのように経験し、実施するかを動的に形成する介入の基礎を築いた。
論文 参考訳(メタデータ) (2026-04-08T19:59:28Z) - Airway Skill Assessment with Spatiotemporal Attention Mechanisms Using Human Gaze [2.125763116614213]
航空管理技術は救急医療において重要であり、通常主観的評価によって評価される。
本稿では,気道技能,特に気管内挿管(ETI)を評価するための機械学習アプローチを提案する。
提案システムは,ヒトの視線によって誘導される注意機構を利用して,成功・失敗のETI手順の認識を高める。
論文 参考訳(メタデータ) (2025-06-24T04:40:58Z) - GEMeX-RMCoT: An Enhanced Med-VQA Dataset for Region-Aware Multimodal Chain-of-Thought Reasoning [60.03671205298294]
医学的視覚的質問応答は、医学的イメージに基づいた自然言語的質問にモデルで答えることによって、臨床的な意思決定を支援することを目的としている。
現在の方法はまだ、答えの信頼性の制限と解釈性の低下に悩まされている。
この研究はまず、回答を生成するプロセスが中間的推論ステップのシーケンスに先行する領域対応マルチモーダル・チェーン・オブ・ソートデータセットを提案する。
論文 参考訳(メタデータ) (2025-06-22T08:09:58Z) - AutoMedEval: Harnessing Language Models for Automatic Medical Capability Evaluation [55.2739790399209]
本稿では,医療用LLMの質問応答能力を測定するために,13Bパラメータを用いたオープンソースの自動評価モデルAutoMedEvalを提案する。
AutoMedEvalの包括的な目的は、多様なモデルが生み出す応答の質を評価することであり、人間の評価への依存を著しく低減することを目的としている。
論文 参考訳(メタデータ) (2025-05-17T07:44:54Z) - Predicting Treatment Response in Body Dysmorphic Disorder with Interpretable Machine Learning [0.4604003661048266]
身体異形性障害(Body Dysmorphic Disorder, BDD)は、頻繁に診断される疾患である。
我々は、治療結果を予測するために複数の機械学習アプローチを採用している。
治療の信頼性は最も強力な予測因子として浮上した。
論文 参考訳(メタデータ) (2025-03-13T17:39:10Z) - AI-Driven Early Mental Health Screening: Analyzing Selfies of Pregnant Women [32.514036618021244]
うつ病や不安障害は世界中で何百万もの人に影響を与え、精神疾患の重荷に大きく貢献する。
早期スクリーニングは、精神疾患のタイムリーな同定が治療成績を大幅に改善するので、効果的な介入に不可欠である。
本研究は、顔中心の自撮りを与えられたユビキタスな抑うつ不安スクリーニングのためのAIモデルの可能性について検討する。
論文 参考訳(メタデータ) (2024-10-07T19:34:25Z) - Explainable Artificial Intelligence for Quantifying Interfering and High-Risk Behaviors in Autism Spectrum Disorder in a Real-World Classroom Environment Using Privacy-Preserving Video Analysis [2.286750720737624]
ビデオに基づくグループ活動認識技術の最新技術は、実世界の活動におけるASDの振る舞いを定量化できることを示す。
説明可能なモデルは、77%のF1スコアで問題行動のエピソードを検出し、ASDの異なる種類の行動の特徴を捉えることができる。
論文 参考訳(メタデータ) (2024-07-31T15:37:52Z) - I am Only Happy When There is Light: The Impact of Environmental Changes
on Affective Facial Expressions Recognition [65.69256728493015]
本研究では,異なる画像条件が人間の表情からの覚醒の認識に与える影響について検討した。
以上の結果から,人間の感情状態の解釈が肯定的,否定的に大きく異なることが示唆された。
論文 参考訳(メタデータ) (2022-10-28T16:28:26Z) - In-Bed Human Pose Estimation from Unseen and Privacy-Preserving Image
Domains [22.92165116962952]
ベッド内の人間の姿勢推定は、医療状況の評価において潜在的な価値を持つ重要な健康関連指標を提供する。
本稿では,マルチモーダル条件変分オートエンコーダ(MC-VAE)を提案する。
本研究は, 身体位置が利用可能なモダリティから効果的に認識できることを示し, ベースラインモデルと同等の結果が得られることを示した。
論文 参考訳(メタデータ) (2021-11-30T04:56:16Z) - Non-contact Pain Recognition from Video Sequences with Remote
Physiological Measurements Prediction [53.03469655641418]
痛み認識のための非接触方式で外観変化と生理的手がかりの両方を符号化する新しいマルチタスク学習フレームワークを提案する。
我々は、一般に利用可能な痛みデータベース上で、非接触痛認識の最先端性能を確立する。
論文 参考訳(メタデータ) (2021-05-18T20:47:45Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。