論文の概要: Interpretable Temporal Facial-Region Motion Analysis for In-the-Wild Parkinson's Disease Video Classification
- arxiv url: http://arxiv.org/abs/2606.10088v1
- Date: Mon, 08 Jun 2026 19:15:39 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-06-10 15:40:58.147415
- Title: Interpretable Temporal Facial-Region Motion Analysis for In-the-Wild Parkinson's Disease Video Classification
- Title(参考訳): In-the-Wild Parkinson's Disease Video 分類における経時的顔面反射運動解析
- Authors: Riyadh Almushrafy,
- Abstract要約: 顔面表情低下はパーキンソン病(PD)の一般的な運動障害である
本稿では, 顔領域キーポイントから抽出した時間的動き記述子は, YouTubePDベンチマーク上で, 視線内PD関連映像分類をサポートできるかを検討する。
- 参考スコア(独自算出の注目度): 0.0
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Reduced facial expressivity is a common motor manifestation of Parkinson's disease (PD), often described as hypomimia or facial bradykinesia. This paper examines whether temporal motion descriptors extracted from facial-region keypoints can support in-the-wild PD-related video classification on the YouTubePD benchmark. Each video is represented using geometric descriptors from 14 predefined facial regions. Static geometry, normalized geometry, velocity-based descriptors, relative-velocity descriptors, and a GRU sequence baseline are compared under the same binary classification protocol. To assess stability and interpretability, the study includes seed-robustness analysis, region-level ablation, and permutation importance. The best result is obtained with normalized velocity descriptors and a Random Forest classifier, reaching a balanced accuracy of 0.826 and an AUROC of 0.855 on the held-out test split. Across 10 random seeds, this representation remains stable, with balanced accuracy of 0.810 +/- 0.018 and AUROC of 0.855 +/- 0.005. Overall, the results suggest that normalized facial-region motion is a lightweight and interpretable representation for YouTubePD video classification. The study is framed as a benchmark-level analysis and does not claim clinical severity assessment or MDS-UPDRS facial-expression scoring.
- Abstract(参考訳): 顔の表現力の低下はパーキンソン病(PD)の一般的な運動障害であり、視力低下や顔面性ブラジキネジアと診断されることが多い。
本稿では, 顔領域のキーポイントから抽出した時間的動き記述子は, YouTubePDベンチマーク上で, 画像分類の幅内をサポートできるかを検討する。
各ビデオは、予め定義された14の顔領域の幾何学的記述子を用いて表現される。
静的幾何、正規化幾何、速度ベース記述子、相対速度記述子、GRUシーケンスベースラインを同じバイナリ分類プロトコルで比較する。
この研究は、安定性と解釈可能性を評価するために、種子のロバスト性分析、地域レベルのアブレーション、置換の重要性を含む。
最もよい結果は、標準速度記述子とランダムフォレスト分類子で得られ、保留試験分割時の平衡精度0.826とAUROC0.855に達する。
10個のランダム種子に対して、この表現は安定であり、精度は0.810 +/- 0.018、AUROCは0.855 +/- 0.005である。
以上の結果から,正常化顔面領域運動は,YouTubePDビデオ分類における軽量かつ解釈可能な表現であることが示唆された。
この研究は、ベンチマークレベルの分析であり、臨床の重症度評価やMDS-UPDRSの表情評価は主張していない。
関連論文リスト
- MVRD-Bench: Multi-View Learning and Benchmarking for Dynamic Remote Photoplethysmography under Occlusion [38.964013784587436]
リモート光胸腺撮影(Remote Photoplethysmography, CFA)は、顔画像の微妙な肌の色変化を分析し、生理的信号を推定するノンコンタクト技術である。
既存のrメソッドは、静的およびシングルビューの顔ビデオに依存するため、顔の動きやシナリオ下での性能劣化に遭遇することが多い。
本研究は、多視点顔ビデオにおけるr測定における運動誘発リズム閉塞問題に対処することに焦点を当てる。
論文 参考訳(メタデータ) (2026-03-24T06:01:56Z) - Hide-and-Seek Attribution: Weakly Supervised Segmentation of Vertebral Metastases in CT [68.09387763135236]
脊椎レベルの健康・悪性のラベルにのみ、病変マスクを伴わずに訓練を施した弱い指導方法を提案する。
マスクの監視がないにも関わらず,強い爆発・解析性能を達成する。
論文 参考訳(メタデータ) (2025-12-07T14:03:28Z) - Passive Dementia Screening via Facial Temporal Micro-Dynamics Analysis of In-the-Wild Talking-Head Video [23.99097268182305]
短時間のトーキングヘッドビデオによる受動的認知症スクリーニングを対象とする。
早期神経認知変化の言語自由検出のための顔時間マイクロダイナミクス解析を開発した。
論文 参考訳(メタデータ) (2025-11-17T11:14:30Z) - PAL-Net: A Point-Wise CNN with Patch-Attention for 3D Facial Landmark Localization [0.4637385034504733]
3D顔スキャンにおける解剖学的ランドマークのマニュアルアノテーションは、時間と専門性に依存したタスクである。
本研究は,50個の解剖学的ランドマークをステレオフォトグラム法顔モデル上に局在させる完全自動ディープラーニングパイプライン(PALNet)を提案する。
論文 参考訳(メタデータ) (2025-10-01T13:52:35Z) - Comparison of retinal regions-of-interest imaged by OCT for the
classification of intermediate AMD [3.0171643773711208]
269名の中間AMD患者と115名の健常者から15744名のBスキャンを行った。
各サブセットについて、畳み込みニューラルネットワーク(VGG16アーキテクチャに基づいて、ImageNetで事前トレーニングされた)をトレーニングし、テストした。
モデルの性能は, 受信動作特性(AUROC), 精度, 感度, 特異性に基づいて評価した。
論文 参考訳(メタデータ) (2023-05-04T13:48:55Z) - Corneal endothelium assessment in specular microscopy images with Fuchs'
dystrophy via deep regression of signed distance maps [48.498376125522114]
本稿では,UNetをベースとしたセグメンテーション手法を提案する。
これは、フックスのジストロフィーの全度にわたって、信頼できるCE形態計測と腸骨同定を実現する。
論文 参考訳(メタデータ) (2022-10-13T15:34:20Z) - Automated SSIM Regression for Detection and Quantification of Motion
Artefacts in Brain MR Images [54.739076152240024]
磁気共鳴脳画像における運動アーチファクトは重要な問題である。
MR画像の画質評価は,臨床診断に先立って基本的である。
構造類似度指数(SSIM)回帰に基づく自動画像品質評価法が提案されている。
論文 参考訳(メタデータ) (2022-06-14T10:16:54Z) - Prediction of progressive lens performance from neural network
simulations [62.997667081978825]
本研究の目的は,畳み込みニューラルネットワーク(CNN)に基づく視覚的視力(VA)予測の枠組みを提案することである。
提案する総合シミュレーションツールは主観的視覚性能の正確なモデルとして機能することが示されている。
論文 参考訳(メタデータ) (2021-03-19T14:51:02Z) - Unsupervised Learning Facial Parameter Regressor for Action Unit
Intensity Estimation via Differentiable Renderer [51.926868759681014]
骨駆動型顔モデル(BDFM)に基づいて,異なる視点で顔パラメータを予測する枠組みを提案する。
提案するフレームワークは,特徴抽出器,ジェネレータ,顔パラメータ回帰器から構成される。
論文 参考訳(メタデータ) (2020-08-20T09:49:13Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。