論文の概要: Detection of Intoxicated Individuals from Facial Video Sequences via a Recurrent Fusion Model
- arxiv url: http://arxiv.org/abs/2512.04536v1
- Date: Thu, 04 Dec 2025 07:34:04 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-12-05 21:11:46.04975
- Title: Detection of Intoxicated Individuals from Facial Video Sequences via a Recurrent Fusion Model
- Title(参考訳): リカレントフュージョンモデルによる顔面映像からの酔っぱらい者の検出
- Authors: Bita Baroutian, Atefe Aghaei, Mohsen Ebrahimi Moghaddam,
- Abstract要約: 本研究はアルコール中毒の検出を目的とした,新規な顔の配列解析手法を提案する。
この手法は、3D ResNetを用いて抽出した視覚的特徴とグラフ注意ネットワーク(GAT)を介して顔のランドマーク解析を統合する。
実験の結果,従来の手法よりも95.82%の精度,0.977の精度,0.97のリコールが得られた。
- 参考スコア(独自算出の注目度): 0.4779196219827507
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Alcohol consumption is a significant public health concern and a major cause of accidents and fatalities worldwide. This study introduces a novel video-based facial sequence analysis approach dedicated to the detection of alcohol intoxication. The method integrates facial landmark analysis via a Graph Attention Network (GAT) with spatiotemporal visual features extracted using a 3D ResNet. These features are dynamically fused with adaptive prioritization to enhance classification performance. Additionally, we introduce a curated dataset comprising 3,542 video segments derived from 202 individuals to support training and evaluation. Our model is compared against two baselines: a custom 3D-CNN and a VGGFace+LSTM architecture. Experimental results show that our approach achieves 95.82% accuracy, 0.977 precision, and 0.97 recall, outperforming prior methods. The findings demonstrate the model's potential for practical deployment in public safety systems for non-invasive, reliable alcohol intoxication detection.
- Abstract(参考訳): アルコール消費は公衆衛生上の重要な問題であり、世界中で事故や死亡の原因となっている。
本研究は, アルコール中毒の検出を目的とした, 新規なビデオベース顔画像解析手法を提案する。
この手法は3次元ResNetを用いて抽出した時空間視覚特徴とグラフ注意ネットワーク(GAT)を介して顔のランドマーク解析を統合する。
これらの特徴は適応的な優先順位付けによって動的に融合され、分類性能が向上する。
さらに,202人から抽出した3,542個のビデオセグメントからなるキュレートデータセットを導入し,トレーニングと評価を支援する。
我々のモデルは、カスタム3D-CNNとVGGFace+LSTMアーキテクチャの2つのベースラインと比較される。
実験の結果,従来の手法よりも95.82%の精度,0.977の精度,0.97のリコールが得られた。
この結果は、非侵襲的で信頼性の高いアルコール中毒検出のための公共安全システムへの実用的展開の可能性を示している。
関連論文リスト
- Direct Video-Based Spatiotemporal Deep Learning for Cattle Lameness Detection [0.0]
本研究では,公開されているビデオデータを用いた牛の乳腺自動検出のためのフレームワークを提案する。
2つのディープラーニングアーキテクチャをトレーニングし、評価した。
3D CNNは、精度、リコール、85%の精度でビデオレベルの分類精度を90%達成し、ConvLSD2モデルを上回った。
論文 参考訳(メタデータ) (2025-04-23T04:17:41Z) - Uncertainty Estimation for 3D Object Detection via Evidential Learning [63.61283174146648]
本稿では,3次元検出器における鳥の視線表示における明らかな学習損失を利用して,3次元物体検出の不確かさを定量化するためのフレームワークを提案する。
本研究では,これらの不確実性評価の有効性と重要性を,分布外シーンの特定,局所化の不十分な物体の発見,および(偽陰性)検出の欠如について示す。
論文 参考訳(メタデータ) (2024-10-31T13:13:32Z) - Accessible, At-Home Detection of Parkinson's Disease via Multi-task Video Analysis [3.1851272788128644]
既存のAIベースのパーキンソン病検出方法は、主にモータや音声タスクの単調な分析に焦点を当てている。
本稿では,このマルチモーダルデータを利用して診断精度を向上させる不確実性校正核融合ネットワーク(UFNet)を提案する。
UFNetは、精度、ORC曲線下(AUROC)の面積、非隣接特異性を維持しながら感度において、シングルタスクモデルよりも優れていた。
論文 参考訳(メタデータ) (2024-06-21T04:02:19Z) - Potion: Towards Poison Unlearning [47.00450933765504]
悪意あるアクターによる機械学習システムに対する敵対的攻撃は重大なリスクをもたらす。
このような攻撃を解決する上での課題は、実際に有毒データのサブセットのみを特定できる場合である。
我々の研究は、有毒未学習の最先端を推し進めるための2つの重要な課題に対処する。
論文 参考訳(メタデータ) (2024-06-13T14:35:11Z) - AiOS: All-in-One-Stage Expressive Human Pose and Shape Estimation [55.179287851188036]
人間のポーズと形状の復元のための新しいオールインワンステージフレームワークであるAiOSを、追加の人間検出ステップなしで導入する。
まず、画像中の人間の位置を探索し、各インスタンスのグローバルな機能をエンコードするために、人間のトークンを使用します。
そして、画像中の人間の関節を探索し、きめ細かい局所的特徴を符号化するジョイント関連トークンを導入する。
論文 参考訳(メタデータ) (2024-03-26T17:59:23Z) - TempNet: Temporal Attention Towards the Detection of Animal Behaviour in
Videos [63.85815474157357]
本稿では,映像中の生物学的行動を検出するための,効率的なコンピュータビジョンと深層学習に基づく手法を提案する。
TempNetはエンコーダブリッジと残留ブロックを使用して、2段階の空間的、そして時間的、エンコーダでモデル性能を維持する。
本研究では,サブルフィッシュ (Anoplopoma fimbria) 幼虫の検出への応用を実証する。
論文 参考訳(メタデータ) (2022-11-17T23:55:12Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。