論文の概要: HST-HGN: Heterogeneous Spatial-Temporal Hypergraph Networks with Bidirectional State Space Models for Global Fatigue Assessment
- arxiv url: http://arxiv.org/abs/2604.08435v1
- Date: Thu, 09 Apr 2026 16:36:43 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-04-10 18:34:06.027435
- Title: HST-HGN: Heterogeneous Spatial-Temporal Hypergraph Networks with Bidirectional State Space Models for Global Fatigue Assessment
- Title(参考訳): HST-HGN:グローバル疲労評価のための双方向状態空間モデルを持つ異種空間時間ハイパーグラフネットワーク
- Authors: Changdao Chen,
- Abstract要約: HST-HGNは多モードテクスチャパッチを動的に融合する新しいネットワークである。
時間的観点では、線形複雑性を持つBi-Mambaモジュールを用いて双方向シーケンスモデリングを行う。
本手法は判別能力と計算効率のバランスを保ち、リアルタイムのキャビン内エッジ展開に適している。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: It remains challenging to assess driver fatigue from untrimmed videos under constrained computational budgets, due to the difficulty of modeling long-range temporal dependencies in subtle facial expressions. Some existing approaches rely on computationally heavy architectures, whereas others employ traditional lightweight pairwise graph networks, despite their limited capacity to model high-order synergies and global temporal context. Therefore, we propose HST-HGN, a novel Heterogeneous Spatial-Temporal Hypergraph Network driven by Bidirectional State Space Models. Spatially, we introduce a hierarchical hypergraph network to fuse pose-disentangled geometric topologies with multi-modal texture patches dynamically. This formulation encapsulates high-order synergistic facial deformations, effectively overcoming the limitations of conventional methods. In temporal terms, a Bi-Mamba module with linear complexity is applied to perform bidirectional sequence modeling. This explicit temporal-evolution filtering enables the network to distinguish highly ambiguous transient actions, such as yawning versus speaking, while encompassing their complete physiological lifecycles. Extensive evaluations across diverse fatigue benchmarks demonstrate that HST-HGN achieves state-of-the-art performance. In particular, our method strikes a balance between discriminative power and computational efficiency, making it well-suited for real-time in-cabin edge deployment.
- Abstract(参考訳): 微妙な表情で長時間の時間的依存をモデル化することが困難であるため、制限された計算予算の下で未修正ビデオからドライバの疲労を評価することは依然として困難である。
既存のアプローチは計算的に重いアーキテクチャに依存しているが、一方では高次のシナジーとグローバルな時間的文脈をモデル化する能力に制限があるにもかかわらず、従来の軽量なペアワイズグラフネットワークを使用している。
そこで本稿では,HST-HGNを提案する。
空間的に,複数モードのテクスチャ・パッチを動的に融合する階層型ハイパーグラフ・ネットワークを導入する。
この定式化は、高次相乗的顔変形をカプセル化し、従来の方法の限界を効果的に克服する。
時間的観点では、線形複雑性を持つBi-Mambaモジュールを用いて双方向シーケンスモデリングを行う。
この明示的な時間進化フィルタリングにより、ネットワークは、その完全な生理的ライフサイクルを包含しながら、あくびと話しなどの非常に曖昧な過渡的な行動を区別することができる。
HST-HGNが最先端の性能を発揮することを示す。
特に,本手法は判別能力と計算効率のバランスを保ち,リアルタイムのキャビン内エッジ展開に適している。
関連論文リスト
- Forecasting as Rendering: A 2D Gaussian Splatting Framework for Time Series Forecasting [79.37674445572462]
時系列予測(TSF)は、周期内変動と周期間トレンドの複雑な絡み合いのため、依然として困難な問題である。
形状変化テンソルを静止画像として扱うと、トポロジカルミスマッチが発生する。
均一な固定サイズの表現に依存することは、モデリング能力を非効率に割り当てる。
TimeGSは、予測パラダイムをレグレッションから2D生成レンダリングに根本的にシフトする、新しいフレームワークである。
論文 参考訳(メタデータ) (2026-02-10T14:13:36Z) - Signal-SGN++: Topology-Enhanced Time-Frequency Spiking Graph Network for Skeleton-Based Action Recognition [0.23332469289621785]
スパイキングニューラルネットワーク(SNN)はエネルギー効率を提供するが、人間の動きの時間的・時間的・位相的依存関係を捉えるには限界がある。
本稿では、適応性と時間周波数スパイキングダイナミクスを統合するトポロジ対応スパイキンググラフフレームワークであるSignal-SGN++を提案する。
論文 参考訳(メタデータ) (2025-12-22T09:16:04Z) - Time Extrapolation with Graph Convolutional Autoencoder and Tensor Train Decomposition [9.446359051690292]
非構造格子上のパラメータ化偏微分方程式に対する時間一貫性の縮小次数モデルを開発する。
特に、高忠実度スナップショットは、TT分解によるパラメトリック、空間、時間コアの組み合わせとして表現される。
我々はディープ・オペレーター・ネットワーク(DeepONet)のフレームワークにおける多要素二段階アプローチの開発により一般化性能を向上させる。
熱伝導, 対流拡散, 渦破断現象などの数値計算結果は, 複雑な測地における外挿系における力学を効果的に学習する上で, 優れた性能を示した。
論文 参考訳(メタデータ) (2025-11-28T09:59:17Z) - Adaptive Mesh-Quantization for Neural PDE Solvers [51.26961483962011]
グラフニューラルネットワークは複雑なジオメトリや境界条件に必要な不規則なメッシュを処理できるが、それでもすべてのノードで一様計算処理を適用できる。
適応メッシュ量子化(Adaptive Mesh Quantization): メッシュノード,エッジ,クラスタ特徴間の空間適応量子化であり,量子化モデルで使用されるビット幅を動的に調整する。
我々は,MP-PDEとGraphViTという2つの最先端モデルと統合して,複数のタスクのパフォーマンスを評価することで,フレームワークの有効性を実証する。
論文 参考訳(メタデータ) (2025-11-23T14:47:24Z) - PHASE-Net: Physics-Grounded Harmonic Attention System for Efficient Remote Photoplethysmography Measurement [63.007237197267834]
既存のディープラーニング手法は、主に生理学的モニタリングであり、理論的な堅牢性を欠いている。
本研究では,Navier-Stokes方程式のヘモダイナミックスから導かれる物理インフォームド r パラダイムを提案し,パルス信号が2次系に従うことを示す。
これは、時間的円錐ネットワーク(TCN)を使用する理論的正当性を提供する。
Phase-Netは高い効率で最先端のパフォーマンスを実現し、理論上は基礎的でデプロイ可能な r ソリューションを提供する。
論文 参考訳(メタデータ) (2025-09-29T14:36:45Z) - Unfolding Framework with Complex-Valued Deformable Attention for High-Quality Computer-Generated Hologram Generation [15.017958264826511]
コンピュータ生成ホログラフィー(CGH)はディープラーニングに基づくアルゴリズムで広く注目を集めている。
本稿では,勾配降下を2つのモジュールに分解するDeep Unfolding Network (DUN)を提案する。
論文 参考訳(メタデータ) (2025-08-29T14:21:22Z) - Learning to Dissipate Energy in Oscillatory State-Space Models [51.98491034847041]
状態空間モデル (SSM) はシーケンス学習のためのネットワークのクラスである。
我々は,D-LinOSSがLinOSSの手法を長距離学習タスクで一貫して上回っていることを示す。
論文 参考訳(メタデータ) (2025-05-17T23:15:17Z) - Contextualizing MLP-Mixers Spatiotemporally for Urban Data Forecast at Scale [54.15522908057831]
本稿では,STTD予測を大規模に行うためのコンピュータ・ミクサーの適応版を提案する。
我々の結果は、この単純な効率の良いソリューションが、いくつかのトラフィックベンチマークでテストした場合、SOTAベースラインに匹敵する可能性があることを驚くほど示している。
本研究は, 実世界のSTTD予測において, 簡便な有効モデルの探索に寄与する。
論文 参考訳(メタデータ) (2023-07-04T05:19:19Z) - Discrete-time Temporal Network Embedding via Implicit Hierarchical
Learning in Hyperbolic Space [43.280123606888395]
双曲幾何学の指数的能力と階層的認識を生かした双曲時間グラフネットワーク(HTGN)を提案する。
HTGNは、時間グラフを双曲空間にマッピングし、双曲グラフニューラルネットワークと双曲ゲートリカレントニューラルネットワークを組み込む。
複数の実世界のデータセットに対する実験結果は、時間グラフ埋め込みにおけるHTGNの優位性を示している。
論文 参考訳(メタデータ) (2021-07-08T11:24:59Z) - Spatial-Temporal Graph ODE Networks for Traffic Flow Forecasting [22.421667339552467]
時空間予測は幅広い応用において大きな注目を集めており、交通流予測は標準的で典型的な例である。
既存の研究は通常、浅いグラフ畳み込みネットワーク(GNN)と時間的抽出モジュールを使用して、それぞれ空間的および時間的依存関係をモデル化する。
テンソル型常微分方程式(ODE)を用いて時空間ダイナミクスを捉える時空間グラフ正規微分方程式ネットワーク(STGODE)を提案する。
我々は,複数の実世界の交通データセット上でモデルを評価し,最先端のベースライン上で優れた性能を実現する。
論文 参考訳(メタデータ) (2021-06-24T11:48:45Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。