論文の概要: BigSmall: Efficient Multi-Task Learning for Disparate Spatial and
Temporal Physiological Measurements
- arxiv url: http://arxiv.org/abs/2303.11573v2
- Date: Fri, 17 Nov 2023 09:33:22 GMT
- ステータス: 処理完了
- システム内更新日: 2023-11-22 20:14:54.825596
- Title: BigSmall: Efficient Multi-Task Learning for Disparate Spatial and
Temporal Physiological Measurements
- Title(参考訳): BigSmall: 異なる空間的・時間的生理的計測のための効率的なマルチタスク学習
- Authors: Girish Narayanswamy, Yujia Liu, Yuzhe Yang, Chengqian Ma, Xin Liu,
Daniel McDuff, Shwetak Patel
- Abstract要約: 生理・行動計測のための効率的なアーキテクチャであるBigSmallを提案する。
本稿では,時間シフトモジュールをラップしたマルチブランチネットワークを提案する。
- 参考スコア(独自算出の注目度): 28.573472322978507
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Understanding of human visual perception has historically inspired the design
of computer vision architectures. As an example, perception occurs at different
scales both spatially and temporally, suggesting that the extraction of salient
visual information may be made more effective by paying attention to specific
features at varying scales. Visual changes in the body due to physiological
processes also occur at different scales and with modality-specific
characteristic properties. Inspired by this, we present BigSmall, an efficient
architecture for physiological and behavioral measurement. We present the first
joint camera-based facial action, cardiac, and pulmonary measurement model. We
propose a multi-branch network with wrapping temporal shift modules that yields
both accuracy and efficiency gains. We observe that fusing low-level features
leads to suboptimal performance, but that fusing high level features enables
efficiency gains with negligible loss in accuracy. Experimental results
demonstrate that BigSmall significantly reduces the computational costs.
Furthermore, compared to existing task-specific models, BigSmall achieves
comparable or better results on multiple physiological measurement tasks
simultaneously with a unified model.
- Abstract(参考訳): 人間の視覚知覚を理解することは、歴史的にコンピュータビジョンアーキテクチャの設計に影響を与えた。
例えば、知覚は空間的にも時間的にも異なるスケールで起こり、様々なスケールで特定の特徴に注意を向けることで、突出した視覚情報の抽出をより効果的にできることを示唆している。
生理的過程による身体の視覚的変化は、異なるスケールとモダリティ特有の特性で起こる。
これに触発されて,生理的および行動的計測のための効率的なアーキテクチャであるbig smallを提案する。
本稿では,最初のジョイントカメラを用いた顔面動作,心臓および肺計測モデルを提案する。
本稿では,時間シフトモジュールをラップしたマルチブランチネットワークを提案する。
我々は,低レベル特徴の活用は低最適性能につながるが,高レベル特徴の活用は精度を損なうことなく効率の向上を可能にすることを観察する。
実験の結果,BigSmallは計算コストを大幅に削減することがわかった。
さらに、既存のタスク固有のモデルと比較して、bigsmallは、統一モデルと同時に複数の生理的測定タスクで同等またはより良い結果を得る。
関連論文リスト
- Sparse Models for Machine Learning [0.2900810893770134]
スパース・モデリングは パーシモニーの原理を捉えた 明らかな証拠だ
統計学において、スパースモデリングの多くの応用は、回帰、分類、グラフィカルモデル選択、スパースM推定器、スパース次元減少にまたがる。
また、画像の認知、セグメンテーション、復元とスーパーレゾリューション、視覚シーンにおける物体または顔の検出と認識、行動認識など、様々な人工視覚タスクに直接関連している。
論文 参考訳(メタデータ) (2023-08-26T21:32:13Z) - Understanding Self-attention Mechanism via Dynamical System Perspective [58.024376086269015]
SAM(Self-attention mechanism)は、人工知能の様々な分野で広く使われている。
常微分方程式(ODE)の高精度解における固有剛性現象(SP)は,高性能ニューラルネットワーク(NN)にも広く存在することを示す。
SAMは、本質的なSPを測定するためのモデルの表現能力を高めることができる剛性対応のステップサイズ適応器でもあることを示す。
論文 参考訳(メタデータ) (2023-08-19T08:17:41Z) - Predicting Biomedical Interactions with Probabilistic Model Selection
for Graph Neural Networks [5.156812030122437]
現在の生物学的ネットワークは、ノイズ、スパース、不完全であり、そのような相互作用の実験的同定には時間と費用がかかる。
ディープグラフニューラルネットワークは、グラフ構造データモデリングの有効性を示し、バイオメディカル相互作用予測において優れた性能を達成した。
提案手法により,グラフ畳み込みネットワークは,その深度を動的に適応し,対話数の増加に対応することができる。
論文 参考訳(メタデータ) (2022-11-22T20:44:28Z) - Impact of spiking neurons leakages and network recurrences on
event-based spatio-temporal pattern recognition [0.0]
ニューロモルフィックハードウェアとイベントベースのセンサーを組み合わせたスパイクニューラルネットワークは、エッジにおける低レイテンシと低パワー推論への関心が高まっている。
スパイキングニューロンにおけるシナプスおよび膜漏れの影響について検討する。
論文 参考訳(メタデータ) (2022-11-14T21:34:02Z) - Efficient Representation of Natural Image Patches [1.2179089070956926]
初期視覚システムの2つの目的 - 効率的な情報伝達とセンサ確率分布モデリング - を実現する方法を示す。
本稿では, 2 ピクセル (2D) システムとイメージパッチを用いて, 2 種類の生物可塑性損失関数によって駆動される非線形集団コードにより, 効率的な表現を実現することができることを示す。
論文 参考訳(メタデータ) (2022-10-24T07:50:02Z) - Perception Over Time: Temporal Dynamics for Robust Image Understanding [5.584060970507506]
ディープラーニングは、狭く特定の視覚タスクにおいて、人間レベルのパフォーマンスを上回る。
人間の視覚知覚は入力刺激の変化に対して、桁違いに頑丈である。
静的画像理解に時間力学を取り入れた新しい手法を提案する。
論文 参考訳(メタデータ) (2022-03-11T21:11:59Z) - Deep Collaborative Multi-Modal Learning for Unsupervised Kinship
Estimation [53.62256887837659]
キンシップ検証は、コンピュータビジョンにおける長年の研究課題である。
本稿では,顔特性に表される基礎情報を統合するために,新しい協調型多モーダル学習(DCML)を提案する。
我々のDCML法は、常に最先端のキンシップ検証法よりも優れている。
論文 参考訳(メタデータ) (2021-09-07T01:34:51Z) - On the Robustness of Pretraining and Self-Supervision for a Deep
Learning-based Analysis of Diabetic Retinopathy [70.71457102672545]
糖尿病網膜症における訓練方法の違いによる影響を比較検討した。
本稿では,定量的性能,学習した特徴表現の統計,解釈可能性,画像歪みに対する頑健性など,さまざまな側面について検討する。
以上の結果から,ImageNet事前学習モデルでは,画像歪みに対する性能,一般化,堅牢性が著しく向上していることが示唆された。
論文 参考訳(メタデータ) (2021-06-25T08:32:45Z) - Emergent Hand Morphology and Control from Optimizing Robust Grasps of
Diverse Objects [63.89096733478149]
多様な物体をつかむために、効果的なハンドデザインが自然に現れるデータ駆動型アプローチを紹介します。
形態と把持スキルを共同で効率的に設計するベイズ最適化アルゴリズムを開発した。
我々は,新しい物体をつかむための堅牢で費用効率のよい手形態を発見するためのアプローチの有効性を実証する。
論文 参考訳(メタデータ) (2020-12-22T17:52:29Z) - Video-based Remote Physiological Measurement via Cross-verified Feature
Disentangling [121.50704279659253]
非生理的表現と生理的特徴を混同するための横断的特徴分離戦略を提案する。
次に, 蒸留された生理特性を用いて, 頑健なマルチタスク生理測定を行った。
歪んだ特徴は、最終的に平均HR値やr信号のような複数の生理的信号の合同予測に使用される。
論文 参考訳(メタデータ) (2020-07-16T09:39:17Z) - A Trainable Optimal Transport Embedding for Feature Aggregation and its
Relationship to Attention [96.77554122595578]
固定サイズのパラメータ化表現を導入し、与えられた入力セットから、そのセットとトレーニング可能な参照の間の最適な輸送計画に従って要素を埋め込み、集約する。
我々のアプローチは大規模なデータセットにスケールし、参照のエンドツーエンドのトレーニングを可能にすると同時に、計算コストの少ない単純な教師なし学習メカニズムも提供する。
論文 参考訳(メタデータ) (2020-06-22T08:35:58Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。