論文の概要: EfficientPhys: Enabling Simple, Fast and Accurate Camera-Based Vitals
Measurement
- arxiv url: http://arxiv.org/abs/2110.04447v1
- Date: Sat, 9 Oct 2021 03:51:26 GMT
- ステータス: 処理完了
- システム内更新日: 2021-10-12 16:06:58.424992
- Title: EfficientPhys: Enabling Simple, Fast and Accurate Camera-Based Vitals
Measurement
- Title(参考訳): EfficientPhys: シンプルで高速で正確なカメラベースの生体計測
- Authors: Xin Liu, Brian L. Hill, Ziheng Jiang, Shwetak Patel, Daniel McDuff
- Abstract要約: EfficientPhysと呼ばれるカメラによる生理的計測のための2つの新しいニューラルモデルを提案する。
我々のモデルは3つの公開データセットで最先端の精度を達成する。
- 参考スコア(独自算出の注目度): 5.435325323159416
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Camera-based physiological measurement is a growing field with neural models
providing state-the-art-performance. Prior research have explored various
``end-to-end'' models; however these methods still require several
preprocessing steps. These additional operations are often non-trivial to
implement making replication and deployment difficult and can even have a
higher computational budget than the ``core'' network itself. In this paper, we
propose two novel and efficient neural models for camera-based physiological
measurement called EfficientPhys that remove the need for face detection,
segmentation, normalization, color space transformation or any other
preprocessing steps. Using an input of raw video frames, our models achieve
state-of-the-art accuracy on three public datasets. We show that this is the
case whether using a transformer or convolutional backbone. We further evaluate
the latency of the proposed networks and show that our most light weight
network also achieves a 33% improvement in efficiency.
- Abstract(参考訳): カメラに基づく生理学的測定は、最先端技術を提供するニューラルモデルで成長する分野である。
以前の研究では様々な ‘end-to-end' モデルが研究されてきたが、これらの手法はいくつかの前処理を必要とする。
これらの追加操作は、レプリケーションやデプロイメントを困難にすることは簡単ではなく、‘core’ネットワーク自体よりも高い計算予算を持つこともある。
本稿では, 顔検出, セグメンテーション, 正規化, 色空間変換, その他の前処理ステップを不要とする, カメラを用いた生理的計測のための2つの新しい, 効率的なニューラルモデルを提案する。
生のビデオフレームの入力を用いて,3つの公開データセットにおいて最先端の精度を実現する。
トランスフォーマーを使うか,あるいは畳み込みバックボーンを使うかは,この場合である。
さらに,提案するネットワークのレイテンシを評価し,最も軽量なネットワークが33%の効率向上を実現していることを示す。
関連論文リスト
- Task-Oriented Real-time Visual Inference for IoVT Systems: A Co-design Framework of Neural Networks and Edge Deployment [61.20689382879937]
タスク指向エッジコンピューティングは、データ分析をエッジにシフトすることで、この問題に対処する。
既存の手法は、高いモデル性能と低いリソース消費のバランスをとるのに苦労している。
ニューラルネットワークアーキテクチャを最適化する新しい協調設計フレームワークを提案する。
論文 参考訳(メタデータ) (2024-10-29T19:02:54Z) - EM-Net: Efficient Channel and Frequency Learning with Mamba for 3D Medical Image Segmentation [3.6813810514531085]
我々は,EM-Netと呼ばれる新しい3次元医用画像セグメンテーションモデルを紹介し,その成功に触発されて,新しいマンバベースの3次元医用画像セグメンテーションモデルであるEM-Netを紹介した。
提案手法は,SOTAモデルのパラメータサイズをほぼ半分にし,訓練速度を2倍に向上させながら,より高精度なセグメンテーション精度を示すことを示す。
論文 参考訳(メタデータ) (2024-09-26T09:34:33Z) - SeUNet-Trans: A Simple yet Effective UNet-Transformer Model for Medical
Image Segmentation [0.0]
医用画像セグメンテーションのためのシンプルなUNet-Transformer(seUNet-Trans)モデルを提案する。
提案手法では,UNetモデルを特徴抽出器として設計し,入力画像から複数の特徴マップを生成する。
UNetアーキテクチャと自己認識機構を活用することで、我々のモデルはローカルとグローバルの両方のコンテキスト情報を保存するだけでなく、入力要素間の長距離依存関係をキャプチャできる。
論文 参考訳(メタデータ) (2023-10-16T01:13:38Z) - Sample Less, Learn More: Efficient Action Recognition via Frame Feature
Restoration [59.6021678234829]
本稿では,2つのスパースサンプリングおよび隣接するビデオフレームの中間特徴を復元する新しい手法を提案する。
提案手法の統合により, 一般的な3つのベースラインの効率は50%以上向上し, 認識精度は0.5%低下した。
論文 参考訳(メタデータ) (2023-07-27T13:52:42Z) - Neural Lens Modeling [50.57409162437732]
NeuroLens(ニューロレンス)は、点投影と光線鋳造に使用できる歪みと磁化のための神経レンズモデルである。
古典的なキャリブレーションターゲットを使用してプリキャプチャのキャリブレーションを行うことができ、後に3D再構成の際にキャリブレーションやリファインメントを行うために使用できる。
このモデルは、多くのレンズタイプにまたがって一般化されており、既存の3D再構成とレンダリングシステムとの統合は容易である。
論文 参考訳(メタデータ) (2023-04-10T20:09:17Z) - An Adversarial Active Sampling-based Data Augmentation Framework for
Manufacturable Chip Design [55.62660894625669]
リソグラフィーモデリングは、チップ設計マスクが製造可能であることを保証するため、チップ設計において重要な問題である。
機械学習の最近の進歩は、時間を要するリソグラフィーシミュレーションをディープニューラルネットワークに置き換えるための代替ソリューションを提供している。
本稿では,限られたデータのジレンマを解消し,機械学習モデルの性能を向上させるために,データ拡張フレームワークを提案する。
論文 参考訳(メタデータ) (2022-10-27T20:53:39Z) - Representing Camera Response Function by a Single Latent Variable and
Fully Connected Neural Network [14.27259159089287]
多くのコンピュータビジョンタスクにおいて、シーン照射から画像強度へのマッピングをモデル化することが不可欠である。
単一潜伏変数と完全連結ニューラルネットワークを用いた高性能カメラ応答モデルを提案する。
論文 参考訳(メタデータ) (2022-09-08T08:02:57Z) - GLEAM: Greedy Learning for Large-Scale Accelerated MRI Reconstruction [50.248694764703714]
アンロールされたニューラルネットワークは、最近最先端の加速MRI再構成を達成した。
これらのネットワークは、物理ベースの一貫性とニューラルネットワークベースの正規化を交互に組み合わせることで、反復最適化アルゴリズムをアンロールする。
我々は,高次元画像設定のための効率的なトレーニング戦略である加速度MRI再構成のためのグレディ・ラーニングを提案する。
論文 参考訳(メタデータ) (2022-07-18T06:01:29Z) - SpikiLi: A Spiking Simulation of LiDAR based Real-time Object Detection
for Autonomous Driving [0.0]
Spiking Neural Networksは、電力効率、計算効率、処理遅延を大幅に改善する新しいニューラルネットワーク設計アプローチである。
まず,複雑なディープラーニングタスク,すなわちLidarベースの3Dオブジェクト検出による自動運転への適用性について説明する。
論文 参考訳(メタデータ) (2022-06-06T20:05:17Z) - Searching for Efficient Architecture for Instrument Segmentation in
Robotic Surgery [58.63306322525082]
ほとんどのアプリケーションは、高解像度の外科画像の正確なリアルタイムセグメンテーションに依存している。
我々は,高解像度画像のリアルタイム推論を行うために調整された,軽量で高効率なディープ残差アーキテクチャを設計する。
論文 参考訳(メタデータ) (2020-07-08T21:38:29Z) - Deep Medical Image Analysis with Representation Learning and
Neuromorphic Computing [1.43494686131174]
回転やアフィン変換に頑健な表現を明示的に学習するカプセルネットワークを提案する。
第2に、最新のドメイン適応技術を活用して、新しい最先端の精度を実現する。
第3に、Intel Loihiニューロモルフィックチップでトレーニングされたスパイクニューラルネットワークを設計する。
論文 参考訳(メタデータ) (2020-05-11T20:56:37Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。