論文の概要: Single-stage intake gesture detection using CTC loss and extended prefix
beam search
- arxiv url: http://arxiv.org/abs/2008.02999v2
- Date: Sat, 21 Nov 2020 01:05:45 GMT
- ステータス: 翻訳完了
- システム内更新日: 2022-11-02 01:12:04.145491
- Title: Single-stage intake gesture detection using CTC loss and extended prefix
beam search
- Title(参考訳): ctc損失と拡張プレフィックスビーム探索を用いた単段吸入ジェスチャ検出
- Authors: Philipp V. Rouast and Marc T. P. Adam
- Abstract要約: 個々の摂取行動の正確な検出は、自動食事監視への重要なステップである。
本稿では,センサデータから得られた確率を直接,スパース摂取検出にデコードする単一ステージアプローチを提案する。
- 参考スコア(独自算出の注目度): 8.22379888383833
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Accurate detection of individual intake gestures is a key step towards
automatic dietary monitoring. Both inertial sensor data of wrist movements and
video data depicting the upper body have been used for this purpose. The most
advanced approaches to date use a two-stage approach, in which (i) frame-level
intake probabilities are learned from the sensor data using a deep neural
network, and then (ii) sparse intake events are detected by finding the maxima
of the frame-level probabilities. In this study, we propose a single-stage
approach which directly decodes the probabilities learned from sensor data into
sparse intake detections. This is achieved by weakly supervised training using
Connectionist Temporal Classification (CTC) loss, and decoding using a novel
extended prefix beam search decoding algorithm. Benefits of this approach
include (i) end-to-end training for detections, (ii) simplified timing
requirements for intake gesture labels, and (iii) improved detection
performance compared to existing approaches. Across two separate datasets, we
achieve relative $F_1$ score improvements between 1.9% and 6.2% over the
two-stage approach for intake detection and eating/drinking detection tasks,
for both video and inertial sensors.
- Abstract(参考訳): 個々の摂取行動の正確な検出は、自動食事監視への重要なステップである。
この目的のために、手首の動きの慣性センサーデータと上半身を描いたビデオデータの両方が使用されている。
これまでで最も先進的なアプローチは2段階のアプローチで、そこでは
(i)深層ニューラルネットワークを用いてセンサデータからフレームレベルの吸入確率を学習し、
(ii)フレームレベルの確率の最大値を求めることにより、スパース摂取事象を検出する。
本研究では,センサデータから学習した確率を直接,スパースインテーク検出に復号する単段法を提案する。
これは、Connectionist Temporal Classification (CTC)損失を用いた弱い教師付きトレーニングと、新しい拡張プレフィックスビーム探索復号アルゴリズムによる復号化によって実現される。
このアプローチの利点には
一 検出のためのエンドツーエンドの訓練
(二 摂取ジェスチャーラベルの簡易なタイミング要件、及び
(iii)既存の手法と比較して検出性能が向上した。
2つのデータセットにまたがって、ビデオと慣性センサーの両方の吸入検知および飲食検出タスクにおいて、2段階のアプローチで1.9%から6.2%の相対的に$f_1$のスコア改善を達成しました。
関連論文リスト
- A Low-cost Strategic Monitoring Approach for Scalable and Interpretable
Error Detection in Deep Neural Networks [6.537257913467249]
深層コンピュータビジョンネットワークのための高能率ランタイムモニタリング手法を提案する。
ハードウェアメモリと入力障害の両方から発生するサイレントデータの破損を効率よく検出することができる。
論文 参考訳(メタデータ) (2023-10-31T10:45:55Z) - DiffusionEngine: Diffusion Model is Scalable Data Engine for Object
Detection [41.436817746749384]
Diffusion Modelはオブジェクト検出のためのスケーラブルなデータエンジンである。
DiffusionEngine(DE)は、高品質な検出指向のトレーニングペアを単一のステージで提供する。
論文 参考訳(メタデータ) (2023-09-07T17:55:01Z) - Domain Adaptive Synapse Detection with Weak Point Annotations [63.97144211520869]
弱点アノテーションを用いたドメイン適応型シナプス検出のためのフレームワークであるAdaSynを提案する。
I SBI 2023のWASPSYNチャレンジでは、我々の手法が第1位にランクインした。
論文 参考訳(メタデータ) (2023-08-31T05:05:53Z) - A Novel Two Stream Decision Level Fusion of Vision and Inertial Sensors
Data for Automatic Multimodal Human Activity Recognition System [2.5214116139219787]
本稿では,新しいマルチモーダルな人間活動認識システムを提案する。
視覚と慣性センサーを2ストリームの意思決定レベルで融合させる。
提案法で得られた収差は96.9%、97.6%、98.7%、95.9%である。
論文 参考訳(メタデータ) (2023-06-27T19:29:35Z) - Multi-modal Sensor Data Fusion for In-situ Classification of Animal
Behavior Using Accelerometry and GNSS Data [16.47484520898938]
動物行動の分類には,複数のセンシングモード,すなわち加速度計とグローバルナビゲーション衛星システム(GNSS)のデータを用いて検討する。
スマート牛首輪と耳札を用いて収集した実世界の2つのデータセットを用いたマルチモーダル動物行動分類アルゴリズムを開発した。
論文 参考訳(メタデータ) (2022-06-24T04:54:03Z) - Weakly Supervised Change Detection Using Guided Anisotropic Difusion [97.43170678509478]
我々は、このようなデータセットを変更検出の文脈で活用するのに役立つ独自のアイデアを提案する。
まず,意味的セグメンテーション結果を改善する誘導異方性拡散(GAD)アルゴリズムを提案する。
次に、変化検出に適した2つの弱い教師付き学習戦略の可能性を示す。
論文 参考訳(メタデータ) (2021-12-31T10:03:47Z) - From One to Many: A Deep Learning Coincident Gravitational-Wave Search [58.720142291102135]
単一検出器からの非スピン型二元ブラックホールデータに基づいてトレーニングされたニューラルネットワークを用いて、二元ブラックホールの融合から重力波を2検出器で探索する。
これらの単純な2検出器ネットワークはいずれも、検出器のデータに個別にネットワークを適用するよりも感度を向上させることができない。
論文 参考訳(メタデータ) (2021-08-24T13:25:02Z) - ESAD: End-to-end Deep Semi-supervised Anomaly Detection [85.81138474858197]
正規データと異常データの間のKL偏差を計測する新たな目的関数を提案する。
提案手法は,複数のベンチマークデータセットの最先端性能を著しく上回っている。
論文 参考訳(メタデータ) (2020-12-09T08:16:35Z) - Dense Label Encoding for Boundary Discontinuity Free Rotation Detection [69.75559390700887]
本稿では,分類に基づく比較的研究の少ない方法論について検討する。
我々は2つの側面でフロンティアを推し進めるための新しい手法を提案する。
航空画像のための大規模公開データセットの実験と視覚解析は,我々のアプローチの有効性を示している。
論文 参考訳(メタデータ) (2020-11-19T05:42:02Z) - Sequential Drift Detection in Deep Learning Classifiers [4.022057598291766]
ニューラルネットワーク埋め込みを用いて、適切な逐次決定フレームワーク内でドリフト検出を定式化することにより、データのドリフトを検出する。
本稿では,この2つの関心事のバランスをとるアルゴリズムの能力を評価する損失関数を提案する。
論文 参考訳(メタデータ) (2020-07-31T14:46:21Z) - EHSOD: CAM-Guided End-to-end Hybrid-Supervised Object Detection with
Cascade Refinement [53.69674636044927]
本稿では,エンド・ツー・エンドのハイブリッド型オブジェクト検出システムであるEHSODについて述べる。
完全なアノテートと弱いアノテートの両方で、ワンショットでトレーニングすることができる。
完全なアノテートされたデータの30%しか持たない複数のオブジェクト検出ベンチマークで、同等の結果が得られる。
論文 参考訳(メタデータ) (2020-02-18T08:04:58Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。