論文の概要: From Detection to Anticipation: Online Understanding of Struggles across Various Tasks and Activities
- arxiv url: http://arxiv.org/abs/2512.09847v1
- Date: Wed, 10 Dec 2025 17:31:44 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-12-11 15:14:53.611285
- Title: From Detection to Anticipation: Online Understanding of Struggles across Various Tasks and Activities
- Title(参考訳): 発見から予測へ:様々な課題と活動におけるストラグルのオンライン理解
- Authors: Shijia Feng, Michael Wray, Walterio Mayol-Cuevas,
- Abstract要約: 我々は、オンライン検出タスクとして闘争局所化を再構築し、それを予測にまで拡張し、その前に闘争モーメントを予測する。
オンラインの闘争検出はフレーム当たり70-80%のmAPを達成する一方、闘争予測は最大2秒前に達成され、わずかなドロップで同等のパフォーマンスを得る。
機能ベースのモデルは最大143FPSで動作し、機能抽出を含むパイプライン全体が約20FPSで動作する。
- 参考スコア(独自算出の注目度): 6.040360125900913
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Understanding human skill performance is essential for intelligent assistive systems, with struggle recognition offering a natural cue for identifying user difficulties. While prior work focuses on offline struggle classification and localization, real-time applications require models capable of detecting and anticipating struggle online. We reformulate struggle localization as an online detection task and further extend it to anticipation, predicting struggle moments before they occur. We adapt two off-the-shelf models as baselines for online struggle detection and anticipation. Online struggle detection achieves 70-80% per-frame mAP, while struggle anticipation up to 2 seconds ahead yields comparable performance with slight drops. We further examine generalization across tasks and activities and analyse the impact of skill evolution. Despite larger domain gaps in activity-level generalization, models still outperform random baselines by 4-20%. Our feature-based models run at up to 143 FPS, and the whole pipeline, including feature extraction, operates at around 20 FPS, sufficient for real-time assistive applications.
- Abstract(参考訳): 人間のスキルパフォーマンスを理解することは、知的補助システムにとって不可欠であり、ユーザの困難を識別するための自然な手がかりを提供する苦難認識である。
以前の作業では、オフラインの闘争分類とローカライゼーションに重点を置いていたが、リアルタイムアプリケーションは、オンラインでの闘争を検出し予測できるモデルを必要とする。
我々は、闘争局所化をオンライン検出タスクとして再編成し、それを予想まで拡張し、その前に闘争の瞬間を予測する。
オンライン闘争の検出と予測のベースラインとして、2つのオフザシェルフモデルを適用します。
オンラインの闘争検出はフレーム当たり70-80%のmAPを達成する一方、闘争予測は最大2秒前に達成され、わずかなドロップで同等のパフォーマンスを得る。
さらに,タスクや活動全般の一般化について検討し,スキル進化の影響を分析した。
アクティビティレベルの一般化のドメインギャップは大きいが、モデルは依然としてランダムベースラインを4-20%上回っている。
機能ベースのモデルは最大143FPSで動作し、機能抽出を含むパイプライン全体が約20FPSで動作します。
関連論文リスト
- TI-PREGO: Chain of Thought and In-Context Learning for Online Mistake Detection in PRocedural EGOcentric Videos [48.126793563151715]
オンラインのオープンセットの手続きミスを効果的に検出する技術はない。
1つのブランチは、入力されたエゴセントリックビデオからステップ認識を連続的に行う。
もう1つは、認識モジュールの出力に基づいて将来のステップを予測します。
論文 参考訳(メタデータ) (2024-11-04T20:03:06Z) - Recursive Least-Squares Estimator-Aided Online Learning for Visual
Tracking [58.14267480293575]
オフライン学習を必要とせず、簡単な効果的なオンライン学習手法を提案する。
これは、モデルが以前見たオブジェクトに関する知識を記憶するための、内蔵されたメモリ保持メカニズムを可能にする。
我々は、RT-MDNetにおける多層パーセプトロンと、DiMPにおける畳み込みニューラルネットワークの追跡のためのオンライン学習ファミリーにおける2つのネットワークに基づくアプローチを評価する。
論文 参考訳(メタデータ) (2021-12-28T06:51:18Z) - MOS: A Low Latency and Lightweight Framework for Face Detection,
Landmark Localization, and Head Pose Estimation [37.537102697992395]
顔検出,ランドマークの定位,頭部ポーズ推定を同時に行うために,低レイテンシで軽量なネットワークを提案する。
大きな角度の顔のランドマークを見つけることがより困難であるという観察に刺激され、学習を制限するためにポーズロスが提案される。
また,各タスクの重みを自動的に学習するために,不確実なマルチタスク損失を提案する。
論文 参考訳(メタデータ) (2021-10-21T08:05:53Z) - WOAD: Weakly Supervised Online Action Detection in Untrimmed Videos [124.72839555467944]
ビデオクラスラベルのみを用いてトレーニングできる弱教師付きフレームワークを提案する。
提案手法は, 弱教師付きベースラインよりも優れていることを示す。
本手法は,オンラインフレームごとの行動認識とオンライン行動開始検出の両方のタスクにおいて,最先端の成果を得る。
論文 参考訳(メタデータ) (2020-06-05T23:08:41Z) - Planning to Explore via Self-Supervised World Models [120.31359262226758]
Plan2Exploreは自己監督型強化学習エージェントである。
我々は、自己監督型探索と、新しいタスクへの迅速な適応に対する新しいアプローチを提案する。
Plan2Exploreは、訓練の監督やタスク固有の相互作用がなければ、自己監督型の探査方法よりも優れている。
論文 参考訳(メタデータ) (2020-05-12T17:59:45Z) - Adversarial vs behavioural-based defensive AI with joint, continual and
active learning: automated evaluation of robustness to deception, poisoning
and concept drift [62.997667081978825]
人工知能(AI)の最近の進歩は、サイバーセキュリティのための行動分析(UEBA)に新たな能力をもたらした。
本稿では、検出プロセスを改善し、人間の専門知識を効果的に活用することにより、この攻撃を効果的に軽減するソリューションを提案する。
論文 参考訳(メタデータ) (2020-01-13T13:54:36Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。