論文の概要: Technical Report for Egocentric Mistake Detection for the HoloAssist Challenge
- arxiv url: http://arxiv.org/abs/2506.06174v1
- Date: Fri, 06 Jun 2025 15:39:09 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-06-09 17:28:43.534674
- Title: Technical Report for Egocentric Mistake Detection for the HoloAssist Challenge
- Title(参考訳): Egocentric misstake Detection for the Holo Assist Challenge の技術報告
- Authors: Constantin Patsch, Marsil Zakour, Yuankai Wu, Eckehard Steinbach,
- Abstract要約: 手続き的エラーと実行的エラーの両方を処理するオンライン誤り検出フレームワークを導入する。
誤りを検知すると、説明的フィードバックを生成するために大きな言語モデル(LLM)を使用する。
HoloAssistベンチマークの実験により,本手法の有効性が確認された。
- 参考スコア(独自算出の注目度): 5.257305312436567
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: In this report, we address the task of online mistake detection, which is vital in domains like industrial automation and education, where real-time video analysis allows human operators to correct errors as they occur. While previous work focuses on procedural errors involving action order, broader error types must be addressed for real-world use. We introduce an online mistake detection framework that handles both procedural and execution errors (e.g., motor slips or tool misuse). Upon detecting an error, we use a large language model (LLM) to generate explanatory feedback. Experiments on the HoloAssist benchmark confirm the effectiveness of our approach, where our approach is placed second on the mistake detection task.
- Abstract(参考訳): 本稿では,産業自動化や教育などの分野において重要なオンライン誤り検出の課題について述べる。
これまでの作業では、アクション順序を含む手続き的エラーに重点を置いていたが、実際の使用には、より広範なエラータイプに対処する必要がある。
手続き的および実行上のエラー(モータスリップやツール誤用など)を処理するオンライン誤り検出フレームワークを導入する。
誤りを検知すると、説明的フィードバックを生成するために大きな言語モデル(LLM)を使用する。
HoloAssistベンチマークの実験により,提案手法の有効性が確認された。
関連論文リスト
- A Coin Has Two Sides: A Novel Detector-Corrector Framework for Chinese Spelling Correction [79.52464132360618]
中国語のSpelling Correction(CSC)は、自然言語処理(NLP)の基本課題である。
本稿では,エラー検出・相関器の枠組みに基づく新しい手法を提案する。
我々の検出器は2つのエラー検出結果を得るように設計されており、それぞれ高精度とリコールが特徴である。
論文 参考訳(メタデータ) (2024-09-06T09:26:45Z) - PREGO: online mistake detection in PRocedural EGOcentric videos [49.72812518471056]
自己中心型ビデオにおける誤り検出のための,最初のオンライン一級分類モデルであるPregoを提案する。
PreGOは、現在のアクションをモデル化するオンラインアクション認識コンポーネントと、次のアクションを予測するシンボリック推論モジュールに基づいている。
手続き的誤り検出のオンラインベンチマークに適応する2つの手続き的自己中心型ビデオデータセットであるAmbly101とEpic-tentについてPreGOを評価した。
論文 参考訳(メタデータ) (2024-04-02T13:27:28Z) - Understanding Factual Errors in Summarization: Errors, Summarizers,
Datasets, Error Detectors [105.12462629663757]
本研究では、既存の9つのデータセットから事実性エラーアノテーションを集約し、基礎となる要約モデルに従ってそれらを階層化する。
本稿では,この階層化ベンチマークにおいて,最近のChatGPTベースの指標を含む最先端の事実性指標の性能を比較し,その性能が様々な種類の要約モデルで大きく異なることを示す。
論文 参考訳(メタデータ) (2022-05-25T15:26:48Z) - Reference-based Defect Detection Network [57.89399576743665]
最初の問題はテクスチャシフトであり、これはトレーニングされた欠陥検出モデルが目に見えないテクスチャの影響を受けやすいことを意味する。
第2の問題は部分的な視覚的混乱であり、部分的な欠陥ボックスが完全なボックスと視覚的に類似していることを示している。
本稿では,これら2つの問題に対処する参照型欠陥検出ネットワーク(RDDN)を提案する。
論文 参考訳(メタデータ) (2021-08-10T05:44:23Z) - A Bayesian Approach to Identifying Representational Errors [19.539720986687524]
本稿では,俳優の行動観察に基づく表現誤差推定のための生成モデルを提案する。
本手法は,強化学習エージェントと人間ユーザの両方の盲点を回復できることを示す。
論文 参考訳(メタデータ) (2021-03-28T16:43:01Z) - On the Robustness of Language Encoders against Grammatical Errors [66.05648604987479]
我々は、非ネイティブ話者から実際の文法的誤りを収集し、これらの誤りをクリーンテキストデータ上でシミュレートするために敵攻撃を行う。
結果,全ての試験モデルの性能は影響するが,影響の程度は異なることがわかった。
論文 参考訳(メタデータ) (2020-05-12T11:01:44Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。