論文の概要: IndustReal: A Dataset for Procedure Step Recognition Handling Execution
Errors in Egocentric Videos in an Industrial-Like Setting
- arxiv url: http://arxiv.org/abs/2310.17323v1
- Date: Thu, 26 Oct 2023 11:44:29 GMT
- ステータス: 処理完了
- システム内更新日: 2023-10-27 20:51:22.842763
- Title: IndustReal: A Dataset for Procedure Step Recognition Handling Execution
Errors in Egocentric Videos in an Industrial-Like Setting
- Title(参考訳): IndustReal: 産業的な設定におけるエゴセントリックビデオにおける実行エラーの処理手順認識のためのデータセット
- Authors: Tim J. Schoonbeek, Tim Houben, Hans Onvlee, Peter H.N. de With, Fons
van der Sommen
- Abstract要約: 手順ステップ認識(PSR)の新たな課題について紹介する。
PSRは、手続き段階の正しい完了と順序を認識することに焦点を当てている。
マルチモーダルなIndustRealデータセットも提示する。
- 参考スコア(独自算出の注目度): 7.561148568365396
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Although action recognition for procedural tasks has received notable
attention, it has a fundamental flaw in that no measure of success for actions
is provided. This limits the applicability of such systems especially within
the industrial domain, since the outcome of procedural actions is often
significantly more important than the mere execution. To address this
limitation, we define the novel task of procedure step recognition (PSR),
focusing on recognizing the correct completion and order of procedural steps.
Alongside the new task, we also present the multi-modal IndustReal dataset.
Unlike currently available datasets, IndustReal contains procedural errors
(such as omissions) as well as execution errors. A significant part of these
errors are exclusively present in the validation and test sets, making
IndustReal suitable to evaluate robustness of algorithms to new, unseen
mistakes. Additionally, to encourage reproducibility and allow for scalable
approaches trained on synthetic data, the 3D models of all parts are publicly
available. Annotations and benchmark performance are provided for action
recognition and assembly state detection, as well as the new PSR task.
IndustReal, along with the code and model weights, is available at:
https://github.com/TimSchoonbeek/IndustReal .
- Abstract(参考訳): 手続き的タスクに対する行動認識は注目されているが、アクションの成功の尺度が提供されないという根本的な欠点がある。
これは、手続き的行動の結果が単なる実行よりも著しく重要であるため、特に産業領域におけるそのようなシステムの適用性を制限する。
この制限に対処するために,手続きステップ認識(psr)の新たなタスクを定義し,手続きステップの正しい完了と順序の認識に焦点を当てた。
新しいタスクに加えて、マルチモーダルなIndustRealデータセットも提示する。
現在利用可能なデータセットとは異なり、industrealは実行エラーと同様に手続きエラー(省略など)を含んでいる。
これらのエラーの大部分は検証とテストセットにのみ存在しているため、新しい目に見えない誤りに対するアルゴリズムの堅牢性を評価するのに適しています。
さらに、再現性を奨励し、合成データで訓練されたスケーラブルなアプローチを可能にするため、すべてのパーツの3Dモデルが公開されている。
アノテーションとベンチマーク性能は、新しいPSRタスクと同様に、アクション認識とアセンブリ状態検出のために提供される。
IndustRealはコードとモデルの重み付けとともに、https://github.com/TimSchoonbeek/IndustReal.comで利用可能である。
関連論文リスト
- One-step Noisy Label Mitigation [86.57572253460125]
ノイズラベルのトレーニング過程に対する有害な影響の軽減がますます重要になっている。
モデルに依存しないノイズラベル緩和パラダイムである1ステップアンチノイズ(OSA)を提案する。
我々はOSAの優位性を実証的に実証し、トレーニングの堅牢性の向上、タスク転送性の向上、デプロイメントの容易性、計算コストの削減を強調した。
論文 参考訳(メタデータ) (2024-10-02T18:42:56Z) - PREGO: online mistake detection in PRocedural EGOcentric videos [49.72812518471056]
自己中心型ビデオにおける誤り検出のための,最初のオンライン一級分類モデルであるPregoを提案する。
PreGOは、現在のアクションをモデル化するオンラインアクション認識コンポーネントと、次のアクションを予測するシンボリック推論モジュールに基づいている。
手続き的誤り検出のオンラインベンチマークに適応する2つの手続き的自己中心型ビデオデータセットであるAmbly101とEpic-tentについてPreGOを評価した。
論文 参考訳(メタデータ) (2024-04-02T13:27:28Z) - Deep Learning based pipeline for anomaly detection and quality
enhancement in industrial binder jetting processes [68.8204255655161]
異常検出は、通常の値空間とは異なる異常状態、インスタンス、あるいはデータポイントを検出する方法を記述する。
本稿では,産業生産における人工知能へのデータ中心のアプローチに寄与する。
論文 参考訳(メタデータ) (2022-09-21T08:14:34Z) - SensorSCAN: Self-Supervised Learning and Deep Clustering for Fault
Diagnosis in Chemical Processes [2.398451252047814]
本研究では,教師なし故障検出・診断のための新しい手法であるSensorSCANを提案する。
我々は、テネシー・イーストマン・プロセスの2つの公開データセットに、さまざまな欠点のあるモデルの性能を実演する。
本手法は,故障の数が事前に分かっていない実世界のアプリケーションに適している。
論文 参考訳(メタデータ) (2022-08-17T10:24:37Z) - ReAct: Temporal Action Detection with Relational Queries [84.76646044604055]
本研究は,アクションクエリを備えたエンコーダ・デコーダフレームワークを用いて,時間的行動検出(TAD)の進展を図ることを目的とする。
まず,デコーダ内の関係注意機構を提案し,その関係に基づいてクエリ間の関心を誘導する。
最後に、高品質なクエリを区別するために、推論時に各アクションクエリのローカライズ品質を予測することを提案する。
論文 参考訳(メタデータ) (2022-07-14T17:46:37Z) - What Stops Learning-based 3D Registration from Working in the Real
World? [53.68326201131434]
この研究は、3Dポイントのクラウド登録失敗の原因を特定し、その原因を分析し、解決策を提案する。
最終的に、これは最も実践的な3D登録ネットワーク(BPNet)に変換される。
我々のモデルは微調整をせずに実データに一般化し、商用センサで得られた見えない物体の点雲上で最大67%の精度に達する。
論文 参考訳(メタデータ) (2021-11-19T19:24:27Z) - Evaluating Self and Semi-Supervised Methods for Remote Sensing
Segmentation Tasks [4.7590051176368915]
我々は、下流タスク性能を改善するためにラベルのないデータを活用する、最近の自己および半教師付きML技術を評価する。
これらの手法は、ラベルなし画像へのアクセスが容易で、真理ラベルの取得が高価である場合が多いため、リモートセンシングタスクには特に有用である。
論文 参考訳(メタデータ) (2021-11-19T07:41:14Z) - Process Discovery for Structured Program Synthesis [70.29027202357385]
プロセスマイニングにおける中核的なタスクは、イベントログデータから正確なプロセスモデルを学ぶことを目的としたプロセス発見である。
本稿では,ターゲットプロセスモデルとして(ブロック-)構造化プログラムを直接使用することを提案する。
我々は,このような構造化プログラムプロセスモデルの発見に対して,新たなボトムアップ・アグリメティブ・アプローチを開発する。
論文 参考訳(メタデータ) (2020-08-13T10:33:10Z) - Active and Incremental Learning with Weak Supervision [7.2288756536476635]
本研究では,逐次学習方式と能動学習方式の組み合わせについて述べる。
オブジェクト検出タスクは、PASCAL VOCデータセット上で連続的な探索コンテキストで評価される。
また,実世界の生物多様性アプリケーションにおいて,能動的・漸進的学習に基づく弱教師付きシステムを検証する。
論文 参考訳(メタデータ) (2020-01-20T13:21:14Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。