論文の概要: Leveraging Foundation Model Automatic Data Augmentation Strategies and Skeletal Points for Hands Action Recognition in Industrial Assembly Lines
- arxiv url: http://arxiv.org/abs/2403.09056v1
- Date: Thu, 14 Mar 2024 02:55:06 GMT
- ステータス: 処理完了
- システム内更新日: 2024-03-15 21:57:10.144863
- Title: Leveraging Foundation Model Automatic Data Augmentation Strategies and Skeletal Points for Hands Action Recognition in Industrial Assembly Lines
- Title(参考訳): 産業集積ラインにおける手動作認識のための基礎モデル自動データ拡張戦略と骨格点の活用
- Authors: Liang Wu, X. -G. Ma,
- Abstract要約: 我々は,効率的な,高品質で,大規模なデータセット拡張を実現するために,産業用データセットを拡張する戦略を開発した。
また,この戦略を映像行動認識にも適用した。
実際の組立ラインの「ワイヤ挿入時の手の動き」シナリオでは、手動作認識の精度は98.8%に達した。
- 参考スコア(独自算出の注目度): 3.0992677770545254
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: On modern industrial assembly lines, many intelligent algorithms have been developed to replace or supervise workers. However, we found that there were bottlenecks in both training datasets and real-time performance when deploying algorithms on actual assembly line. Therefore, we developed a promising strategy for expanding industrial datasets, which utilized large models with strong generalization abilities to achieve efficient, high-quality, and large-scale dataset expansion, solving the problem of insufficient and low-quality industrial datasets. We also applied this strategy to video action recognition. We proposed a method of converting hand action recognition problems into hand skeletal trajectory classification problems, which solved the real-time performance problem of industrial algorithms. In the "hand movements during wire insertion" scenarios on the actual assembly line, the accuracy of hand action recognition reached 98.8\%. We conducted detailed experimental analysis to demonstrate the effectiveness and superiority of the method, and deployed the entire process on Midea's actual assembly line.
- Abstract(参考訳): 現代の産業組立ラインでは、労働者を置き換えたり監督したりするために多くのインテリジェントなアルゴリズムが開発されている。
しかし、実際のアセンブリラインにアルゴリズムをデプロイする際に、トレーニングデータセットとリアルタイムパフォーマンスの両方にボトルネックがあることがわかりました。
そこで我々は,高効率で高品質で大規模なデータセット拡張を実現するために,強力な一般化能力を持つ大規模モデルを活用した産業用データセットの拡大に向けた有望な戦略を開発し,不十分かつ低品質な産業用データセットの問題を解決する。
また,この戦略を映像行動認識にも適用した。
我々は,手動認識問題を手動軌道分類問題に変換する手法を提案し,産業用アルゴリズムのリアルタイム性能問題を解いた。
実際の組立ラインの「ワイヤ挿入時の手の動き」シナリオでは、手動作認識の精度は98.8\%に達した。
提案手法の有効性と優位性を実証するため, 詳細な実験解析を行い, ミデアの実際の組立ラインに全工程を配置した。
関連論文リスト
- What Really Matters for Learning-based LiDAR-Camera Calibration [50.2608502974106]
本稿では,学習に基づくLiDAR-Cameraキャリブレーションの開発を再考する。
我々は、広く使われているデータ生成パイプラインによる回帰ベースの手法の限界を識別する。
また,入力データ形式と前処理操作がネットワーク性能に与える影響についても検討する。
論文 参考訳(メタデータ) (2025-01-28T14:12:32Z) - Exploring Large Vision-Language Models for Robust and Efficient Industrial Anomaly Detection [4.691083532629246]
CLAD(Contrastive Cross-Modal Training)を用いた視覚言語異常検出法を提案する。
CLADは、視覚的特徴とテキスト的特徴をコントラスト学習を用いて共有埋め込み空間に整列する。
CLADは画像レベルの異常検出と画素レベルの異常局所化の両方において最先端の手法より優れていることを示す。
論文 参考訳(メタデータ) (2024-12-01T17:00:43Z) - Automated Defect Detection and Grading of Piarom Dates Using Deep Learning [0.0]
本稿では,ピアロム日付のリアルタイム検出・分類・評価に特化して設計された,革新的なディープラーニングフレームワークを提案する。
我々のフレームワークは、最先端のオブジェクト検出アルゴリズムと畳み込みニューラルネットワーク(CNN)を統合し、欠陥同定の高精度化を実現している。
実験の結果,既存の手法よりも精度と計算効率が優れていた。
論文 参考訳(メタデータ) (2024-10-23T18:25:20Z) - VARADE: a Variational-based AutoRegressive model for Anomaly Detection on the Edge [7.4646496981460855]
本研究は,エッジ上でのリアルタイム実行に最適な変分推論に基づく軽量自己回帰フレームワークを実装した新しいソリューションを提案する。
提案手法は、パイロット生産ラインの一部であるロボットアームで検証され、最先端のアルゴリズムと比較された。
論文 参考訳(メタデータ) (2024-09-23T08:46:15Z) - Machine learning for industrial sensing and control: A survey and
practical perspective [7.678648424345052]
プロセス産業で実際に成功している重要な統計および機械学習技術を特定する。
ソフトセンシングは、統計学と機械学習の手法の多くの産業応用を含んでいる。
データ駆動最適化と制御のための2つの異なるフレーバーについて考察する。
論文 参考訳(メタデータ) (2024-01-24T22:27:04Z) - End-to-End Meta-Bayesian Optimisation with Transformer Neural Processes [52.818579746354665]
本稿では,ニューラルネットワークを一般化し,トランスフォーマーアーキテクチャを用いて獲得関数を学習する,エンド・ツー・エンドの差別化可能な最初のメタBOフレームワークを提案する。
我々は、この強化学習(RL)によるエンドツーエンドのフレームワークを、ラベル付き取得データの欠如に対処できるようにします。
論文 参考訳(メタデータ) (2023-05-25T10:58:46Z) - Deep Learning based pipeline for anomaly detection and quality
enhancement in industrial binder jetting processes [68.8204255655161]
異常検出は、通常の値空間とは異なる異常状態、インスタンス、あるいはデータポイントを検出する方法を記述する。
本稿では,産業生産における人工知能へのデータ中心のアプローチに寄与する。
論文 参考訳(メタデータ) (2022-09-21T08:14:34Z) - Toward Fault Detection in Industrial Welding Processes with Deep
Learning and Data Augmentation [0.0]
本稿では,AIツールの産業的実現における課題について述べる。
我々はオブジェクト検出APIからオブジェクト検出アルゴリズムを使用し、転送学習を用いてユースケースに適応する。
画像拡張によるデータセットの適度なスケーリングは、結合(IoU)とリコールの交差点の改善につながる。
論文 参考訳(メタデータ) (2021-06-18T14:52:49Z) - DEALIO: Data-Efficient Adversarial Learning for Imitation from
Observation [57.358212277226315]
観察ifoからの模倣学習において、学習エージェントは、実演者の生成した制御信号にアクセスせずに、実演行動の観察のみを用いて実演エージェントを模倣しようとする。
近年、逆模倣学習に基づく手法は、ifO問題に対する最先端のパフォーマンスをもたらすが、データ非効率でモデルなしの強化学習アルゴリズムに依存するため、サンプルの複雑さに悩まされることが多い。
この問題は、サンプルの収集が時間、エネルギー、およびリスクの面で高いコストを被る可能性がある現実世界の設定に展開することは非現実的です。
よりデータ効率の高いifOアルゴリズムを提案する。
論文 参考訳(メタデータ) (2021-03-31T23:46:32Z) - Anomaly Detection Based on Selection and Weighting in Latent Space [73.01328671569759]
SWADと呼ばれる新しい選択および重み付けに基づく異常検出フレームワークを提案する。
ベンチマークと実世界のデータセットによる実験は、SWADの有効性と優位性を示している。
論文 参考訳(メタデータ) (2021-03-08T10:56:38Z) - A Survey on Large-scale Machine Learning [67.6997613600942]
機械学習はデータに対する深い洞察を与え、マシンが高品質な予測を行うことを可能にする。
ほとんどの高度な機械学習アプローチは、大規模なデータを扱う場合の膨大な時間コストに悩まされる。
大規模機械学習は、ビッグデータからパターンを、同等のパフォーマンスで効率的に学習することを目的としている。
論文 参考訳(メタデータ) (2020-08-10T06:07:52Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。