論文の概要: Low-Cost and Real-Time Industrial Human Action Recognitions Based on
Large-Scale Foundation Models
- arxiv url: http://arxiv.org/abs/2403.08420v1
- Date: Wed, 13 Mar 2024 11:11:59 GMT
- ステータス: 処理完了
- システム内更新日: 2024-03-14 14:43:34.712743
- Title: Low-Cost and Real-Time Industrial Human Action Recognitions Based on
Large-Scale Foundation Models
- Title(参考訳): 低コスト・実時間産業人間行動認識
大規模ファンデーションモデル
- Authors: Wensheng Liang, Ruiyan Zhuang, Xianwei Shi, Shuai Li, Zhicheng Wang,
and Xiaoguang Ma
- Abstract要約: 各種LSFMと軽量手法を併用した大規模基礎モデル(LSFM)を用いたIHAR法を提案する。
大規模製造ラインの総合的な試験により, 提案手法は, 雇用コストの大幅な削減, 実時間性能の向上, 精度, 一般化能力の向上を実現した。
- 参考スコア(独自算出の注目度): 12.836778822849734
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Industrial managements, including quality control, cost and safety
optimization, etc., heavily rely on high quality industrial human action
recognitions (IHARs) which were hard to be implemented in large-scale
industrial scenes due to their high costs and poor real-time performance. In
this paper, we proposed a large-scale foundation model(LSFM)-based IHAR method,
wherein various LSFMs and lightweight methods were jointly used, for the first
time, to fulfill low-cost dataset establishment and real-time IHARs.
Comprehensive tests on in-situ large-scale industrial manufacturing lines
elucidated that the proposed method realized great reduction on employment
costs, superior real-time performance, and satisfactory accuracy and
generalization capabilities, indicating its great potential as a backbone IHAR
method, especially for large-scale industrial applications.
- Abstract(参考訳): 品質管理、コストと安全性の最適化などの産業経営は、高コストと低リアルタイム性能のために大規模産業シーンで実施が困難であった高品質な産業人間行動認識(IHAR)に大きく依存している。
本稿では,低コストデータセット構築とリアルタイムIHARを実現するために,LSFMを用いた大規模基盤モデル (LSFM) を提案する。
大規模生産ラインの総合的な試験により, 提案手法は雇用コストの大幅な削減, リアルタイム性能の向上, 良好な精度と一般化能力を実現し, 特に大規模産業用途において, バックボーンIHAR法としての可能性を示した。
関連論文リスト
- Efficient AI in Practice: Training and Deployment of Efficient LLMs for Industry Applications [22.053978157017877]
本稿では,SLM(Small Language Model)を訓練する手法と知見について述べる。
本研究では,(1) 知識蒸留と(2) 量子化とプルーニングによるモデル圧縮の2つの重要な技術に焦点をあてる。
大規模なプロフェッショナルなソーシャルネットワークプラットフォームにおけるさまざまなユースケースに対するこれらのテクニックの影響を詳述し、デプロイメントのレッスンを共有します。
論文 参考訳(メタデータ) (2025-02-20T06:40:12Z) - Reward-Guided Speculative Decoding for Efficient LLM Reasoning [80.55186052123196]
Reward-Guided Speculative Decoding (RSD)は,大規模言語モデル(LLM)における推論の効率向上を目的とした新しいフレームワークである。
RSDは、厳密な偏りを強制する既存の投機的復号法とは対照的に、制御されたバイアスをハイリワード出力の優先順位付けに取り入れている。
RSDは,対象モデルのみでの復号化に対して,高い効率向上を実現し,並列復号法よりも高い精度を実現している。
論文 参考訳(メタデータ) (2025-01-31T17:19:57Z) - MMAD: The First-Ever Comprehensive Benchmark for Multimodal Large Language Models in Industrial Anomaly Detection [66.05200339481115]
本稿では,産業異常検出における最初のフルスペクトルMLLMベンチマークであるMMADを提案する。
産業検査におけるMLLMの7つの重要なサブタスクを定義し,MMADデータセットを生成するための新しいパイプラインを設計した。
MMADを用いて,様々な最先端MLLMの包括的,定量的評価を行った。
論文 参考訳(メタデータ) (2024-10-12T09:16:09Z) - Interpretable Data-driven Anomaly Detection in Industrial Processes with ExIFFI [3.7516053899419104]
工業プロセスは、最終製品の生産を包含して、可能な限り業務を効率化することを目的としている。
産業5.0の出現を踏まえ、より望ましいアプローチは解釈可能な結果の提供である。
本稿では,ExIFFIの産業的応用として,EIF(Extended isolated Forest)異常検出のための高速かつ効率的な説明法の開発に焦点をあてた。
論文 参考訳(メタデータ) (2024-05-02T10:23:17Z) - Leveraging Foundation Model Automatic Data Augmentation Strategies and Skeletal Points for Hands Action Recognition in Industrial Assembly Lines [3.0992677770545254]
我々は,効率的な,高品質で,大規模なデータセット拡張を実現するために,産業用データセットを拡張する戦略を開発した。
また,この戦略を映像行動認識にも適用した。
実際の組立ラインの「ワイヤ挿入時の手の動き」シナリオでは、手動作認識の精度は98.8%に達した。
論文 参考訳(メタデータ) (2024-03-14T02:55:06Z) - A Cost-Sensitive Transformer Model for Prognostics Under Highly
Imbalanced Industrial Data [1.6492989697868894]
本稿では,体系的なワークフローの一部として開発された新しいコスト感応型トランスフォーマーモデルを提案する。
その結果,最先端手法と比較して性能が大幅に向上した。
本研究は, 産業環境における故障予測の独特な課題に対処する上での本手法の可能性を明らかにするものである。
論文 参考訳(メタデータ) (2024-01-16T15:09:53Z) - An Experimental Design Framework for Label-Efficient Supervised Finetuning of Large Language Models [55.01592097059969]
命令データセットの監視された微調整は、目覚ましいゼロショットの一般化能力を達成する上で重要な役割を担っている。
アクティブラーニングは、未ラベルのプールからアノテートするサンプルの有用なサブセットを特定するのに効果的である。
本研究では,能動学習の計算ボトルネックを回避するための実験設計を提案する。
論文 参考訳(メタデータ) (2024-01-12T16:56:54Z) - Retrieval-based Knowledge Transfer: An Effective Approach for Extreme
Large Language Model Compression [64.07696663255155]
大規模事前学習型言語モデル(LLM)は、様々な自然言語処理(NLP)タスクにおいて例外的な性能を示した。
しかし、これらのモデルの巨大なサイズは、現実世界のアプリケーションに展開する上で大きな課題をもたらします。
本稿では,LLMの知識を極めて小規模なモデルに効果的に伝達するRetrieval-based Knowledge Transfer (RetriKT)と呼ばれる新しい圧縮パラダイムを提案する。
論文 参考訳(メタデータ) (2023-10-24T07:58:20Z) - Unifying Synergies between Self-supervised Learning and Dynamic
Computation [53.66628188936682]
SSLとDCのパラダイム間の相互作用に関する新しい視点を提示する。
SSL設定において、スクラッチから高密度かつゲートされたサブネットワークを同時に学習することは可能であることを示す。
密集エンコーダとゲートエンコーダの事前学習における共進化は、良好な精度と効率のトレードオフをもたらす。
論文 参考訳(メタデータ) (2023-01-22T17:12:58Z) - Deep Learning based pipeline for anomaly detection and quality
enhancement in industrial binder jetting processes [68.8204255655161]
異常検出は、通常の値空間とは異なる異常状態、インスタンス、あるいはデータポイントを検出する方法を記述する。
本稿では,産業生産における人工知能へのデータ中心のアプローチに寄与する。
論文 参考訳(メタデータ) (2022-09-21T08:14:34Z) - Costs to Consider in Adopting NLP for Your Business [3.608765813727773]
パフォーマンス向上とモデル間のコストのトレードオフを示し、AIピボットビジネスのさらなる洞察を与えます。
特にリソース不足言語について、低コストモデルに関するさらなる研究を求めています。
論文 参考訳(メタデータ) (2020-12-16T13:57:31Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。