Fugu-MT 論文翻訳(概要): Low-Cost and Real-Time Industrial Human Action Recognitions Based on Large-Scale Foundation Models

論文の概要: Low-Cost and Real-Time Industrial Human Action Recognitions Based on Large-Scale Foundation Models

arxiv url: http://arxiv.org/abs/2403.08420v1
Date: Wed, 13 Mar 2024 11:11:59 GMT
ステータス: 翻訳完了
システム内更新日: 2024-03-14 14:43:34.712743
Title: Low-Cost and Real-Time Industrial Human Action Recognitions Based on Large-Scale Foundation Models
Title（参考訳）: 低コスト・実時間産業人間行動認識大規模ファンデーションモデル
Authors: Wensheng Liang, Ruiyan Zhuang, Xianwei Shi, Shuai Li, Zhicheng Wang, and Xiaoguang Ma
Abstract要約: 各種LSFMと軽量手法を併用した大規模基礎モデル(LSFM)を用いたIHAR法を提案する。大規模製造ラインの総合的な試験により, 提案手法は, 雇用コストの大幅な削減, 実時間性能の向上, 精度, 一般化能力の向上を実現した。
参考スコア（独自算出の注目度）: 12.836778822849734
License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
Abstract: Industrial managements, including quality control, cost and safety optimization, etc., heavily rely on high quality industrial human action recognitions (IHARs) which were hard to be implemented in large-scale industrial scenes due to their high costs and poor real-time performance. In this paper, we proposed a large-scale foundation model(LSFM)-based IHAR method, wherein various LSFMs and lightweight methods were jointly used, for the first time, to fulfill low-cost dataset establishment and real-time IHARs. Comprehensive tests on in-situ large-scale industrial manufacturing lines elucidated that the proposed method realized great reduction on employment costs, superior real-time performance, and satisfactory accuracy and generalization capabilities, indicating its great potential as a backbone IHAR method, especially for large-scale industrial applications.
Abstract（参考訳）: 品質管理、コストと安全性の最適化などの産業経営は、高コストと低リアルタイム性能のために大規模産業シーンで実施が困難であった高品質な産業人間行動認識(IHAR)に大きく依存している。本稿では,低コストデータセット構築とリアルタイムIHARを実現するために,LSFMを用いた大規模基盤モデル (LSFM) を提案する。大規模生産ラインの総合的な試験により, 提案手法は雇用コストの大幅な削減, リアルタイム性能の向上, 良好な精度と一般化能力を実現し, 特に大規模産業用途において, バックボーンIHAR法としての可能性を示した。

関連論文リスト

Evaluating Large Language Models for Real-World Engineering Tasks [75.97299249823972]
本稿では,実運用指向のエンジニアリングシナリオから得られた100以上の質問をキュレートしたデータベースを提案する。このデータセットを用いて、4つの最先端の大規模言語モデル(LLM)を評価する。以上の結果から,LLMは時間的および構造的推論において強みを示すが,抽象的推論や形式的モデリング,文脈に敏感な工学的論理にはかなり苦労することがわかった。
論文参考訳（メタデータ） (2025-05-12T14:05:23Z)
Bounding Box-Guided Diffusion for Synthesizing Industrial Images and Segmentation Map [50.21082069320818]
最小限の監督で高忠実度産業データセットを生成するための拡散型パイプラインを提案する。提案手法では, 拡張有界箱表現の拡散モデルを用いて, 正確なセグメンテーションマスクを生成する。その結果、拡散に基づく合成は、人工的な産業データと実世界の産業データとのギャップを埋めることを示した。
論文参考訳（メタデータ） (2025-05-06T15:21:36Z)
From Large to Super-Tiny: End-to-End Optimization for Cost-Efficient LLMs [23.253571170594455]
大規模言語モデル(LLM)は、非常に高度な人工知能を持つ。本稿では,3段階の低コストエンドツーエンドLCMデプロイメントパイプラインを提案する。性能が向上し、コストが削減された超小型オンラインモデルを生産する。
論文参考訳（メタデータ） (2025-04-18T05:25:22Z)
Pretrained LLMs as Real-Time Controllers for Robot Operated Serial Production Line [5.647265893402412]
本研究では,大規模言語モデル(LLM),特に GPT-4 を,製造システム,特に移動ロボットスケジューリングを制御するための,単純で適応可能なソリューションとして用いることの実現可能性について検討する。ロボットによる連続生産ラインにおいて,移動ロボットを異なるマシンに割り当てるLLMベースの制御フレームワークを導入し,システムスループットの観点からその性能を評価する。 MARL(Multi-Agent Reinforcement Learning)のような最先端の手法と同等のパフォーマンスを実現するが、大規模なリトレーニングを必要とせずに、同等のスループットを提供するという、明確な利点を提供する。
論文参考訳（メタデータ） (2025-03-05T20:43:49Z)
Reward-Guided Speculative Decoding for Efficient LLM Reasoning [80.55186052123196]
Reward-Guided Speculative Decoding (RSD)は,大規模言語モデル(LLM)における推論の効率向上を目的とした新しいフレームワークである。 RSDは、厳密な偏りを強制する既存の投機的復号法とは対照的に、制御されたバイアスをハイリワード出力の優先順位付けに取り入れている。 RSDは,対象モデルのみでの復号化に対して,高い効率向上を実現し,並列復号法よりも高い精度を実現している。
論文参考訳（メタデータ） (2025-01-31T17:19:57Z)
MMAD: The First-Ever Comprehensive Benchmark for Multimodal Large Language Models in Industrial Anomaly Detection [66.05200339481115]
本稿では,産業異常検出における最初のフルスペクトルMLLMベンチマークであるMMADを提案する。産業検査におけるMLLMの7つの重要なサブタスクを定義し,MMADデータセットを生成するための新しいパイプラインを設計した。 MMADを用いて,様々な最先端MLLMの包括的,定量的評価を行った。
論文参考訳（メタデータ） (2024-10-12T09:16:09Z)
Interpretable Data-driven Anomaly Detection in Industrial Processes with ExIFFI [3.7516053899419104]
工業プロセスは、最終製品の生産を包含して、可能な限り業務を効率化することを目的としている。産業5.0の出現を踏まえ、より望ましいアプローチは解釈可能な結果の提供である。本稿では,ExIFFIの産業的応用として,EIF(Extended isolated Forest)異常検出のための高速かつ効率的な説明法の開発に焦点をあてた。
論文参考訳（メタデータ） (2024-05-02T10:23:17Z)
Leveraging Foundation Model Automatic Data Augmentation Strategies and Skeletal Points for Hands Action Recognition in Industrial Assembly Lines [3.0992677770545254]
我々は,効率的な,高品質で,大規模なデータセット拡張を実現するために,産業用データセットを拡張する戦略を開発した。また,この戦略を映像行動認識にも適用した。実際の組立ラインの「ワイヤ挿入時の手の動き」シナリオでは、手動作認識の精度は98.8%に達した。
論文参考訳（メタデータ） (2024-03-14T02:55:06Z)
Efficiency at Scale: Investigating the Performance of Diminutive Language Models in Clinical Tasks [2.834743715323873]
本稿では,臨床意思決定タスクにおけるPEFT法の適合性について検討する。分析の結果,ほとんどのPEFT手法の性能はタスクによって大きく異なることがわかった。臨床領域におけるPEFT法の有効性は明らかであり、特に低コストで社内の計算インフラで運用できる専門モデルでは顕著である。
論文参考訳（メタデータ） (2024-02-16T11:30:11Z)
A Cost-Sensitive Transformer Model for Prognostics Under Highly Imbalanced Industrial Data [1.6492989697868894]
本稿では,体系的なワークフローの一部として開発された新しいコスト感応型トランスフォーマーモデルを提案する。その結果,最先端手法と比較して性能が大幅に向上した。本研究は, 産業環境における故障予測の独特な課題に対処する上での本手法の可能性を明らかにするものである。
論文参考訳（メタデータ） (2024-01-16T15:09:53Z)
An Experimental Design Framework for Label-Efficient Supervised Finetuning of Large Language Models [55.01592097059969]
命令データセットの監視された微調整は、目覚ましいゼロショットの一般化能力を達成する上で重要な役割を担っている。アクティブラーニングは、未ラベルのプールからアノテートするサンプルの有用なサブセットを特定するのに効果的である。本研究では,能動学習の計算ボトルネックを回避するための実験設計を提案する。
論文参考訳（メタデータ） (2024-01-12T16:56:54Z)
Retrieval-based Knowledge Transfer: An Effective Approach for Extreme Large Language Model Compression [64.07696663255155]
大規模事前学習型言語モデル(LLM)は、様々な自然言語処理(NLP)タスクにおいて例外的な性能を示した。しかし、これらのモデルの巨大なサイズは、現実世界のアプリケーションに展開する上で大きな課題をもたらします。本稿では,LLMの知識を極めて小規模なモデルに効果的に伝達するRetrieval-based Knowledge Transfer (RetriKT)と呼ばれる新しい圧縮パラダイムを提案する。
論文参考訳（メタデータ） (2023-10-24T07:58:20Z)
Unifying Synergies between Self-supervised Learning and Dynamic Computation [53.66628188936682]
SSLとDCのパラダイム間の相互作用に関する新しい視点を提示する。 SSL設定において、スクラッチから高密度かつゲートされたサブネットワークを同時に学習することは可能であることを示す。密集エンコーダとゲートエンコーダの事前学習における共進化は、良好な精度と効率のトレードオフをもたらす。
論文参考訳（メタデータ） (2023-01-22T17:12:58Z)
Deep Learning based pipeline for anomaly detection and quality enhancement in industrial binder jetting processes [68.8204255655161]
異常検出は、通常の値空間とは異なる異常状態、インスタンス、あるいはデータポイントを検出する方法を記述する。本稿では,産業生産における人工知能へのデータ中心のアプローチに寄与する。
論文参考訳（メタデータ） (2022-09-21T08:14:34Z)
Anomaly Detection Based on Selection and Weighting in Latent Space [73.01328671569759]
SWADと呼ばれる新しい選択および重み付けに基づく異常検出フレームワークを提案する。ベンチマークと実世界のデータセットによる実験は、SWADの有効性と優位性を示している。
論文参考訳（メタデータ） (2021-03-08T10:56:38Z)
Costs to Consider in Adopting NLP for Your Business [3.608765813727773]
パフォーマンス向上とモデル間のコストのトレードオフを示し、AIピボットビジネスのさらなる洞察を与えます。特にリソース不足言語について、低コストモデルに関するさらなる研究を求めています。
論文参考訳（メタデータ） (2020-12-16T13:57:31Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。