Fugu-MT 論文翻訳(概要): Leveraging Foundation Model Automatic Data Augmentation Strategies and Skeletal Points for Hands Action Recognition in Industrial Assembly Lines

論文の概要: Leveraging Foundation Model Automatic Data Augmentation Strategies and Skeletal Points for Hands Action Recognition in Industrial Assembly Lines

arxiv url: http://arxiv.org/abs/2403.09056v1
Date: Thu, 14 Mar 2024 02:55:06 GMT
ステータス: 翻訳完了
システム内更新日: 2024-03-15 21:57:10.144863
Title: Leveraging Foundation Model Automatic Data Augmentation Strategies and Skeletal Points for Hands Action Recognition in Industrial Assembly Lines
Title（参考訳）: 産業集積ラインにおける手動作認識のための基礎モデル自動データ拡張戦略と骨格点の活用
Authors: Liang Wu, X. -G. Ma,
Abstract要約: 我々は,効率的な,高品質で,大規模なデータセット拡張を実現するために,産業用データセットを拡張する戦略を開発した。また,この戦略を映像行動認識にも適用した。実際の組立ラインの「ワイヤ挿入時の手の動き」シナリオでは、手動作認識の精度は98.8%に達した。
参考スコア（独自算出の注目度）: 3.0992677770545254
License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
Abstract: On modern industrial assembly lines, many intelligent algorithms have been developed to replace or supervise workers. However, we found that there were bottlenecks in both training datasets and real-time performance when deploying algorithms on actual assembly line. Therefore, we developed a promising strategy for expanding industrial datasets, which utilized large models with strong generalization abilities to achieve efficient, high-quality, and large-scale dataset expansion, solving the problem of insufficient and low-quality industrial datasets. We also applied this strategy to video action recognition. We proposed a method of converting hand action recognition problems into hand skeletal trajectory classification problems, which solved the real-time performance problem of industrial algorithms. In the "hand movements during wire insertion" scenarios on the actual assembly line, the accuracy of hand action recognition reached 98.8\%. We conducted detailed experimental analysis to demonstrate the effectiveness and superiority of the method, and deployed the entire process on Midea's actual assembly line.
Abstract（参考訳）: 現代の産業組立ラインでは、労働者を置き換えたり監督したりするために多くのインテリジェントなアルゴリズムが開発されている。しかし、実際のアセンブリラインにアルゴリズムをデプロイする際に、トレーニングデータセットとリアルタイムパフォーマンスの両方にボトルネックがあることがわかりました。そこで我々は,高効率で高品質で大規模なデータセット拡張を実現するために,強力な一般化能力を持つ大規模モデルを活用した産業用データセットの拡大に向けた有望な戦略を開発し,不十分かつ低品質な産業用データセットの問題を解決する。また,この戦略を映像行動認識にも適用した。我々は,手動認識問題を手動軌道分類問題に変換する手法を提案し,産業用アルゴリズムのリアルタイム性能問題を解いた。実際の組立ラインの「ワイヤ挿入時の手の動き」シナリオでは、手動作認識の精度は98.8\%に達した。提案手法の有効性と優位性を実証するため, 詳細な実験解析を行い, ミデアの実際の組立ラインに全工程を配置した。

関連論文リスト

Learning Memory-Enhanced Improvement Heuristics for Flexible Job Shop Scheduling [39.98859285173431]
フレキシブルなジョブショップスケジューリング問題(FJSP)は、現実の運用シナリオと複雑で強い整合性のため、大きな注目を集めている。現在の深部強化学習(DRL)に基づくFJSPのアプローチは主に建設的手法を採用している。本稿では,異種グラフ表現を用いたメモリ拡張改善検索フレームワーク-MIStarを提案する。
論文参考訳（メタデータ） (2026-03-03T10:43:01Z)
Synthetic Industrial Object Detection: GenAI vs. Feature-Based Methods [5.278929538141005]
我々は、特徴ベースの手法、生成AI(GenAI)、古典的なレンダリングアプローチを含む、ドメインランダム化(DR)およびドメイン適応(DA)テクニックをベンチマークする。本評価では,低レベルの特徴アライメントと高レベルの特徴アライメントの有効性,および実世界の文脈から生成されたプロンプトによって誘導される拡散に基づくDA法について検討する。その結果、十分な可変性を持つレンダリングベースデータが、輝度ベースや知覚的ハッシュフィルタリングといったよりシンプルな特徴ベースのメソッドとして利用可能である場合、精度と資源効率の両方においてより複雑なGenAIベースのアプローチよりも優れていることが示された。
論文参考訳（メタデータ） (2025-11-28T14:51:08Z)
Scalability of Reinforcement Learning Methods for Dispatching in Semiconductor Frontend Fabs: A Comparison of Open-Source Models with Real Industry Datasets [40.434003972007744]
我々は,オープンソースのシミュレーションモデルと実業界データセットを比較し,最適化手法のスケーリング方法を評価する。提案した進化戦略に基づく手法は、同等の政策段階に基づく手法よりもはるかに優れていることを示す。進化戦略を用いて,2桁のタドネス向上と1桁のスループット向上を観察した。
論文参考訳（メタデータ） (2025-05-16T11:32:29Z)
Bounding Box-Guided Diffusion for Synthesizing Industrial Images and Segmentation Map [50.21082069320818]
最小限の監督で高忠実度産業データセットを生成するための拡散型パイプラインを提案する。提案手法では, 拡張有界箱表現の拡散モデルを用いて, 正確なセグメンテーションマスクを生成する。その結果、拡散に基づく合成は、人工的な産業データと実世界の産業データとのギャップを埋めることを示した。
論文参考訳（メタデータ） (2025-05-06T15:21:36Z)
Robo-taxi Fleet Coordination at Scale via Reinforcement Learning [21.266509380044912]
この研究は、数学的モデリングとデータ駆動技術を統合する新しい意思決定フレームワークを導入している。本稿では、強化学習のレンズを通してAMoDコーディネート問題を示し、グラフネットワークに基づくフレームワークを提案する。特に、強化学習のレンズを通してAMoDコーディネート問題を示し、グラフネットワークに基づくフレームワークを提案する。
論文参考訳（メタデータ） (2025-04-08T15:19:41Z)
Robust Offline Imitation Learning Through State-level Trajectory Stitching [37.281554320048755]
イミテーション・ラーニング(IL)は、ロボットが専門家によるデモンストレーションを通じて、視覚運動のスキルを習得できるようにするのに有効であることが証明されている。オフラインILの最近の進歩は、トレーニングに最適な、ラベルなしデータセットを組み込んでいる。本稿では,タスク関連トラジェクトリフラグメントとリッチ環境ダイナミクスを活用することで,質の高いオフラインデータセットからのポリシー学習を強化する新しい手法を提案する。
論文参考訳（メタデータ） (2025-03-28T15:28:36Z)
Robust Distribution Alignment for Industrial Anomaly Detection under Distribution Shift [51.24522135151649]
異常検出は産業アプリケーションの品質管理において重要な役割を担っている。既存の方法は、一般化可能なモデルをトレーニングすることで、ドメインシフトに対処しようとする。提案手法は,最先端の異常検出法や領域適応法と比較して,優れた結果を示す。
論文参考訳（メタデータ） (2025-03-19T05:25:52Z)
DARS: Dynamic Action Re-Sampling to Enhance Coding Agent Performance by Adaptive Tree Traversal [55.13854171147104]
大規模言語モデル(LLM)は、自然言語処理、データ分析、ソフトウェア開発など、さまざまな領域に革命をもたらした。符号化エージェントのための新しい推論時間計算スケーリングアプローチである動的アクション再サンプリング(DARS)を提案する。我々は、SWE-Bench Liteベンチマークに対する我々のアプローチを評価し、このスケーリング戦略がClude 3.5 Sonnet V2で55%のパス@kスコアを達成したことを実証した。
論文参考訳（メタデータ） (2025-03-18T14:02:59Z)
What Really Matters for Learning-based LiDAR-Camera Calibration [50.2608502974106]
本稿では,学習に基づくLiDAR-Cameraキャリブレーションの開発を再考する。我々は、広く使われているデータ生成パイプラインによる回帰ベースの手法の限界を識別する。また,入力データ形式と前処理操作がネットワーク性能に与える影響についても検討する。
論文参考訳（メタデータ） (2025-01-28T14:12:32Z)
Exploring Large Vision-Language Models for Robust and Efficient Industrial Anomaly Detection [4.691083532629246]
CLAD(Contrastive Cross-Modal Training)を用いた視覚言語異常検出法を提案する。 CLADは、視覚的特徴とテキスト的特徴をコントラスト学習を用いて共有埋め込み空間に整列する。 CLADは画像レベルの異常検出と画素レベルの異常局所化の両方において最先端の手法より優れていることを示す。
論文参考訳（メタデータ） (2024-12-01T17:00:43Z)
Automated Defect Detection and Grading of Piarom Dates Using Deep Learning [0.0]
本稿では,ピアロム日付のリアルタイム検出・分類・評価に特化して設計された,革新的なディープラーニングフレームワークを提案する。我々のフレームワークは、最先端のオブジェクト検出アルゴリズムと畳み込みニューラルネットワーク(CNN)を統合し、欠陥同定の高精度化を実現している。実験の結果,既存の手法よりも精度と計算効率が優れていた。
論文参考訳（メタデータ） (2024-10-23T18:25:20Z)
VARADE: a Variational-based AutoRegressive model for Anomaly Detection on the Edge [7.4646496981460855]
本研究は,エッジ上でのリアルタイム実行に最適な変分推論に基づく軽量自己回帰フレームワークを実装した新しいソリューションを提案する。提案手法は、パイロット生産ラインの一部であるロボットアームで検証され、最先端のアルゴリズムと比較された。
論文参考訳（メタデータ） (2024-09-23T08:46:15Z)
ALow-Cost Real-Time Framework for Industrial Action Recognition Using Foundation Models [8.654703129948901]
産業環境における行動認識は、高いデプロイメントコスト、低いクロスシナリオの一般化、限られたリアルタイムパフォーマンスによる永続的な課題に直面している。本稿では,LRIARと呼ばれる基礎モデルを用いた産業行動認識のための低コストリアルタイムフレームワークを提案し,認識精度と伝達性を向上させる。
論文参考訳（メタデータ） (2024-03-13T11:11:59Z)
Machine learning for industrial sensing and control: A survey and practical perspective [7.678648424345052]
プロセス産業で実際に成功している重要な統計および機械学習技術を特定する。ソフトセンシングは、統計学と機械学習の手法の多くの産業応用を含んでいる。データ駆動最適化と制御のための2つの異なるフレーバーについて考察する。
論文参考訳（メタデータ） (2024-01-24T22:27:04Z)
A Microservices Identification Method Based on Spectral Clustering for Industrial Legacy Systems [5.255685751491305]
本稿では,スペクトルグラフ理論に基づくマイクロサービス候補抽出のための自動分解手法を提案する。提案手法は,ドメインの専門家が関与しなくても,良好な結果が得られることを示す。
論文参考訳（メタデータ） (2023-12-20T07:47:01Z)
End-to-End Meta-Bayesian Optimisation with Transformer Neural Processes [52.818579746354665]
本稿では,ニューラルネットワークを一般化し,トランスフォーマーアーキテクチャを用いて獲得関数を学習する,エンド・ツー・エンドの差別化可能な最初のメタBOフレームワークを提案する。我々は、この強化学習(RL)によるエンドツーエンドのフレームワークを、ラベル付き取得データの欠如に対処できるようにします。
論文参考訳（メタデータ） (2023-05-25T10:58:46Z)
Deep Learning based pipeline for anomaly detection and quality enhancement in industrial binder jetting processes [68.8204255655161]
異常検出は、通常の値空間とは異なる異常状態、インスタンス、あるいはデータポイントを検出する方法を記述する。本稿では,産業生産における人工知能へのデータ中心のアプローチに寄与する。
論文参考訳（メタデータ） (2022-09-21T08:14:34Z)
Toward Fault Detection in Industrial Welding Processes with Deep Learning and Data Augmentation [0.0]
本稿では,AIツールの産業的実現における課題について述べる。我々はオブジェクト検出APIからオブジェクト検出アルゴリズムを使用し、転送学習を用いてユースケースに適応する。画像拡張によるデータセットの適度なスケーリングは、結合(IoU)とリコールの交差点の改善につながる。
論文参考訳（メタデータ） (2021-06-18T14:52:49Z)
DEALIO: Data-Efficient Adversarial Learning for Imitation from Observation [57.358212277226315]
観察ifoからの模倣学習において、学習エージェントは、実演者の生成した制御信号にアクセスせずに、実演行動の観察のみを用いて実演エージェントを模倣しようとする。近年、逆模倣学習に基づく手法は、ifO問題に対する最先端のパフォーマンスをもたらすが、データ非効率でモデルなしの強化学習アルゴリズムに依存するため、サンプルの複雑さに悩まされることが多い。この問題は、サンプルの収集が時間、エネルギー、およびリスクの面で高いコストを被る可能性がある現実世界の設定に展開することは非現実的です。よりデータ効率の高いifOアルゴリズムを提案する。
論文参考訳（メタデータ） (2021-03-31T23:46:32Z)
Anomaly Detection Based on Selection and Weighting in Latent Space [73.01328671569759]
SWADと呼ばれる新しい選択および重み付けに基づく異常検出フレームワークを提案する。ベンチマークと実世界のデータセットによる実験は、SWADの有効性と優位性を示している。
論文参考訳（メタデータ） (2021-03-08T10:56:38Z)
DAGA: Data Augmentation with a Generation Approach for Low-resource Tagging Tasks [88.62288327934499]
線形化ラベル付き文に基づいて訓練された言語モデルを用いた新しい拡張手法を提案する。本手法は, 教師付き設定と半教師付き設定の両方に適用可能である。
論文参考訳（メタデータ） (2020-11-03T07:49:15Z)
A Survey on Large-scale Machine Learning [67.6997613600942]
機械学習はデータに対する深い洞察を与え、マシンが高品質な予測を行うことを可能にする。ほとんどの高度な機械学習アプローチは、大規模なデータを扱う場合の膨大な時間コストに悩まされる。大規模機械学習は、ビッグデータからパターンを、同等のパフォーマンスで効率的に学習することを目的としている。
論文参考訳（メタデータ） (2020-08-10T06:07:52Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。