論文の概要: Investigation of the Impact of Synthetic Training Data in the Industrial
Application of Terminal Strip Object Detection
- arxiv url: http://arxiv.org/abs/2403.04809v1
- Date: Wed, 6 Mar 2024 18:33:27 GMT
- ステータス: 処理完了
- システム内更新日: 2024-03-11 22:05:49.733660
- Title: Investigation of the Impact of Synthetic Training Data in the Industrial
Application of Terminal Strip Object Detection
- Title(参考訳): 端末ストリップ物体検出の産業応用における合成訓練データの影響の検討
- Authors: Nico Baumgart, Markus Lange-Hegermann, Mike M\"ucke
- Abstract要約: 本稿では,端末ストリップ物体検出の複雑な産業応用における標準対象検出器のシム・トゥ・リアル一般化性能について検討する。
評価のために300個の実画像に手動でアノテートを行った結果,どちらの領域でも同じ規模の興味の対象が重要であることがわかった。
- 参考スコア(独自算出の注目度): 4.327763441385371
- License: http://creativecommons.org/licenses/by-nc-sa/4.0/
- Abstract: In industrial manufacturing, numerous tasks of visually inspecting or
detecting specific objects exist that are currently performed manually or by
classical image processing methods. Therefore, introducing recent deep learning
models to industrial environments holds the potential to increase productivity
and enable new applications. However, gathering and labeling sufficient data is
often intractable, complicating the implementation of such projects. Hence,
image synthesis methods are commonly used to generate synthetic training data
from 3D models and annotate them automatically, although it results in a
sim-to-real domain gap. In this paper, we investigate the sim-to-real
generalization performance of standard object detectors on the complex
industrial application of terminal strip object detection. Combining domain
randomization and domain knowledge, we created an image synthesis pipeline for
automatically generating the training data. Moreover, we manually annotated 300
real images of terminal strips for the evaluation. The results show the
cruciality of the objects of interest to have the same scale in either domain.
Nevertheless, under optimized scaling conditions, the sim-to-real performance
difference in mean average precision amounts to 2.69 % for RetinaNet and 0.98 %
for Faster R-CNN, qualifying this approach for industrial requirements.
- Abstract(参考訳): 工業生産では、現在手動または古典的な画像処理手法によって実行されている特定の物体を視覚的に検査または検出するタスクが多数存在する。
したがって、近年のディープラーニングモデルを産業環境に導入することは、生産性を高め、新しいアプリケーションを可能にする可能性を秘めている。
しかし、十分なデータの収集とラベル付けは、しばしば難解であり、そのようなプロジェクトの実装を複雑にする。
したがって、画像合成法は3dモデルから合成トレーニングデータを生成し、自動的に注釈を付けるためによく用いられるが、シム・トゥ・リアル領域のギャップが生じる。
本稿では,端末ストリップ物体検出の複雑な産業応用における標準物体検出器のsim-to-real一般化性能について検討する。
ドメインのランダム化とドメインの知識を組み合わせることで、トレーニングデータを自動的に生成する画像合成パイプラインを作成しました。
さらに,評価のための実画像300枚を手作業でアノテートした。
その結果、どちらの領域でも同じ規模の関心の対象が重要であることが示された。
それでも、最適化されたスケーリング条件下では、平均的な平均精度におけるsim-to-realのパフォーマンス差は、RetinaNetでは2.69 %、より高速なR-CNNでは0.98 %となり、このアプローチは工業的要求に対して適している。
関連論文リスト
- IPAD: Industrial Process Anomaly Detection Dataset [71.39058003212614]
ビデオ異常検出(VAD)は,ビデオフレーム内の異常を認識することを目的とした課題である。
本稿では,産業シナリオにおけるVADに特化して設計された新しいデータセットIPADを提案する。
このデータセットは16の異なる産業用デバイスをカバーし、合成ビデオと実世界のビデオの両方を6時間以上保存している。
論文 参考訳(メタデータ) (2024-04-23T13:38:01Z) - Deep Domain Adaptation: A Sim2Real Neural Approach for Improving Eye-Tracking Systems [80.62854148838359]
眼球画像のセグメンテーションは、最終視線推定に大きな影響を及ぼす眼球追跡の重要なステップである。
対象視線画像と合成訓練データとの重なり合いを測定するために,次元還元法を用いている。
提案手法は,シミュレーションと実世界のデータサンプルの相違に対処する際の頑健で,性能が向上する。
論文 参考訳(メタデータ) (2024-03-23T22:32:06Z) - Controllable Image Synthesis of Industrial Data Using Stable Diffusion [2.021800129069459]
本稿では,産業データに基づく汎用事前学習型生成モデルの再利用手法を提案する。
まず、モデルに新しい概念を学習させ、新しいデータ分布を学習させる。
そこで我々は,その生成過程の条件付けを強制的に行ない,よく定義されたトポロジ的特徴を満たす産業用画像を生成する。
論文 参考訳(メタデータ) (2024-01-06T08:09:24Z) - HaDR: Applying Domain Randomization for Generating Synthetic Multimodal
Dataset for Hand Instance Segmentation in Cluttered Industrial Environments [0.0]
本研究では、ドメインランダム化を用いて、マルチモーダルインスタンスセグメンテーションモデルのトレーニングのための合成RGB-Dデータセットを生成する。
提案手法により,既存の最先端データセットでトレーニングしたモデルよりも優れた性能が得られることを示す。
論文 参考訳(メタデータ) (2023-04-12T13:02:08Z) - A New Benchmark: On the Utility of Synthetic Data with Blender for Bare
Supervised Learning and Downstream Domain Adaptation [42.2398858786125]
コンピュータビジョンにおけるディープラーニングは、大規模ラベル付きトレーニングデータの価格で大きな成功を収めた。
制御不能なデータ収集プロセスは、望ましくない重複が存在する可能性のある非IIDトレーニングおよびテストデータを生成する。
これを回避するために、ドメインランダム化による3Dレンダリングによる合成データを生成する方法がある。
論文 参考訳(メタデータ) (2023-03-16T09:03:52Z) - Synthetic Data for Object Classification in Industrial Applications [53.180678723280145]
オブジェクト分類では、オブジェクトごとに、異なる条件下で、多数の画像を取得することは必ずしも不可能である。
本研究は,学習データセット内の限られたデータに対処するゲームエンジンを用いた人工画像の作成について検討する。
論文 参考訳(メタデータ) (2022-12-09T11:43:04Z) - A Generative Approach for Production-Aware Industrial Network Traffic
Modeling [70.46446906513677]
ドイツにあるTrumpf工場に配備されたレーザー切断機から発生するネットワークトラフィックデータについて検討した。
我々は、トラフィック統計を分析し、マシンの内部状態間の依存関係をキャプチャし、ネットワークトラフィックを生産状態依存プロセスとしてモデル化する。
可変オートエンコーダ(VAE)、条件付き可変オートエンコーダ(CVAE)、生成逆ネットワーク(GAN)など、様々な生成モデルの性能の比較を行った。
論文 参考訳(メタデータ) (2022-11-11T09:46:58Z) - Deep Learning based pipeline for anomaly detection and quality
enhancement in industrial binder jetting processes [68.8204255655161]
異常検出は、通常の値空間とは異なる異常状態、インスタンス、あるいはデータポイントを検出する方法を記述する。
本稿では,産業生産における人工知能へのデータ中心のアプローチに寄与する。
論文 参考訳(メタデータ) (2022-09-21T08:14:34Z) - Neural-Sim: Learning to Generate Training Data with NeRF [31.81496344354997]
本稿では,ニューラルレージアンスフィールド(NeRF)を対象アプリケーションの損失関数を持つ閉ループに使用した,最初の完全微分可能な合成データパイプラインを提案する。
提案手法は,人的負担を伴わないオンデマンドでデータを生成し,目標タスクの精度を最大化する。
論文 参考訳(メタデータ) (2022-07-22T22:48:33Z) - Multi-Spectral Image Synthesis for Crop/Weed Segmentation in Precision
Farming [3.4788711710826083]
本稿では, 精密農業における作物・雑草の分枝化問題に適用し, 共通データ増分法に関する代替手法を提案する。
我々は、最も関連性の高いオブジェクトクラス(作物や雑草)を合成されたクラスに置き換えることで、半人工的なサンプルを作成する。
RGBデータに加えて、近赤外(NIR)情報も考慮し、4つのチャネルマルチスペクトル合成画像を生成する。
論文 参考訳(メタデータ) (2020-09-12T08:49:36Z) - SideInfNet: A Deep Neural Network for Semi-Automatic Semantic
Segmentation with Side Information [83.03179580646324]
本稿では,新たなディープニューラルネットワークアーキテクチャであるSideInfNetを提案する。
画像から学習した機能とユーザアノテーションから抽出したサイド情報を統合する。
提案手法を評価するために,提案したネットワークを3つのセマンティックセグメンテーションタスクに適用し,ベンチマークデータセットに対する広範な実験を行った。
論文 参考訳(メタデータ) (2020-02-07T06:10:54Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。