論文の概要: ContextMix: A context-aware data augmentation method for industrial
visual inspection systems
- arxiv url: http://arxiv.org/abs/2401.10050v1
- Date: Thu, 18 Jan 2024 15:15:32 GMT
- ステータス: 処理完了
- システム内更新日: 2024-01-19 16:12:44.008322
- Title: ContextMix: A context-aware data augmentation method for industrial
visual inspection systems
- Title(参考訳): ContextMix:産業用視覚検査システムのためのコンテキスト対応データ拡張手法
- Authors: Hyungmin Kim, Donghun Kim, Pyunghwan Ahn, Sungho Suh, Hansang Cho, and
Junmo Kim
- Abstract要約: 産業アプリケーションやベンチマークデータセットに適したメソッドであるContextMixを紹介する。
ContextMixは、画像全体をリサイズし、バッチ内の他の画像に統合することで、新しいデータを生成する。
各種ネットワークアーキテクチャを用いて, 分類, 検出, セグメンテーションタスクにまたがる実効性を評価する。
- 参考スコア(独自算出の注目度): 21.35653674563189
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: While deep neural networks have achieved remarkable performance, data
augmentation has emerged as a crucial strategy to mitigate overfitting and
enhance network performance. These techniques hold particular significance in
industrial manufacturing contexts. Recently, image mixing-based methods have
been introduced, exhibiting improved performance on public benchmark datasets.
However, their application to industrial tasks remains challenging. The
manufacturing environment generates massive amounts of unlabeled data on a
daily basis, with only a few instances of abnormal data occurrences. This leads
to severe data imbalance. Thus, creating well-balanced datasets is not
straightforward due to the high costs associated with labeling. Nonetheless,
this is a crucial step for enhancing productivity. For this reason, we
introduce ContextMix, a method tailored for industrial applications and
benchmark datasets. ContextMix generates novel data by resizing entire images
and integrating them into other images within the batch. This approach enables
our method to learn discriminative features based on varying sizes from resized
images and train informative secondary features for object recognition using
occluded images. With the minimal additional computation cost of image
resizing, ContextMix enhances performance compared to existing augmentation
techniques. We evaluate its effectiveness across classification, detection, and
segmentation tasks using various network architectures on public benchmark
datasets. Our proposed method demonstrates improved results across a range of
robustness tasks. Its efficacy in real industrial environments is particularly
noteworthy, as demonstrated using the passive component dataset.
- Abstract(参考訳): ディープニューラルネットワークは目覚ましいパフォーマンスを達成したが、ネットワークパフォーマンスを過度に調整し強化するための重要な戦略として、データ拡張が登場した。
これらの技術は工業生産の文脈において特に重要である。
近年,イメージミキシングに基づく手法が導入され,公開ベンチマークデータセットのパフォーマンスが向上している。
しかし、産業業務への応用は依然として困難である。
製造環境は、異常なデータが発生する事例はごくわずかであり、毎日大量の未ラベルデータを生成する。
これは厳しいデータの不均衡につながる。
したがって、ラベル付けに伴う高コストのため、バランスのとれたデータセットの作成は簡単ではない。
それでも、これは生産性を高めるための重要なステップです。
このような理由から,産業アプリケーションやベンチマークデータセットに適したContextMixを導入する。
ContextMixは、画像全体をリサイズし、バッチ内の他の画像に統合することで、新しいデータを生成する。
提案手法は,画像サイズの変化に基づいて識別特徴を学習し,隠蔽画像を用いた物体認識のための情報二次特徴を訓練する。
画像リサイズの計算コストが最小限に抑えられ、contextmixは既存の拡張技術に比べて性能が向上する。
各種ネットワークアーキテクチャを用いて, 分類, 検出, セグメンテーションタスク間での有効性を評価する。
提案手法は, 各種ロバスト性タスクにおける改善結果を示す。
実産業環境での有効性は、受動的コンポーネントデータセットを用いて示されるように、特に注目に値する。
関連論文リスト
- Enhanced Generative Data Augmentation for Semantic Segmentation via Stronger Guidance [1.2923961938782627]
制御可能拡散モデルを用いたセマンティックセグメンテーションのための効果的なデータ拡張手法を提案する。
提案手法は,クラス・プロンプト・アペンディングとビジュアル・プリミティブ・コンバインドを用いた効率的なプロンプト生成を含む。
提案手法をPASCAL VOCデータセット上で評価した結果,セマンティックセグメンテーションにおける画像の合成に極めて有効であることが判明した。
論文 参考訳(メタデータ) (2024-09-09T19:01:14Z) - A Simple Background Augmentation Method for Object Detection with Diffusion Model [53.32935683257045]
コンピュータビジョンでは、データの多様性の欠如がモデル性能を損なうことはよく知られている。
本稿では, 生成モデルの進歩を生かして, 単純かつ効果的なデータ拡張手法を提案する。
背景強化は、特にモデルの堅牢性と一般化能力を大幅に改善する。
論文 参考訳(メタデータ) (2024-08-01T07:40:00Z) - ATOM: Attention Mixer for Efficient Dataset Distillation [17.370852204228253]
本研究では,チャネルと空間的注意の混合を用いて,大規模データセットを効率よく抽出するモジュールを提案する。
どちらのタイプの注目も統合することで、ATOMモジュールは様々なコンピュータビジョンデータセットにまたがる優れた性能を示す。
論文 参考訳(メタデータ) (2024-05-02T15:15:01Z) - Enhance Image Classification via Inter-Class Image Mixup with Diffusion Model [80.61157097223058]
画像分類性能を高めるための一般的な戦略は、T2Iモデルによって生成された合成画像でトレーニングセットを増強することである。
本研究では,既存のデータ拡張技術の欠点について検討する。
Diff-Mixと呼ばれる革新的なクラス間データ拡張手法を導入する。
論文 参考訳(メタデータ) (2024-03-28T17:23:45Z) - Deep Domain Adaptation: A Sim2Real Neural Approach for Improving Eye-Tracking Systems [80.62854148838359]
眼球画像のセグメンテーションは、最終視線推定に大きな影響を及ぼす眼球追跡の重要なステップである。
対象視線画像と合成訓練データとの重なり合いを測定するために,次元還元法を用いている。
提案手法は,シミュレーションと実世界のデータサンプルの相違に対処する際の頑健で,性能が向上する。
論文 参考訳(メタデータ) (2024-03-23T22:32:06Z) - Improving the Effectiveness of Deep Generative Data [5.856292656853396]
下流の画像処理タスクのための純粋合成画像のモデルを訓練すると、実際のデータに対するトレーニングに比べ、望ましくない性能低下が生じる。
本稿では,この現象に寄与する要因を記述した新しい分類法を提案し,CIFAR-10データセットを用いて検討する。
本手法は,合成データと合成データの混合による学習と合成データのみの学習において,下流分類タスクのベースラインに優れる。
論文 参考訳(メタデータ) (2023-11-07T12:57:58Z) - ResizeMix: Mixing Data with Preserved Object Information and True Labels [57.00554495298033]
本研究は,データ混合におけるサリエンシー情報の重要性について検討し,サリエンシー情報は増補性能向上のために必要ではないことを見出した。
本稿では,より効率的で実装が容易なresizemix法を提案する。
論文 参考訳(メタデータ) (2020-12-21T03:43:13Z) - From ImageNet to Image Classification: Contextualizing Progress on
Benchmarks [99.19183528305598]
ImageNet作成プロセスにおける特定の設計選択が、結果のデータセットの忠実性に与える影響について検討する。
私たちの分析では、ノイズの多いデータ収集パイプラインが、結果のベンチマークと、それがプロキシとして機能する実世界のタスクとの間に、体系的なミスアライメントをもたらす可能性があることを指摘しています。
論文 参考訳(メタデータ) (2020-05-22T17:39:16Z) - Omni-supervised Facial Expression Recognition via Distilled Data [120.11782405714234]
ネットワークトレーニングにおいて,信頼度の高いサンプルを多量のラベルのないデータで活用するためのオムニ教師付き学習を提案する。
我々は,新しいデータセットが学習したFERモデルの能力を大幅に向上させることができることを実験的に検証した。
そこで本研究では,生成したデータセットを複数のクラスワイド画像に圧縮するために,データセット蒸留戦略を適用することを提案する。
論文 参考訳(メタデータ) (2020-05-18T09:36:51Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。