論文の概要: Exploring "Many in Few" and "Few in Many" Properties in Long-Tailed, Highly-Imbalanced IC Defect Classification
- arxiv url: http://arxiv.org/abs/2510.19463v1
- Date: Wed, 22 Oct 2025 10:50:27 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-10-25 03:08:15.715385
- Title: Exploring "Many in Few" and "Few in Many" Properties in Long-Tailed, Highly-Imbalanced IC Defect Classification
- Title(参考訳): 長尺・高不均衡IC欠陥分類における"Many in Few"と"Many in Many"の特性の探索
- Authors: Hao-Chiang Shao, Chun-Hao Chang, Yu-Hsien Lin, Chia-Wen Lin, Shao-Yun Fang, Yan-Hsiu Liu,
- Abstract要約: 本稿では,AOIシステムから得られた大規模かつ不均衡なIC欠陥画像データセットであるIC-Defect-14について紹介する。
このデータセットは、大きなクラス内多様性と高いクラス間類似性という2つの大きな課題を示す、独自の"イントラクラスクラスタ"特性によって特徴づけられる。
本稿では,マルチエキスパートフレームワークを踏襲したReCAME-Netを提案し,地域チャネルアテンションモジュール,メトリック学習損失,ハードカテゴリマイニング戦略,知識蒸留手法を統合する。
- 参考スコア(独自算出の注目度): 28.634908806910676
- License: http://creativecommons.org/licenses/by-nc-sa/4.0/
- Abstract: Despite significant advancements in deep classification techniques and in-lab automatic optical inspection models for long-tailed or highly imbalanced data, applying these approaches to real-world IC defect classification tasks remains challenging. This difficulty stems from two primary factors. First, real-world conditions, such as the high yield-rate requirements in the IC industry, result in data distributions that are far more skewed than those found in general public imbalanced datasets. Consequently, classifiers designed for open imbalanced datasets often fail to perform effectively in real-world scenarios. Second, real-world samples exhibit a mix of class-specific attributes and class-agnostic, domain-related features. This complexity adds significant difficulty to the classification process, particularly for highly imbalanced datasets. To address these challenges, this paper introduces the IC-Defect-14 dataset, a large, highly imbalanced IC defect image dataset sourced from AOI systems deployed in real-world IC production lines. This dataset is characterized by its unique "intra-class clusters" property, which presents two major challenges: large intra-class diversity and high inter-class similarity. These characteristics, rarely found simultaneously in existing public datasets, significantly degrade the performance of current state-of-the-art classifiers for highly imbalanced data. To tackle this challenge, we propose ReCAME-Net, which follows a multi-expert classifier framework and integrates a regional channel attention module, metric learning losses, a hard category mining strategy, and a knowledge distillation procedure. Extensive experimental evaluations demonstrate that ReCAME-Net outperforms previous state-of-the-art models on the IC-Defect-14 dataset while maintaining comparable performance and competitiveness on general public datasets.
- Abstract(参考訳): 長い尾や高度不均衡なデータに対する深層分類技術や実験室内自動光学検査モデルの大幅な進歩にもかかわらず、これらの手法を実世界のIC欠陥分類タスクに適用することは依然として困難である。
この困難は2つの主要な要因に起因している。
第一に、IC産業における高収率要求のような現実世界の条件は、一般の非均衡データセットよりもはるかに歪んだデータ分布をもたらす。
その結果、オープン不均衡データセット用に設計された分類器は、現実世界のシナリオで効果的に動作しないことが多い。
第2に、実世界のサンプルでは、クラス固有の属性と、クラスに依存しないドメイン関連の特徴が混在している。
この複雑さは、特に高度に不均衡なデータセットにおいて、分類プロセスに重大な困難をもたらす。
これらの課題に対処するために,本論文では,実世界のIC生産ラインにデプロイされたAOIシステムから得られた大規模かつ不均衡なIC欠陥画像データセットであるIC-Defect-14データセットを紹介する。
このデータセットは、大きなクラス内多様性と高いクラス間類似性という2つの大きな課題を示す、独自の"イントラクラスクラスタ"特性によって特徴づけられる。
これらの特徴は、既存の公開データセットで同時に見られることはめったにないが、高度に不均衡なデータに対する現在の最先端の分類器の性能を著しく低下させる。
この課題に対処するため、マルチエキスパート分類器フレームワークを踏襲したReCAME-Netを提案し、地域チャネルアテンションモジュール、メートル法学習損失、ハードカテゴリマイニング戦略、知識蒸留手順を統合する。
大規模な実験的評価では、ReCAME-NetはIC-Defect-14データセットで過去の最先端モデルよりも優れ、一般のデータセットでは同等のパフォーマンスと競争性を維持している。
関連論文リスト
- Learning Robust Diffusion Models from Imprecise Supervision [75.53546939251146]
DMISは、Imrecise Supervisionから堅牢な条件拡散モデルをトレーニングするための統一されたフレームワークである。
我々のフレームワークは、可能性から派生し、その目的を生成的および分類的構成要素に分解する。
画像生成、弱教師付き学習、データセットの凝縮をカバーし、様々な形の不正確な監視実験を行い、DMISが常に高品質でクラス差別的なサンプルを生成することを示した。
論文 参考訳(メタデータ) (2025-10-03T14:00:32Z) - Open-Set Semi-Supervised Learning for Long-Tailed Medical Datasets [17.82752126823939]
現実世界の一般化には、現実世界で遭遇する様々な複雑さを考慮する必要がある。
半教師付きアプローチを用いて、高度に不均衡な医療データセットに対するオープンセット学習法を提案する。
分析の結果、分類におけるロングテールデータの影響に対処することで、ネットワーク全体の性能が大幅に向上することが示された。
論文 参考訳(メタデータ) (2025-05-20T19:21:38Z) - Imbalance-Aware Culvert-Sewer Defect Segmentation Using an Enhanced Feature Pyramid Network [1.7466076090043157]
本稿では,不均衡なデータセット内での変質管と下水道管のセマンティックセグメンテーションの深層学習モデルを提案する。
このモデルは、データセットの不均衡に対応するために、クラス分解やデータ拡張のような戦略を採用している。
E-FPNが最先端の手法より優れていることを示す。
論文 参考訳(メタデータ) (2024-08-19T17:40:18Z) - Tackling Diverse Minorities in Imbalanced Classification [80.78227787608714]
不均衡データセットは、様々な現実世界のアプリケーションで一般的に見られ、分類器の訓練において重要な課題が提示されている。
マイノリティクラスとマイノリティクラスの両方のデータサンプルを混合することにより、反復的に合成サンプルを生成することを提案する。
提案するフレームワークの有効性を,7つの公開ベンチマークデータセットを用いて広範な実験により実証する。
論文 参考訳(メタデータ) (2023-08-28T18:48:34Z) - Stabilizing and Improving Federated Learning with Non-IID Data and
Client Dropout [15.569507252445144]
ラベル分布スキューによるデータヘテロジェニーティは、フェデレート学習におけるモデル性能を制限する重要な障害であることが示されている。
クロスエントロピー損失を計算するための事前校正ソフトマックス関数を導入することで、シンプルで効果的なフレームワークを提案する。
非IIDデータとクライアントドロップアウトの存在下で、既存のベースラインよりも優れたモデル性能を示す。
論文 参考訳(メタデータ) (2023-03-11T05:17:59Z) - Integrating Local Real Data with Global Gradient Prototypes for
Classifier Re-Balancing in Federated Long-Tailed Learning [60.41501515192088]
フェデレートラーニング(FL)は、グローバルモデルを協調的にトレーニングする複数のクライアントを含む、人気のある分散ラーニングパラダイムになっています。
データサンプルは通常、現実世界の長い尾の分布に従っており、分散化された長い尾のデータのFLは、貧弱なグローバルモデルをもたらす。
本研究では、局所的な実データとグローバルな勾配のプロトタイプを統合し、局所的なバランスの取れたデータセットを形成する。
論文 参考訳(メタデータ) (2023-01-25T03:18:10Z) - DataPerf: Benchmarks for Data-Centric AI Development [81.03754002516862]
DataPerfは、MLデータセットとデータ中心アルゴリズムを評価するための、コミュニティ主導のベンチマークスイートである。
私たちは、この反復的な開発をサポートするために、複数の課題を抱えたオープンなオンラインプラットフォームを提供しています。
ベンチマーク、オンライン評価プラットフォーム、ベースライン実装はオープンソースである。
論文 参考訳(メタデータ) (2022-07-20T17:47:54Z) - Long-Tailed Recognition Using Class-Balanced Experts [128.73438243408393]
本稿では,多様な分類器の強度を組み合わせたクラスバランスの専門家のアンサンブルを提案する。
私たちのクラスバランスの専門家のアンサンブルは、最先端に近い結果に到達し、長い尾の認識のための2つのベンチマークで新たな最先端のアンサンブルを確立します。
論文 参考訳(メタデータ) (2020-04-07T20:57:44Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。