論文の概要: VISION Datasets: A Benchmark for Vision-based InduStrial InspectiON
- arxiv url: http://arxiv.org/abs/2306.07890v2
- Date: Sun, 18 Jun 2023 01:11:04 GMT
- ステータス: 処理完了
- システム内更新日: 2023-06-22 00:52:52.794281
- Title: VISION Datasets: A Benchmark for Vision-based InduStrial InspectiON
- Title(参考訳): vision datasets: 視覚に基づく産業検査のベンチマーク
- Authors: Haoping Bai, Shancong Mou, Tatiana Likhomanenko, Ramazan Gokberk
Cinbis, Oncel Tuzel, Ping Huang, Jiulong Shan, Jianjun Shi, Meng Cao
- Abstract要約: VISIONデータセットは14の産業検査データセットの多種多様なコレクションである。
44の欠陥タイプを含む合計18kイメージにより、VISIONはさまざまな実世界のプロダクションシナリオを反映しようと試みている。
- 参考スコア(独自算出の注目度): 28.511625423590605
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Despite progress in vision-based inspection algorithms, real-world industrial
challenges -- specifically in data availability, quality, and complex
production requirements -- often remain under-addressed. We introduce the
VISION Datasets, a diverse collection of 14 industrial inspection datasets,
uniquely poised to meet these challenges. Unlike previous datasets, VISION
brings versatility to defect detection, offering annotation masks across all
splits and catering to various detection methodologies. Our datasets also
feature instance-segmentation annotation, enabling precise defect
identification. With a total of 18k images encompassing 44 defect types, VISION
strives to mirror a wide range of real-world production scenarios. By
supporting two ongoing challenge competitions on the VISION Datasets, we hope
to foster further advancements in vision-based industrial inspection.
- Abstract(参考訳): ビジョンベースの検査アルゴリズムの進歩にもかかわらず、データ可用性、品質、複雑な生産要件など、現実の産業上の課題は、しばしば未解決のままである。
我々は,14の産業検査データセットの多種多様なコレクションであるvision datasetsを紹介する。
以前のデータセットとは異なり、VISIONは欠陥検出に汎用性をもたらし、すべての分割にアノテーションマスクを提供し、さまざまな検出方法に対処する。
データセットにはインスタンスセグメンテーションアノテーションがあり、正確な欠陥識別を可能にします。
44の欠陥を含む合計18kイメージにより、VISIONは幅広い実世界のプロダクションシナリオを反映しようと試みている。
Vision Datasetsで進行中の2つのチャレンジコンペティションを支援することで、ビジョンベースの産業検査のさらなる進歩を期待する。
関連論文リスト
- Advancing Anomaly Detection: An Adaptation Model and a New Dataset [2.290956583394892]
本研究では,事前学習したモデルの新たな概念への適応を高速化するシナリオ適応型異常検出(SA2D)手法を提案する。
様々なカメラビューから捉えた14のシナリオを含むマルチシナリオ異常検出(Multi-Scenario Anomaly Detection, MAD)データセットについて紹介する。
以上の結果から,SA2Dは同一シナリオ内での新たな視点に優れるだけでなく,全く新しいシナリオに直面した場合の競争性能も向上することが示された。
論文 参考訳(メタデータ) (2024-02-07T13:54:56Z) - A Survey on Visual Anomaly Detection: Challenge, Approach, and Prospect [29.006716009327032]
視覚異常検出(VAD)は、視覚データの正常性の概念から逸脱を識別する試みであり、工業的欠陥検査や医学的病変検出など、様々な領域に広く適用されている。
本調査は,1)トレーニングデータの不足,2)視覚的モダリティの多様性,3)階層的異常の複雑さの3つの主要な課題を同定することにより,最近のVADの進歩を包括的に検証する。
論文 参考訳(メタデータ) (2024-01-29T18:41:21Z) - InsPLAD: A Dataset and Benchmark for Power Line Asset Inspection in UAV
Images [1.8524180288472398]
本稿では,高分解能無人航空機カラー画像10,607点を含むパワーライン・アセット・インスペクション・データセットであるInsPLADとベンチマークを紹介する。
データセットには、現実世界の電力線から取得した17のユニークな電力線資産が含まれている。
我々は、InsPLADがカバーする3つの画像レベルのコンピュータビジョンタスクに対して、APメトリックによるオブジェクト検出、バランス精度による欠陥分類、AUROCメトリックによる異常検出の3つについて、最先端および一般的な手法を徹底的に評価した。
論文 参考訳(メタデータ) (2023-11-02T22:06:23Z) - Improving Vision Anomaly Detection with the Guidance of Language
Modality [64.53005837237754]
本稿では,マルチモーダルの観点から視覚モダリティの課題に取り組む。
本稿では,冗長な情報問題とスパース空間問題に対処するために,クロスモーダルガイダンス(CMG)を提案する。
視覚異常検出のためのよりコンパクトな潜在空間を学習するために、CMLEは言語モダリティから相関構造行列を学習する。
論文 参考訳(メタデータ) (2023-10-04T13:44:56Z) - Wild Face Anti-Spoofing Challenge 2023: Benchmark and Results [73.98594459933008]
顔認証システム(FAS)は、顔認識システムの完全性を保護するための重要なメカニズムである。
この制限は、公開可能なFASデータセットの不足と多様性の欠如に起因する可能性がある。
制約のない環境で収集された大規模で多様なFASデータセットであるWild Face Anti-Spoofingデータセットを紹介した。
論文 参考訳(メタデータ) (2023-04-12T10:29:42Z) - Universal Object Detection with Large Vision Model [79.06618136217142]
本研究は,大規模多領域普遍物体検出問題に焦点をあてる。
これらの課題に対処するために,ラベル処理,階層型設計,資源効率のよいモデルトレーニングを提案する。
本手法は,ロバスト・ビジョン・チャレンジ2022のオブジェクト検出トラックにおいて,優れた2位の地位を確保した。
論文 参考訳(メタデータ) (2022-12-19T12:40:13Z) - MetaGraspNet: A Large-Scale Benchmark Dataset for Scene-Aware
Ambidextrous Bin Picking via Physics-based Metaverse Synthesis [72.85526892440251]
本稿では,物理に基づくメタバース合成により構築した大規模写真リアリスティックビンピックデータセットであるMetaGraspNetを紹介する。
提案データセットは,82種類の記事に対して217kのRGBD画像を含み,オブジェクト検出,アモーダル認識,キーポイント検出,操作順序,および並列ジャウと真空グリップパー用のアンビデクストグリップラベルの完全なアノテーションを備える。
また,2.3k以上の完全アノテートされた高品質なRGBD画像からなる実際のデータセットを5段階の難易度と,異なるオブジェクトおよびレイアウト特性を評価するための見えないオブジェクトセットに分割する。
論文 参考訳(メタデータ) (2022-08-08T08:15:34Z) - Uncertainty-Aware Multi-View Representation Learning [53.06828186507994]
動的不確実性認識ネットワーク(DUA-Nets)と呼ばれる新しい教師なし多視点学習手法を考案する。
生成視点から推定されるデータの不確実性により、複数の視点からの固有情報が統合され、ノイズのない表現が得られる。
本モデルでは, 広範囲な実験において優れた性能を示し, ノイズの多いデータに対するロバスト性を示す。
論文 参考訳(メタデータ) (2022-01-15T07:16:20Z) - Mixed supervision for surface-defect detection: from weakly to fully
supervised learning [5.69361786082969]
本研究では,教師あり学習手法の重い要件を緩和し,高度に詳細なアノテーションの必要性を低減した。
ディープラーニングアーキテクチャを提案することにより、混合監視による弱い(画像レベル)ラベルから表面欠陥検出タスクの完全な(ピクセルレベル)アノテーションまで、さまざまな詳細のアノテーションの使用を検討する。
提案手法は,すべての関連手法を完全監督設定で上回るとともに,画像レベルラベルのみを利用可能な場合の弱監督方式を上回る。
論文 参考訳(メタデータ) (2021-04-13T10:00:10Z) - A Variational Information Bottleneck Approach to Multi-Omics Data
Integration [98.6475134630792]
本稿では,不完全な多視点観測のための深い変動情報ボトルネック (IB) 手法を提案する。
本手法は,対象物に関連のある視点内および視点間相互作用に焦点をあてるために,観測された視点の辺縁および結合表現にISBフレームワークを適用した。
実世界のデータセットの実験から、我々の手法はデータ統合から常に利益を得て、最先端のベンチマークより優れています。
論文 参考訳(メタデータ) (2021-02-05T06:05:39Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。