論文の概要: The Second-place Solution for CVPR VISION 23 Challenge Track 1 -- Data
Effificient Defect Detection
- arxiv url: http://arxiv.org/abs/2306.14116v1
- Date: Sun, 25 Jun 2023 03:37:02 GMT
- ステータス: 処理完了
- システム内更新日: 2023-06-27 16:41:49.298139
- Title: The Second-place Solution for CVPR VISION 23 Challenge Track 1 -- Data
Effificient Defect Detection
- Title(参考訳): CVPR Vision 23 Challenge Track 1 - データ有効欠陥検出のための第2位ソリューション
- Authors: Xian Tao, Zhen Qu, Hengliang Luo, Jianwen Han, Yonghao He, Danfeng
Liu, Chengkan Lv, Fei Shen, Zhengtao Zhang
- Abstract要約: データ有効欠陥検出のためのビジョンチャレンジトラック1は、競合相手がデータ不足の環境で14の産業検査データセットを例示する必要がある。
この課題に対して、Aoi-overfiting-Teamチームの技術詳細を紹介します。
- 参考スコア(独自算出の注目度): 3.4853769431047907
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: The Vision Challenge Track 1 for Data-Effificient Defect Detection requires
competitors to instance segment 14 industrial inspection datasets in a
data-defificient setting. This report introduces the technical details of the
team Aoi-overfifitting-Team for this challenge. Our method focuses on the key
problem of segmentation quality of defect masks in scenarios with limited
training samples. Based on the Hybrid Task Cascade (HTC) instance segmentation
algorithm, we connect the transformer backbone (Swin-B) through composite
connections inspired by CBNetv2 to enhance the baseline results. Additionally,
we propose two model ensemble methods to further enhance the segmentation
effect: one incorporates semantic segmentation into instance segmentation,
while the other employs multi-instance segmentation fusion algorithms. Finally,
using multi-scale training and test-time augmentation (TTA), we achieve an
average mAP@0.50:0.95 of more than 48.49% and an average mAR@0.50:0.95 of
66.71% on the test set of the Data Effificient Defect Detection Challenge. The
code is available at https://github.com/love6tao/Aoi-overfitting-team
- Abstract(参考訳): データ効率のよい欠陥検出のためのヴィジョンチャレンジトラック1は、競合相手がデータ不足設定の工業検査データセット14をインスタンスに要求する。
本報告では,この課題に対するaoi-overfitting-teamの技術的詳細を紹介する。
本手法は,限られたトレーニングサンプルを持つシナリオにおける欠陥マスクのセグメンテーション品質の重要な問題に焦点を当てる。
ハイブリッドタスクカスケード(htc)インスタンスセグメンテーションアルゴリズムに基づいて、cbnetv2にインスパイアされた複合接続を介してトランスフォーマーバックボーン(swin-b)を接続し、ベースライン結果を強化する。
さらに,セグメンテーション効果をさらに高めるためのモデルアンサンブル手法を提案する。1つは意味セグメンテーションをインスタンスセグメンテーションに,もう1つはマルチインスタンスセグメンテーション融合アルゴリズムを用いる。
最後に,マルチスケールトレーニングとテストタイム拡張 (tta) を用いて,48.49%以上の平均map@0.50:0.95と,データ欠失検出課題のテストセットで平均mar@0.50:0.95を66.71%とした。
コードはhttps://github.com/love6tao/aoi-overfitting-teamで入手できる。
関連論文リスト
- Segment Every Out-of-Distribution Object [24.495734304922244]
本稿では,意味的セグメンテーションにおけるOoD検出の簡易かつ効果的なフレームワークであるS2Mと呼ばれる,異常な textbfScore textbfTo セグメンテーション textbfMask を変換する手法を提案する。
異常スコアをプロンプト可能なセグメンテーションモデルへのプロンプトに変換することで、S2Mはしきい値の選択を不要にする。
論文 参考訳(メタデータ) (2023-11-27T18:20:03Z) - Instance Segmentation under Occlusions via Location-aware Copy-Paste
Data Augmentation [8.335108002480068]
MMSports 2023 DeepSportRadarは、バスケットボールのコンテキスト内での人間の対象のセグメンテーションに焦点を当てたデータセットを導入した。
この課題は、堅牢なデータ拡張技術と賢明なディープラーニングアーキテクチャの適用を必要とする。
我々の研究(コンペで1位)は、まず、より広い分布でより多くのトレーニングサンプルを生成することのできる、新しいデータ拡張技術を提案する。
論文 参考訳(メタデータ) (2023-10-27T07:44:25Z) - You Only Look at Once for Real-time and Generic Multi-Task [20.61477620156465]
A-YOLOMは適応的でリアルタイムで軽量なマルチタスクモデルである。
我々は,統一的で合理化されたセグメンテーション構造を持つエンドツーエンドのマルチタスクモデルを開発した。
BDD100kデータセットで競合的な結果が得られます。
論文 参考訳(メタデータ) (2023-10-02T21:09:43Z) - Domain Adaptive Synapse Detection with Weak Point Annotations [63.97144211520869]
弱点アノテーションを用いたドメイン適応型シナプス検出のためのフレームワークであるAdaSynを提案する。
I SBI 2023のWASPSYNチャレンジでは、我々の手法が第1位にランクインした。
論文 参考訳(メタデータ) (2023-08-31T05:05:53Z) - AcroFOD: An Adaptive Method for Cross-domain Few-shot Object Detection [59.10314662986463]
クロスドメインの少数ショットオブジェクト検出は、いくつかの注釈付きターゲットデータで対象ドメイン内のオブジェクト検出器を適応することを目的としている。
提案手法は,複数のベンチマーク上での最先端性能を実現する。
論文 参考訳(メタデータ) (2022-09-22T10:23:40Z) - Reliable Shot Identification for Complex Event Detection via
Visual-Semantic Embedding [72.9370352430965]
本稿では,映像中の事象検出のための視覚的意味的誘導損失法を提案する。
カリキュラム学習に動機付け,高い信頼性の事例で分類器の訓練を開始するために,負の弾性正規化項を導入する。
提案する非ネット正規化問題の解法として,代替最適化アルゴリズムを開発した。
論文 参考訳(メタデータ) (2021-10-12T11:46:56Z) - Instance Segmentation Challenge Track Technical Report, VIPriors
Workshop at ICCV 2021: Task-Specific Copy-Paste Data Augmentation Method for
Instance Segmentation [0.0]
Copy-Pasteは、インスタンスセグメンテーションのための非常に効果的なデータ拡張であることが証明されている。
我々はRandAugmentやGridMaskといった追加のデータ拡張手法を適用した。
トレーニングデータに検証セットを追加することで、テストセットで0.477 AP@0.50:0.95に達した。
論文 参考訳(メタデータ) (2021-10-01T15:03:53Z) - Generative Partial Visual-Tactile Fused Object Clustering [81.17645983141773]
オブジェクトクラスタリングのためのGenerative Partial Visual-Tactile Fused(GPVTF)フレームワークを提案する。
条件付きクロスモーダルクラスタリング生成逆ネットワークを開発し、一方のモダリティ条件を他方のモダリティ上で合成する。
最後に、擬似ラベルに基づく2つのKL分割損失を用いて、対応するモダリティ固有エンコーダを更新する。
論文 参考訳(メタデータ) (2020-12-28T02:37:03Z) - The Devil is in Classification: A Simple Framework for Long-tail Object
Detection and Instance Segmentation [93.17367076148348]
本稿では,最新のロングテールLVISデータセットを用いて,最先端の2段階のインスタンスセグメンテーションモデルMask R-CNNの性能低下について検討する。
主な原因は、オブジェクト提案の不正確な分類である。
そこで本研究では,2段階のクラスバランスサンプリング手法により,分類ヘッドバイアスをより効果的に緩和する,簡単な校正フレームワークを提案する。
論文 参考訳(メタデータ) (2020-07-23T12:49:07Z) - One-Shot Object Detection without Fine-Tuning [62.39210447209698]
本稿では,第1ステージのMatching-FCOSネットワークと第2ステージのStructure-Aware Relation Moduleからなる2段階モデルを提案する。
また,検出性能を効果的に向上する新たなトレーニング戦略を提案する。
提案手法は,複数のデータセット上で一貫した最先端のワンショット性能を上回る。
論文 参考訳(メタデータ) (2020-05-08T01:59:23Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。