論文の概要: Outliers resistant image classification by anomaly detection
- arxiv url: http://arxiv.org/abs/2411.10150v1
- Date: Fri, 15 Nov 2024 12:43:38 GMT
- ステータス: 翻訳完了
- システム内更新日: 2024-11-18 15:38:12.310660
- Title: Outliers resistant image classification by anomaly detection
- Title(参考訳): 異常検出による外部抵抗画像分類
- Authors: Anton Sergeev, Victor Minchenkov, Aleksei Soldatov, Vasiliy Kakurin, Yaroslav Mazikov,
- Abstract要約: 本研究では,分類と異常検出を同時に行うモデルを提案する。
距離学習を用いて多次元空間における画像のベクトル表現を生成し、次にクロスエントロピーを用いた分類を行う。
様々なコンピュータビジョンモデルアーキテクチャを用いて実験を行った。
- 参考スコア(独自算出の注目度): 0.0
- License:
- Abstract: Various technologies, including computer vision models, are employed for the automatic monitoring of manual assembly processes in production. These models detect and classify events such as the presence of components in an assembly area or the connection of components. A major challenge with detection and classification algorithms is their susceptibility to variations in environmental conditions and unpredictable behavior when processing objects that are not included in the training dataset. As it is impractical to add all possible subjects in the training sample, an alternative solution is necessary. This study proposes a model that simultaneously performs classification and anomaly detection, employing metric learning to generate vector representations of images in a multidimensional space, followed by classification using cross-entropy. For experimentation, a dataset of over 327,000 images was prepared. Experiments were conducted with various computer vision model architectures, and the outcomes of each approach were compared.
- Abstract(参考訳): コンピュータビジョンモデルを含む様々な技術が、生産中の手動組立プロセスの自動監視に用いられている。
これらのモデルは、アセンブリ領域内のコンポーネントの存在やコンポーネントの接続など、イベントを検出して分類する。
検出と分類アルゴリズムにおける大きな課題は、トレーニングデータセットに含まれていないオブジェクトを処理する際に、環境条件や予測不可能な振る舞いへの感受性である。
トレーニングサンプルに可能なすべての主題を追加することは現実的ではないため、別の解決策が必要である。
本研究では,多次元空間における画像のベクトル表現を生成するために,計量学習を用いて分類と異常検出を同時に行うモデルを提案し,次にクロスエントロピーを用いた分類を行う。
実験のために327,000枚以上の画像のデータセットが作成された。
様々なコンピュータビジョンモデルアーキテクチャを用いて実験を行い、それぞれのアプローチの結果を比較した。
関連論文リスト
- Reinforcing Pre-trained Models Using Counterfactual Images [54.26310919385808]
本稿では,言語誘導型生成対実画像を用いた分類モデル強化のための新しいフレームワークを提案する。
逆ファクト画像データセットを用いてモデルをテストすることにより、モデルの弱点を同定する。
我々は、分類モデルを微調整し強化するために、デファクトイメージを拡張データセットとして採用する。
論文 参考訳(メタデータ) (2024-06-19T08:07:14Z) - Visual Context-Aware Person Fall Detection [52.49277799455569]
画像中の個人とオブジェクトを半自動分離するセグメンテーションパイプラインを提案する。
ベッド、椅子、車椅子などの背景オブジェクトは、転倒検知システムに挑戦し、誤ったポジティブアラームを引き起こす。
トレーニング中のオブジェクト固有のコンテキスト変換が、この課題を効果的に軽減することを示す。
論文 参考訳(メタデータ) (2024-04-11T19:06:36Z) - MTP: Advancing Remote Sensing Foundation Model via Multi-Task Pretraining [73.81862342673894]
ファンデーションモデルは、様々な画像解釈タスクを強化することで、リモートセンシング(RS)のランドスケープを再構築した。
事前訓練されたモデルを下流のタスクに転送することは、イメージ分類やオブジェクト識別タスクとして事前訓練の定式化によるタスクの相違に遭遇する可能性がある。
SAMRSデータセット上で、セマンティックセグメンテーション、インスタンスセグメンテーション、回転オブジェクト検出を含むマルチタスクによる事前トレーニングを行う。
我々のモデルは、シーン分類、水平・回転物体検出、セマンティックセグメンテーション、変化検出など、様々なRS下流タスクに基づいて微調整される。
論文 参考訳(メタデータ) (2024-03-20T09:17:22Z) - Self-Calibrating Anomaly and Change Detection for Autonomous Inspection
Robots [0.07366405857677225]
視覚異常または変化検出アルゴリズムは、参照画像やデータセットとは異なる画像の領域を特定する。
本研究では,事前の未知環境における異常や変化を検出するための総合的なディープラーニングフレームワークを提案する。
論文 参考訳(メタデータ) (2022-08-26T09:52:12Z) - Test-time Adaptation with Slot-Centric Models [63.981055778098444]
Slot-TTAは、半教師付きシーン分解モデルであり、シーンごとのテスト時間は、再構成やクロスビュー合成の目的に対する勾配降下を通じて適用される。
我々は、最先端の監視フィードフォワード検出器と代替テスト時間適応法に対して、配電性能が大幅に向上したことを示す。
論文 参考訳(メタデータ) (2022-03-21T17:59:50Z) - Zero-sample surface defect detection and classification based on
semantic feedback neural network [13.796631421521765]
本論文では,複数角度からの画像タグ埋め込みにおける予測誤差を適応的に低減するアンサンブル協調学習アルゴリズムを提案する。
産業分野におけるゼロショットデータセットとシリンダーライナーデータセットを用いた各種実験により,競争結果が得られた。
論文 参考訳(メタデータ) (2021-06-15T08:26:36Z) - Meta-learning One-class Classifiers with Eigenvalue Solvers for
Supervised Anomaly Detection [55.888835686183995]
教師付き異常検出のためのニューラルネットワークに基づくメタラーニング手法を提案する。
提案手法は,既存の異常検出法や少数ショット学習法よりも優れた性能を実現することを実験的に実証した。
論文 参考訳(メタデータ) (2021-03-01T01:43:04Z) - A Background-Agnostic Framework with Adversarial Training for Abnormal
Event Detection in Video [120.18562044084678]
近年,ビデオにおける異常事象検出は複雑なコンピュータビジョンの問題として注目されている。
通常のイベントのみを含むトレーニングビデオから学習するバックグラウンドに依存しないフレームワークを提案する。
論文 参考訳(メタデータ) (2020-08-27T18:39:24Z) - Online Graph Completion: Multivariate Signal Recovery in Computer Vision [29.89364298411089]
グラフ上で定義された「完了」問題について検討し、追加測定の要求を順次行う必要がある。
グラフのフーリエ領域における最適化モデルを設計し、適応的な部分モジュラー性に基づくアイデアが実際にうまく機能するアルゴリズムをどう提供するかを記述する。
Imgurから収集した大量の画像では、分類が難しい画像について有望な結果が得られます。
論文 参考訳(メタデータ) (2020-08-12T01:34:21Z) - Unsupervised machine learning via transfer learning and k-means
clustering to classify materials image data [0.0]
本稿では,画像分類のための高性能な教師なし機械学習システムの構築,利用,評価について述べる。
我々は、自然画像のImageNetデータセット上に事前訓練されたVGG16畳み込みニューラルネットワークを用いて、各マイクログラフの特徴表現を抽出する。
このアプローチは、99.4% pm 0.16%$の精度を実現し、結果として得られたモデルは、再トレーニングせずに、新しい画像の分類に使うことができる。
論文 参考訳(メタデータ) (2020-07-16T14:36:04Z) - Contextual Encoder-Decoder Network for Visual Saliency Prediction [42.047816176307066]
本稿では,大規模な画像分類タスクに基づいて事前学習した畳み込みニューラルネットワークに基づくアプローチを提案する。
得られた表現をグローバルなシーン情報と組み合わせて視覚的サリエンシを正確に予測する。
最先端技術と比較して、このネットワークは軽量な画像分類バックボーンに基づいている。
論文 参考訳(メタデータ) (2019-02-18T16:15:25Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。