論文の概要: Anomaly Object Segmentation with Vision-Language Models for Steel Scrap Recycling
- arxiv url: http://arxiv.org/abs/2506.13282v1
- Date: Mon, 16 Jun 2025 09:21:01 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-06-17 17:28:47.988626
- Title: Anomaly Object Segmentation with Vision-Language Models for Steel Scrap Recycling
- Title(参考訳): 鋼スクラップリサイクルのためのビジョンランゲージモデルによる異常物体分割
- Authors: Daichi Tanaka, Takumi Karasawa, Shu Takenouchi, Rei Kawakami,
- Abstract要約: 視覚言語モデルに基づく異常検出を提案する。
このモデルにより, 鋼スクラップ内のきめ細粒度における異常の自動検出が可能となった。
画像エンコーダを微調整し、マルチスケールの機構とテキストプロンプトを通常の画像と異常画像の両方に合わせる。
- 参考スコア(独自算出の注目度): 3.954317850142917
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Recycling steel scrap can reduce carbon dioxide (CO2) emissions from the steel industry. However, a significant challenge in steel scrap recycling is the inclusion of impurities other than steel. To address this issue, we propose vision-language-model-based anomaly detection where a model is finetuned in a supervised manner, enabling it to handle niche objects effectively. This model enables automated detection of anomalies at a fine-grained level within steel scrap. Specifically, we finetune the image encoder, equipped with multi-scale mechanism and text prompts aligned with both normal and anomaly images. The finetuning process trains these modules using a multiclass classification as the supervision.
- Abstract(参考訳): 鉄鋼スクラップのリサイクルは、鉄鋼産業からの二酸化炭素(CO2)排出を削減できる。
しかしながら、鉄鋼スクラップリサイクルにおける重要な課題は、鋼以外の不純物を含むことである。
この問題に対処するために,モデルが教師付きで微調整され,ニッチオブジェクトを効果的に処理できる視覚言語モデルに基づく異常検出を提案する。
このモデルにより, 鋼スクラップ内の微細な粒度での異常の自動検出が可能となった。
具体的には、マルチスケールの機構とテキストプロンプトを備えた画像エンコーダを、通常画像と異常画像の両方に合わせるように微調整する。
微調整プロセスは、これらのモジュールを監督として多クラス分類を用いて訓練する。
関連論文リスト
- Automatic Prompt Generation and Grounding Object Detection for Zero-Shot Image Anomaly Detection [17.06832015516288]
マルチモーダル機械学習パイプラインを用いた産業画像の自動異常検出のためのゼロショットトレーニングフリーアプローチを提案する。
提案モデルにより, 工業生産環境における効率, スケーラブル, 客観的品質管理が可能となる。
論文 参考訳(メタデータ) (2024-11-28T15:42:32Z) - Chain-of-Restoration: Multi-Task Image Restoration Models are Zero-Shot Step-by-Step Universal Image Restorers [53.298698981438]
本稿では,UIR(Universal Image Restoration)という新たなタスク設定を提案する。
UIRは、すべての劣化組み合わせのトレーニングを必要とせず、一連の劣化基だけに限って、これらの基がゼロショットで構成できる可能性のある劣化を取り除く。
本稿では,未知の複合劣化を段階的に除去するモデルをモデルに指示する,CoR(Chain-of-Restoration)機構を提案する。
論文 参考訳(メタデータ) (2024-10-11T10:21:42Z) - SINDER: Repairing the Singular Defects of DINOv2 [61.98878352956125]
大規模なデータセットでトレーニングされたビジョントランスフォーマーモデルは、抽出したパッチトークンにアーティファクトを表示することが多い。
本稿では,小さなデータセットのみを用いて構造欠陥を補正するスムーズなスムーズな正規化を提案する。
論文 参考訳(メタデータ) (2024-07-23T20:34:23Z) - GeneralAD: Anomaly Detection Across Domains by Attending to Distorted Features [68.14842693208465]
GeneralADは、意味的、ほぼ分布的、産業的設定で動作するように設計された異常検出フレームワークである。
本稿では,ノイズ付加やシャッフルなどの簡単な操作を施した自己教師付き異常生成モジュールを提案する。
提案手法を10のデータセットに対して広範囲に評価し,6つの実験結果と,残りの6つの実験結果を得た。
論文 参考訳(メタデータ) (2024-07-17T09:27:41Z) - MetaCloak: Preventing Unauthorized Subject-driven Text-to-image Diffusion-based Synthesis via Meta-learning [59.988458964353754]
テキストから画像への拡散モデルにより、スキャンされた参照写真からパーソナライズされた画像をシームレスに生成できる。
既存のアプローチは、悪意のある使用から"学習不能"なイメージをレンダリングするために、知覚不可能な方法でユーザーイメージを摂動させる。
メタ学習フレームワークを用いて,バイレベル中毒の問題を解決するメタクラックを提案する。
論文 参考訳(メタデータ) (2023-11-22T03:31:31Z) - Learning to Identify Drilling Defects in Turbine Blades with Single
Stage Detectors [15.842163335920954]
タービンブレードのX線画像における網膜ドリル欠陥に基づくモデルを提案する。
このアプリケーションは、欠陥が非常に小さく、一般的に使用されるアンカーサイズによって捉えられにくい画像解像度のため、難しい。
このモデルを3ドルのクロスバリデーションで検証し,欠陥のある画像の同定に極めて高い精度を示す。
論文 参考訳(メタデータ) (2022-08-08T18:44:51Z) - Defect detection and segmentation in X-Ray images of magnesium alloy
castings using the Detectron2 framework [0.13764085113103217]
新しい製造技術により、より複雑な形状の金属部品を製造することが可能となり、品質管理プロセスがより困難になった。
X線画像により、このプロセスはより簡単になり、表面欠陥をより単純な方法で検出できるだけでなく、溶接や鋳造の欠陥も検出できるようになった。
本研究の目的は,画像中の物体の検出とセグメンテーションに応用された最先端ライブラリである Detectron2 に基づくディープラーニングシステムを適用することである。
論文 参考訳(メタデータ) (2022-02-28T16:53:09Z) - One-class Steel Detector Using Patch GAN Discriminator for Visualising
Anomalous Feature Map [0.0]
室内工場における鉄鋼製品製造において,品質管理には鋼の欠陥検出が重要である。
本稿では, 以下の4成分からなる鉄鋼異常検出の汎用的応用を提案する。
第1の学習者は、関心領域と背景領域が認識されたかどうかを判定する単位画像分類ネットワークである。
第2に、パッチ生成対向ネットワーク識別器(GAN)を備えた事前学習鋼板発生器に基づく識別器特徴符号化器
第3の異常検出器は、識別器の特徴を用いて異常スコアを予測する一級サポートベクターマシン(SVM)である。
論文 参考訳(メタデータ) (2021-06-30T23:01:09Z) - Improved anomaly detection by training an autoencoder with skip
connections on images corrupted with Stain-shaped noise [25.85927871251385]
異常検出は 復元の残留か もしくは 復元の不確実性に依存する
我々は,再設計のシャープさを改善するために,スキップ接続を備えたオートエンコーダアーキテクチャを検討する。
このモデルでは、実際の欠陥の有無にかかわらず、任意の実世界の画像からクリーンなイメージを復元することが好ましいことを示す。
論文 参考訳(メタデータ) (2020-08-29T13:50:49Z) - Salvage Reusable Samples from Noisy Data for Robust Learning [70.48919625304]
本稿では,Web画像を用いた深部FGモデルのトレーニングにおいて,ラベルノイズに対処するための再利用可能なサンプル選択と修正手法を提案する。
私たちのキーとなるアイデアは、再利用可能なサンプルの追加と修正を行い、それらをクリーンな例とともに活用してネットワークを更新することです。
論文 参考訳(メタデータ) (2020-08-06T02:07:21Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。