論文の概要: Efficient Segmentation with Texture in Ore Images Based on
Box-supervised Approach
- arxiv url: http://arxiv.org/abs/2311.05929v1
- Date: Fri, 10 Nov 2023 08:28:22 GMT
- ステータス: 処理完了
- システム内更新日: 2023-11-13 15:28:43.813810
- Title: Efficient Segmentation with Texture in Ore Images Based on
Box-supervised Approach
- Title(参考訳): box-supervisedアプローチに基づく鉱石画像のテクスチャを用いた効率的なセグメンテーション
- Authors: Guodong Sun and Delong Huang and Yuting Peng and Le Cheng and Bo Wu
and Yang Zhang
- Abstract要約: 完全な鉱石と独立した鉱石を識別するために, テクスチャを特徴とするボックス管理手法を提案する。
提案手法は,21.6MBの小型モデルサイズで毎秒50フレーム以上を実現する。
この手法は、鉱石画像データセットの最先端アプローチと比較して高い精度を維持している。
- 参考スコア(独自算出の注目度): 6.6773975364173
- License: http://creativecommons.org/licenses/by-nc-nd/4.0/
- Abstract: Image segmentation methods have been utilized to determine the particle size
distribution of crushed ores. Due to the complex working environment,
high-powered computing equipment is difficult to deploy. At the same time, the
ore distribution is stacked, and it is difficult to identify the complete
features. To address this issue, an effective box-supervised technique with
texture features is provided for ore image segmentation that can identify
complete and independent ores. Firstly, a ghost feature pyramid network
(Ghost-FPN) is proposed to process the features obtained from the backbone to
reduce redundant semantic information and computation generated by complex
networks. Then, an optimized detection head is proposed to obtain the feature
to maintain accuracy. Finally, Lab color space (Lab) and local binary patterns
(LBP) texture features are combined to form a fusion feature similarity-based
loss function to improve accuracy while incurring no loss. Experiments on MS
COCO have shown that the proposed fusion features are also worth studying on
other types of datasets. Extensive experimental results demonstrate the
effectiveness of the proposed method, which achieves over 50 frames per second
with a small model size of 21.6 MB. Meanwhile, the method maintains a high
level of accuracy compared with the state-of-the-art approaches on ore image
dataset. The source code is available at
\url{https://github.com/MVME-HBUT/OREINST}.
- Abstract(参考訳): 破砕鉱石の粒度分布を決定するために, 画像分割法が用いられている。
複雑な作業環境のため、高出力コンピューティング機器の展開は困難である。
同時に、鉱石分布は積み重なり、完全な特徴を特定することは困難である。
この問題に対処するために,完全かつ独立した鉱石を識別可能な,テクスチャ機能を備えた効果的なボックス教師付き手法が,鉱石画像分割に提供される。
まず,ゴースト特徴ピラミッドネットワーク (ghost-fpn) の提案により,複雑なネットワークが生成する冗長な意味情報と計算量を削減するために,バックボーンから得られた特徴を処理する。
そして、精度を維持するために最適化された検出ヘッドを提案する。
最後に、ラベル色空間(Lab)と局所二分パターン(LBP)テクスチャ特徴を組み合わせることで、融合特徴類似性に基づく損失関数を形成し、損失を生じずに精度を向上する。
MS COCOの実験では、提案された融合機能は、他の種類のデータセットについても研究する価値があることが示されている。
21.6MBの小型モデルサイズで毎秒50フレーム以上を達成できる提案手法の有効性を実験的に実証した。
一方、この手法は、鉱石画像データセットの最先端アプローチと比較して高い精度を維持している。
ソースコードは \url{https://github.com/MVME-HBUT/OREINST} で入手できる。
関連論文リスト
- An Efficient MLP-based Point-guided Segmentation Network for Ore Images
with Ambiguous Boundary [12.258442550351178]
本稿では,エッジバーリングの問題を解決することを目的とした,MLP(Multi-Layer Perceptron)に基づく軽量フレームワークを提案する。
提案手法は, 73MBのモデルサイズで, 毎秒27フレーム以上の処理速度を実現する。
提案手法は,性能スコアが60.4,48.9 in$AP_50box$と$AP_50mask$の順に高い精度を提供する。
論文 参考訳(メタデータ) (2024-02-27T10:09:29Z) - PairingNet: A Learning-based Pair-searching and -matching Network for
Image Fragments [6.694162736590122]
本稿では,難解な修復問題を解決するために,学習に基づくイメージフラグメントのペア探索とマッチング手法を提案する。
提案するネットワークは,ペア探索の精度に優れ,マッチングエラーを低減し,計算時間を大幅に短縮する。
論文 参考訳(メタデータ) (2023-12-14T07:43:53Z) - DiAD: A Diffusion-based Framework for Multi-class Anomaly Detection [55.48770333927732]
本稿では,拡散型異常検出(Difusion-based Anomaly Detection, DAD)フレームワークを提案する。
画素空間オートエンコーダ、安定拡散の復調ネットワークに接続する潜在空間セマンティックガイド(SG)ネットワーク、特徴空間事前学習機能抽出器から構成される。
MVTec-ADとVisAデータセットの実験は、我々のアプローチの有効性を実証している。
論文 参考訳(メタデータ) (2023-12-11T18:38:28Z) - Pixel-Inconsistency Modeling for Image Manipulation Localization [63.54342601757723]
デジタル画像法医学は、画像認証と操作のローカライゼーションにおいて重要な役割を果たす。
本稿では,画素不整合アーチファクトの解析を通じて,一般化されたロバストな操作ローカライゼーションモデルを提案する。
実験により,本手法は固有の画素不整合偽指紋を抽出することに成功した。
論文 参考訳(メタデータ) (2023-09-30T02:54:51Z) - Efficient Context Integration through Factorized Pyramidal Learning for
Ultra-Lightweight Semantic Segmentation [1.0499611180329804]
本稿では,FPL(Facterized Pyramidal Learning)モジュールを提案する。
空間ピラミッドを2つのステージに分解し,モジュール内での簡易かつ効率的な特徴融合により,悪名高いチェッカーボード効果を解決する。
FPLモジュールとFIRユニットをベースとしたFPLNetと呼ばれる超軽量リアルタイムネットワークを提案する。
論文 参考訳(メタデータ) (2023-02-23T05:34:51Z) - Real-Time Scene Text Detection with Differentiable Binarization and
Adaptive Scale Fusion [62.269219152425556]
セグメンテーションに基づくシーンテキスト検出手法はシーンテキスト検出分野において大きな注目を集めている。
本稿では,二項化処理をセグメンテーションネットワークに統合する分散二項化(DB)モジュールを提案する。
アダプティブ・スケール・フュージョン (ASF) モジュールは, 異なるスケールの特徴を適応的に融合させることにより, スケールのロバスト性を向上させる。
論文 参考訳(メタデータ) (2022-02-21T15:30:14Z) - Towards an efficient framework for Data Extraction from Chart Images [27.114170963444074]
データマイニングシステムにおいて,データ抽出段階において最先端のコンピュータビジョン技術を採用する。
堅牢な点検出器を構築するには、特徴融合モジュールを備えた完全な畳み込みネットワークを採用する。
データ変換では,検出した要素を意味値でデータに変換する。
論文 参考訳(メタデータ) (2021-05-05T13:18:53Z) - Lightweight Convolutional Neural Network with Gaussian-based Grasping
Representation for Robotic Grasping Detection [4.683939045230724]
現在の物体検出器は、高い精度と高速な推論速度のバランスを取るのが難しい。
ロボットつかみポーズ推定を行うための効率的かつ堅牢な完全畳み込みニューラルネットワークモデルを提案する。
ネットワークは、他の優れたアルゴリズムよりも桁違いに小さい順序です。
論文 参考訳(メタデータ) (2021-01-25T16:36:53Z) - Adaptive Context-Aware Multi-Modal Network for Depth Completion [107.15344488719322]
我々は,観測された空間コンテキストを捉えるために,グラフ伝搬を採用することを提案する。
次に、注意機構を伝搬に適用し、ネットワークが文脈情報を適応的にモデル化することを奨励する。
最後に、抽出したマルチモーダル特徴を効果的に活用するための対称ゲート融合戦略を導入する。
本稿では,Adaptive Context-Aware Multi-Modal Network (ACMNet) を2つのベンチマークで評価した。
論文 参考訳(メタデータ) (2020-08-25T06:00:06Z) - Progressively Guided Alternate Refinement Network for RGB-D Salient
Object Detection [63.18846475183332]
我々は,RGB-Dの高次物体検出のための効率的かつコンパクトなディープネットワークを開発することを目指している。
そこで本研究では,改良のための改良ネットワークを提案する。
我々のモデルは、既存の最先端のアプローチよりも大きなマージンで優れています。
論文 参考訳(メタデータ) (2020-08-17T02:55:06Z) - High-Order Information Matters: Learning Relation and Topology for
Occluded Person Re-Identification [84.43394420267794]
本稿では,高次関係とトポロジ情報を識別的特徴とロバストなアライメントのために学習し,新しい枠組みを提案する。
我々のフレームワークはOccluded-Dukeデータセットで最先端の6.5%mAPスコアを大幅に上回っている。
論文 参考訳(メタデータ) (2020-03-18T12:18:35Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。