論文の概要: An Efficient MLP-based Point-guided Segmentation Network for Ore Images
with Ambiguous Boundary
- arxiv url: http://arxiv.org/abs/2402.17370v1
- Date: Tue, 27 Feb 2024 10:09:29 GMT
- ステータス: 処理完了
- システム内更新日: 2024-02-28 16:51:35.190400
- Title: An Efficient MLP-based Point-guided Segmentation Network for Ore Images
with Ambiguous Boundary
- Title(参考訳): 曖昧な境界を持つ残像に対する効率的なMLPに基づくポイント誘導セグメンテーションネットワーク
- Authors: Guodong Sun, Yuting Peng, Le Cheng, Mengya Xu, An Wang, Bo Wu,
Hongliang Ren, Yang Zhang
- Abstract要約: 本稿では,エッジバーリングの問題を解決することを目的とした,MLP(Multi-Layer Perceptron)に基づく軽量フレームワークを提案する。
提案手法は, 73MBのモデルサイズで, 毎秒27フレーム以上の処理速度を実現する。
提案手法は,性能スコアが60.4,48.9 in$AP_50box$と$AP_50mask$の順に高い精度を提供する。
- 参考スコア(独自算出の注目度): 12.258442550351178
- License: http://creativecommons.org/licenses/by-sa/4.0/
- Abstract: The precise segmentation of ore images is critical to the successful
execution of the beneficiation process. Due to the homogeneous appearance of
the ores, which leads to low contrast and unclear boundaries, accurate
segmentation becomes challenging, and recognition becomes problematic. This
paper proposes a lightweight framework based on Multi-Layer Perceptron (MLP),
which focuses on solving the problem of edge burring. Specifically, we
introduce a lightweight backbone better suited for efficiently extracting
low-level features. Besides, we design a feature pyramid network consisting of
two MLP structures that balance local and global information thus enhancing
detection accuracy. Furthermore, we propose a novel loss function that guides
the prediction points to match the instance edge points to achieve clear object
boundaries. We have conducted extensive experiments to validate the efficacy of
our proposed method. Our approach achieves a remarkable processing speed of
over 27 frames per second (FPS) with a model size of only 73 MB. Moreover, our
method delivers a consistently high level of accuracy, with impressive
performance scores of 60.4 and 48.9 in~$AP_{50}^{box}$ and~$AP_{50}^{mask}$
respectively, as compared to the currently available state-of-the-art
techniques, when tested on the ore image dataset. The source code will be
released at \url{https://github.com/MVME-HBUT/ORENEXT}.
- Abstract(参考訳): 鉱石画像の正確なセグメンテーションは、受益プロセスの実行の成功に不可欠である。
低コントラストと不明瞭な境界につながる鉱石の均一な外観のため、正確なセグメンテーションが困難となり、認識が問題となる。
本稿では,エッジバーリングの問題を解決することを目的とした,MLP(Multi-Layer Perceptron)に基づく軽量フレームワークを提案する。
具体的には,低レベル機能の効率的な抽出に適した軽量なバックボーンを導入する。
さらに,局所情報とグローバル情報のバランスをとる2つのMLP構造からなる特徴ピラミッドネットワークを設計し,検出精度を向上させる。
さらに,予測点をインスタンスのエッジ点と一致させて明確なオブジェクト境界を実現するための新たな損失関数を提案する。
提案手法の有効性を検証するために広範な実験を行った。
提案手法は,モデルサイズが73MBの27フレーム/秒(FPS)以上の処理速度を実現する。
さらに,本手法は,鉱石画像データセットで試験した場合に,現在利用可能な最先端技術と比較して,それぞれ60.4および48.9 in~$AP_{50}^{box}$および~$AP_{50}^{mask}$の印象的な性能スコアを一定レベルの精度で提供する。
ソースコードは \url{https://github.com/MVME-HBUT/ORENEXT} で公開される。
関連論文リスト
- Efficient Segmentation with Texture in Ore Images Based on
Box-supervised Approach [6.6773975364173]
完全な鉱石と独立した鉱石を識別するために, テクスチャを特徴とするボックス管理手法を提案する。
提案手法は,21.6MBの小型モデルサイズで毎秒50フレーム以上を実現する。
この手法は、鉱石画像データセットの最先端アプローチと比較して高い精度を維持している。
論文 参考訳(メタデータ) (2023-11-10T08:28:22Z) - Global Context Aggregation Network for Lightweight Saliency Detection of
Surface Defects [70.48554424894728]
我々は,エンコーダ・デコーダ構造上の表面欠陥を簡易に検出するためのGCANet(Global Context Aggregation Network)を開発した。
まず、軽量バックボーンの上部層に新しいトランスフォーマーエンコーダを導入し、DSA(Depth-wise Self-Attention)モジュールを通じてグローバルなコンテキスト情報をキャプチャする。
3つの公開欠陥データセットの実験結果から,提案したネットワークは,他の17の最先端手法と比較して,精度と実行効率のトレードオフを良好に達成できることが示された。
論文 参考訳(メタデータ) (2023-09-22T06:19:11Z) - Pixel Adapter: A Graph-Based Post-Processing Approach for Scene Text
Image Super-Resolution [22.60056946339325]
アップサンプリングによる画素歪みに対処するために,グラフアテンションに基づくPixel Adapter Module (PAM)を提案する。
PAMは、各ピクセルが隣人と対話し、機能を更新することで、ローカルな構造情報を効果的にキャプチャする。
提案手法は,従来の認識精度を上回り,高品質な超解像を生成することを実証する。
論文 参考訳(メタデータ) (2023-09-16T08:12:12Z) - Improving Pixel-based MIM by Reducing Wasted Modeling Capability [77.99468514275185]
浅い層から低レベルの特徴を明示的に利用して画素再構成を支援する手法を提案する。
私たちの知る限りでは、等方的アーキテクチャのためのマルチレベル特徴融合を体系的に研究するのは、私たちは初めてです。
提案手法は, 微調整では1.2%, 線形探索では2.8%, セマンティックセグメンテーションでは2.6%など, 大幅な性能向上をもたらす。
論文 参考訳(メタデータ) (2023-08-01T03:44:56Z) - Multiscale Representation for Real-Time Anti-Aliasing Neural Rendering [84.37776381343662]
Mip-NeRFは、スケール情報をエンコードする円錐フラストラムとしてマルチスケール表現を提案する。
我々は,リアルタイムなアンチエイリアスレンダリングのためのマルチスケールな明示的表現であるmip voxel grids (Mip-VoG)を提案する。
私たちのアプローチは、マルチスケールのトレーニングとリアルタイムのアンチエイリアスレンダリングを同時に提供する最初の方法です。
論文 参考訳(メタデータ) (2023-04-20T04:05:22Z) - Efficient Context Integration through Factorized Pyramidal Learning for
Ultra-Lightweight Semantic Segmentation [1.0499611180329804]
本稿では,FPL(Facterized Pyramidal Learning)モジュールを提案する。
空間ピラミッドを2つのステージに分解し,モジュール内での簡易かつ効率的な特徴融合により,悪名高いチェッカーボード効果を解決する。
FPLモジュールとFIRユニットをベースとしたFPLNetと呼ばれる超軽量リアルタイムネットワークを提案する。
論文 参考訳(メタデータ) (2023-02-23T05:34:51Z) - Rethinking Network Design and Local Geometry in Point Cloud: A Simple
Residual MLP Framework [55.40001810884942]
我々は、洗練された局所幾何学的抽出器を組み込んだ純粋な残留ネットワークPointMLPを導入するが、それでも非常に競争力がある。
実世界のScanObjectNNデータセットでは,従来のベストメソッドを3.3%の精度で上回ります。
最新のCurveNetと比較して、PointMLPは2倍速く、テストは7倍速く、ModelNet40ベンチマークではより正確である。
論文 参考訳(メタデータ) (2022-02-15T01:39:07Z) - FaPN: Feature-aligned Pyramid Network for Dense Image Prediction [6.613724825924151]
本稿では,画素の変換オフセットから,アップサンプリング機能への変換を学習する機能アライメントモジュールを提案する。
次に、これらの2つのモジュールをトップダウンピラミッドアーキテクチャに統合し、Feature-aligned Pyramid Network (FaPN)を提示します。
特に、私たちのFaPNは Mask-Former に統合された ADE20K 上で56.7% mIoU の最先端を実現している。
論文 参考訳(メタデータ) (2021-08-16T12:52:42Z) - A Coarse-to-Fine Instance Segmentation Network with Learning Boundary
Representation [10.967299485260163]
境界ベースのインスタンスセグメンテーションは、その魅力的な効率性から多くの注目を集めている。
既存の手法は長距離回帰の難しさに悩まされている。
この問題に対処する粗大なモジュールを提案する。
論文 参考訳(メタデータ) (2021-06-18T16:37:28Z) - Progressively Guided Alternate Refinement Network for RGB-D Salient
Object Detection [63.18846475183332]
我々は,RGB-Dの高次物体検出のための効率的かつコンパクトなディープネットワークを開発することを目指している。
そこで本研究では,改良のための改良ネットワークを提案する。
我々のモデルは、既存の最先端のアプローチよりも大きなマージンで優れています。
論文 参考訳(メタデータ) (2020-08-17T02:55:06Z) - Towards Accurate Pixel-wise Object Tracking by Attention Retrieval [50.06436600343181]
本稿では,バックボーンの特徴に対するソフト空間制約を実現するために,アテンション検索ネットワーク(ARN)を提案する。
私たちは40fpsで動作しながら、最近のピクセルワイドオブジェクトトラッキングベンチマークであるVOT 2020に最先端のベンチマークを新たに設定しました。
論文 参考訳(メタデータ) (2020-08-06T16:25:23Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。