論文の概要: Towards Automatic Power Battery Detection: New Challenge, Benchmark
Dataset and Baseline
- arxiv url: http://arxiv.org/abs/2312.02528v2
- Date: Thu, 29 Feb 2024 03:56:57 GMT
- ステータス: 処理完了
- システム内更新日: 2024-03-01 18:14:51.299557
- Title: Towards Automatic Power Battery Detection: New Challenge, Benchmark
Dataset and Baseline
- Title(参考訳): 自動電源バッテリ検出に向けて:新しい挑戦,ベンチマークデータセット,ベースライン
- Authors: Xiaoqi Zhao, Youwei Pang, Zhenyu Chen, Qian Yu, Lihe Zhang, Hanqi Liu,
Jiaming Zuo, Huchuan Lu
- Abstract要約: PBD(パワーバッテリ検出)と呼ばれる新しいタスクに関する総合的研究を行う。
X線画像から高密度陰極と陽極板のエンドポイントをローカライズし、電池の品質を評価することを目的としている。
我々は,多次元協調ネットワーク(MDCNet)と呼ばれるPBDのための新しいセグメンテーションベースソリューションを提案する。
- 参考スコア(独自算出の注目度): 70.30473488226093
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: We conduct a comprehensive study on a new task named power battery detection
(PBD), which aims to localize the dense cathode and anode plates endpoints from
X-ray images to evaluate the quality of power batteries. Existing manufacturers
usually rely on human eye observation to complete PBD, which makes it difficult
to balance the accuracy and efficiency of detection. To address this issue and
drive more attention into this meaningful task, we first elaborately collect a
dataset, called X-ray PBD, which has $1,500$ diverse X-ray images selected from
thousands of power batteries of $5$ manufacturers, with $7$ different visual
interference. Then, we propose a novel segmentation-based solution for PBD,
termed multi-dimensional collaborative network (MDCNet). With the help of line
and counting predictors, the representation of the point segmentation branch
can be improved at both semantic and detail aspects.Besides, we design an
effective distance-adaptive mask generation strategy, which can alleviate the
visual challenge caused by the inconsistent distribution density of plates to
provide MDCNet with stable supervision. Without any bells and whistles, our
segmentation-based MDCNet consistently outperforms various other corner
detection, crowd counting and general/tiny object detection-based solutions,
making it a strong baseline that can help facilitate future research in PBD.
Finally, we share some potential difficulties and works for future researches.
The source code and datasets will be publicly available at
\href{https://github.com/Xiaoqi-Zhao-DLUT/X-ray-PBD}{X-ray PBD}.
- Abstract(参考訳): 我々は,高密度陰極および陽極板の終端をX線画像から局所化し,電池の品質を評価することを目的とした,PBD(Power Battery Detection)と呼ばれる新しいタスクについて包括的な研究を行う。
既存のメーカーは通常、PBDを完成させるために人間の目の観察に依存しており、検出の正確さと効率のバランスをとるのが困難である。
この問題に対処し、この有意義なタスクにもっと注意を向けるために、私たちはまず、さまざまなx線画像を5ドルのメーカーの数千のバッテリーから選択した1500ドルの多様なx線画像と、7ドルの視覚的干渉を持つ、x-ray pbdと呼ばれるデータセットを精巧に収集しました。
そこで我々は,多次元協調ネットワーク(MDCNet)と呼ばれるPBDのための新しいセグメンテーションベースソリューションを提案する。
線数予測器の助けを借りて、ポイントセグメンテーション分岐の表現をセマンティックとディテールの両面で改善することができるが、一方で、プレートの不整合分布密度による視覚的困難を軽減し、MDCNetを安定した監視で提供できる効果的な距離適応マスク生成戦略を設計する。
私たちのセグメンテーションベースのMDCNetは、ベルやホイッスルがなければ、さまざまなコーナー検出や、群衆数、一般的なオブジェクト検出ベースのソリューションを一貫して上回ります。
最後に、潜在的な困難と将来の研究のために働きます。
ソースコードとデータセットは \href{https://github.com/Xiaoqi-Zhao-DLUT/X-ray-PBD}{X-ray PBD} で公開されている。
関連論文リスト
- PGNeXt: High-Resolution Salient Object Detection via Pyramid Grafting Network [24.54269823691119]
本稿では、データセットとネットワークフレームワークの両方の観点から、より難解な高分解能サルエントオブジェクト検出(HRSOD)について述べる。
HRSODデータセットの欠如を補うため、UHRSDと呼ばれる大規模高解像度の高分解能物体検出データセットを慎重に収集した。
すべての画像はピクセルレベルで微妙にアノテートされ、以前の低解像度のSODデータセットをはるかに上回っている。
論文 参考訳(メタデータ) (2024-08-02T09:31:21Z) - Towards Unified 3D Object Detection via Algorithm and Data Unification [70.27631528933482]
我々は、最初の統一型マルチモーダル3Dオブジェクト検出ベンチマークMM-Omni3Dを構築し、上記のモノクロ検出器をマルチモーダルバージョンに拡張する。
設計した単分子・多モード検出器をそれぞれUniMODEとMM-UniMODEと命名した。
論文 参考訳(メタデータ) (2024-02-28T18:59:31Z) - InsPLAD: A Dataset and Benchmark for Power Line Asset Inspection in UAV
Images [1.8524180288472398]
本稿では,高分解能無人航空機カラー画像10,607点を含むパワーライン・アセット・インスペクション・データセットであるInsPLADとベンチマークを紹介する。
データセットには、現実世界の電力線から取得した17のユニークな電力線資産が含まれている。
我々は、InsPLADがカバーする3つの画像レベルのコンピュータビジョンタスクに対して、APメトリックによるオブジェクト検出、バランス精度による欠陥分類、AUROCメトリックによる異常検出の3つについて、最先端および一般的な手法を徹底的に評価した。
論文 参考訳(メタデータ) (2023-11-02T22:06:23Z) - Autonomous Point Cloud Segmentation for Power Lines Inspection in Smart
Grid [56.838297900091426]
高電圧と低電圧の両方の電力線の特徴を検出し,抽出し,解析するために,教師なし機械学習(ML)フレームワークを提案する。
提案フレームワークは電力線を効率よく検出し,PLCに基づくハザード解析を行う。
論文 参考訳(メタデータ) (2023-08-14T17:14:58Z) - Multi-View Fusion and Distillation for Subgrade Distresses Detection
based on 3D-GPR [19.49863426864145]
本稿では,3D-GPRデータからの多視点情報を活用することで,下級災害検知タスクの新たな手法を提案する。
マルチビューGPRデータセットを最適に活用するための新しいtextbfMulti-textbfView textbfVusion と textbfDistillation フレームワーク textbfGPR-MVFD を開発した。
論文 参考訳(メタデータ) (2023-08-09T08:06:28Z) - Leveraging Multi-view Data for Improved Detection Performance: An
Industrial Use Case [0.5249805590164901]
高速かつ正確なソリューションを提供する多視点オブジェクト検出フレームワークを提案する。
本稿では,半自動地下構造データを用いた新しいマルチビューデータセットを提案する。
実験では, 0.5mmから27.0mmの成分を検出するため, mAPの15%の改善が示された。
論文 参考訳(メタデータ) (2023-04-17T09:41:37Z) - Pyramid Grafting Network for One-Stage High Resolution Saliency
Detection [29.013012579688347]
我々は、異なる解像度画像から特徴を独立して抽出する、Praamid Grafting Network (PGNet) と呼ばれるワンステージフレームワークを提案する。
CNNブランチが壊れた詳細情報をよりホモロジーに組み合わせられるように、アテンションベースのクロスモデルグラフティングモジュール (CMGM) が提案されている。
我々は,4K-8K解像度で5,920個の画像を含む超高分解能塩度検出データセットUHRSDを新たに提供した。
論文 参考訳(メタデータ) (2022-04-11T12:22:21Z) - Unsupervised Person Re-Identification with Wireless Positioning under
Weak Scene Labeling [131.18390399368997]
本稿では、弱いシーンラベリングの下で、視覚データと無線位置決めトラジェクトリの両方を用いて、教師なしの人物再識別を探索することを提案する。
具体的には、視覚データと無線情報の相補性をモデル化した、新しい教師なしマルチモーダルトレーニングフレームワーク(UMTF)を提案する。
我々のUMTFには、MMDA(Multimodal Data Association Strategy)とMMGN(Multimodal Graph Neural Network)が含まれている。
論文 参考訳(メタデータ) (2021-10-29T08:25:44Z) - Many-to-One Distribution Learning and K-Nearest Neighbor Smoothing for
Thoracic Disease Identification [83.6017225363714]
ディープラーニングは、病気の識別性能を改善するための最も強力なコンピュータ支援診断技術となった。
胸部X線撮影では、大規模データの注釈付けには専門的なドメイン知識が必要で、時間を要する。
本論文では、単一モデルにおける疾患同定性能を改善するために、複数対1の分布学習(MODL)とK-nearest neighbor smoothing(KNNS)手法を提案する。
論文 参考訳(メタデータ) (2021-02-26T02:29:30Z) - Anchor-free Small-scale Multispectral Pedestrian Detection [88.7497134369344]
適応型単一段アンカーフリーベースアーキテクチャにおける2つのモードの効果的かつ効率的な多重スペクトル融合法を提案する。
我々は,直接的境界ボックス予測ではなく,対象の中心と規模に基づく歩行者表現の学習を目指す。
その結果,小型歩行者の検出における本手法の有効性が示唆された。
論文 参考訳(メタデータ) (2020-08-19T13:13:01Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。