論文の概要: Power Battery Detection
- arxiv url: http://arxiv.org/abs/2508.07797v1
- Date: Mon, 11 Aug 2025 09:35:25 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-08-12 21:23:29.02883
- Title: Power Battery Detection
- Title(参考訳): パワーバッテリ検出
- Authors: Xiaoqi Zhao, Peiqian Cao, Lihe Zhang, Zonglei Feng, Hanqi Liu, Jiaming Zuo, Youwei Pang, Weisi Lin, Georges El Fakhri, Huchuan Lu, Xiaofeng Liu,
- Abstract要約: 電力電池は、内部構造欠陥が深刻な安全リスクを生じさせる電気自動車において必須の部品である。
我々は,X線画像から陰極および陽極板の密集端を局所化し,品質検査を行うことを目的として,電力電池検出(PBD)に関する総合的研究を行った。
PBD5Kは,9種類のバッテリタイプから5,000枚のX線画像と8種類の実世界の視覚的干渉を含む,このタスクのための最初の大規模ベンチマークである。
- 参考スコア(独自算出の注目度): 84.71924331508511
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Power batteries are essential components in electric vehicles, where internal structural defects can pose serious safety risks. We conduct a comprehensive study on a new task, power battery detection (PBD), which aims to localize the dense endpoints of cathode and anode plates from industrial X-ray images for quality inspection. Manual inspection is inefficient and error-prone, while traditional vision algorithms struggle with densely packed plates, low contrast, scale variation, and imaging artifacts. To address this issue and drive more attention into this meaningful task, we present PBD5K, the first large-scale benchmark for this task, consisting of 5,000 X-ray images from nine battery types with fine-grained annotations and eight types of real-world visual interference. To support scalable and consistent labeling, we develop an intelligent annotation pipeline that combines image filtering, model-assisted pre-labeling, cross-verification, and layered quality evaluation. We formulate PBD as a point-level segmentation problem and propose MDCNeXt, a model designed to extract and integrate multi-dimensional structure clues including point, line, and count information from the plate itself. To improve discrimination between plates and suppress visual interference, MDCNeXt incorporates two state space modules. The first is a prompt-filtered module that learns contrastive relationships guided by task-specific prompts. The second is a density-aware reordering module that refines segmentation in regions with high plate density. In addition, we propose a distance-adaptive mask generation strategy to provide robust supervision under varying spatial distributions of anode and cathode positions. The source code and datasets will be publicly available at \href{https://github.com/Xiaoqi-Zhao-DLUT/X-ray-PBD}{PBD5K}.
- Abstract(参考訳): 電力電池は、内部構造欠陥が深刻な安全リスクを生じさせる電気自動車において必須の部品である。
我々は,産業用X線画像から陰極と陽極板の密集端を局所化し,品質検査を行うことを目的として,新しいタスクであるPBD(Power Battery Detection)を包括的に研究する。
手動検査は非効率でエラーを起こしやすいが、従来の視覚アルゴリズムは高密度に充填されたプレート、低コントラスト、スケールの変動、画像のアーティファクトに悩まされている。
この問題に対処し、この意味のあるタスクにもっと注意を向けるため、PBD5Kは、9つのバッテリータイプから5,000個のX線画像と8種類の実世界の視覚干渉からなる、このタスクのための最初の大規模ベンチマークである。
スケーラブルで一貫したラベリングをサポートするため,画像フィルタリング,モデル支援型プレラベリング,相互検証,階層化品質評価を組み合わせたインテリジェントなアノテーションパイプラインを開発した。
PBDを点レベルセグメンテーション問題として定式化し, 点, 線, 数などの多次元構造手がかりを抽出・統合するモデルである MDCNeXt を提案する。
プレート間の識別を改善し、視覚的干渉を抑制するため、MDCNeXtには2つの状態空間モジュールが組み込まれている。
1つ目はプロンプトフィルタリングモジュールで、タスク固有のプロンプトによって導かれる対照的な関係を学習する。
2つ目は、高板密度領域のセグメンテーションを洗練する密度対応リオーダーモジュールである。
さらに,アノードと陰極位置の空間分布の異なる環境下での堅牢な監視を実現するために,距離適応マスク生成方式を提案する。
ソースコードとデータセットは \href{https://github.com/Xiaoqi-Zhao-DLUT/X-ray-PBD}{PBD5K} で公開されている。
関連論文リスト
- Post-Disaster Affected Area Segmentation with a Vision Transformer (ViT)-based EVAP Model using Sentinel-2 and Formosat-5 Imagery [0.0]
リモートセンシング画像から災害影響領域のセグメンテーションを洗練するための視覚変換器(ViT)ベースのディープラーニングフレームワークを提案する。
本フレームワークはセグメント化結果のスムーズさと信頼性を向上し,正確な地下真実が得られない場合の災害対応にスケーラブルなアプローチを提供する。
論文 参考訳(メタデータ) (2025-07-21T07:48:07Z) - PGNeXt: High-Resolution Salient Object Detection via Pyramid Grafting Network [24.54269823691119]
本稿では、データセットとネットワークフレームワークの両方の観点から、より難解な高分解能サルエントオブジェクト検出(HRSOD)について述べる。
HRSODデータセットの欠如を補うため、UHRSDと呼ばれる大規模高解像度の高分解能物体検出データセットを慎重に収集した。
すべての画像はピクセルレベルで微妙にアノテートされ、以前の低解像度のSODデータセットをはるかに上回っている。
論文 参考訳(メタデータ) (2024-08-02T09:31:21Z) - Dual-scale Enhanced and Cross-generative Consistency Learning for Semi-supervised Medical Image Segmentation [49.57907601086494]
医用画像のセグメンテーションはコンピュータ支援診断において重要な役割を担っている。
半教師型医用画像(DEC-Seg)のための新しいDual-scale Enhanced and Cross-generative consistency learning frameworkを提案する。
論文 参考訳(メタデータ) (2023-12-26T12:56:31Z) - Towards Automatic Power Battery Detection: New Challenge, Benchmark
Dataset and Baseline [70.30473488226093]
PBD(パワーバッテリ検出)と呼ばれる新しいタスクに関する総合的研究を行う。
X線画像から高密度陰極と陽極板のエンドポイントをローカライズし、電池の品質を評価することを目的としている。
我々は,多次元協調ネットワーク(MDCNet)と呼ばれるPBDのための新しいセグメンテーションベースソリューションを提案する。
論文 参考訳(メタデータ) (2023-12-05T06:18:38Z) - HRFuser: A Multi-resolution Sensor Fusion Architecture for 2D Object
Detection [0.0]
マルチモーダル2Dオブジェクト検出のためのモジュールアーキテクチャであるHRFuserを提案する。
マルチレゾリューション方式で複数のセンサーを融合させ、任意の数の入力モードにスケールする。
我々は、nuScenesとDENSEデータセットに関する実験を通じて、我々のモデルが追加のモーダルから補完的な特徴を効果的に活用できることを実証する。
論文 参考訳(メタデータ) (2022-06-30T09:40:05Z) - Anchor-free Small-scale Multispectral Pedestrian Detection [88.7497134369344]
適応型単一段アンカーフリーベースアーキテクチャにおける2つのモードの効果的かつ効率的な多重スペクトル融合法を提案する。
我々は,直接的境界ボックス予測ではなく,対象の中心と規模に基づく歩行者表現の学習を目指す。
その結果,小型歩行者の検出における本手法の有効性が示唆された。
論文 参考訳(メタデータ) (2020-08-19T13:13:01Z) - EHSOD: CAM-Guided End-to-end Hybrid-Supervised Object Detection with
Cascade Refinement [53.69674636044927]
本稿では,エンド・ツー・エンドのハイブリッド型オブジェクト検出システムであるEHSODについて述べる。
完全なアノテートと弱いアノテートの両方で、ワンショットでトレーニングすることができる。
完全なアノテートされたデータの30%しか持たない複数のオブジェクト検出ベンチマークで、同等の結果が得られる。
論文 参考訳(メタデータ) (2020-02-18T08:04:58Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。