論文の概要: DeepHAZMAT: Hazardous Materials Sign Detection and Segmentation with
Restricted Computational Resources
- arxiv url: http://arxiv.org/abs/2007.06392v2
- Date: Sat, 18 Jul 2020 12:12:55 GMT
- ステータス: 処理完了
- システム内更新日: 2022-11-10 23:59:01.874107
- Title: DeepHAZMAT: Hazardous Materials Sign Detection and Segmentation with
Restricted Computational Resources
- Title(参考訳): DeepHAZMAT: 制限された計算資源による有害物質の検出とセグメンテーション
- Authors: Amir Sharifi, Ahmadreza Zibaei, Mahdi Rezaei
- Abstract要約: 本稿では,Hazmatを4ステップで検出・セグメント化するためのCNNベースのパイプラインであるDeepHAZMATを提案する。
提案手法は,検出速度と検出精度の観点から,良好な性能を維持した。
- 参考スコア(独自算出の注目度): 0.8701566919381223
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: One of the most challenging and non-trivial tasks in robot-based rescue
operations is the Hazardous Materials or HAZMATs sign detection in the
operation field, to prevent further unexpected disasters. Each Hazmat sign has
a specific meaning that the rescue robot should detect and interpret it to take
a safe action, accordingly. Accurate Hazmat detection and real-time processing
are the two most important factors in such robotics applications. Furthermore,
we also have to cope with some secondary challenges such as image distortion
and restricted CPU and computational resources which are embedded in a rescue
robot. In this paper, we propose a CNN-Based pipeline called DeepHAZMAT for
detecting and segmenting Hazmats in four steps; 1) optimising the number of
input images that are fed into the CNN network, 2) using the YOLOv3-tiny
structure to collect the required visual information from the hazardous areas,
3) Hazmat sign segmentation and separation from the background using GrabCut
technique, and 4) post-processing the result with morphological operators and
convex hull algorithm. In spite of the utilisation of a very limited memory and
CPU resources, the experimental results show the proposed method has
successfully maintained a better performance in terms of detection-speed and
detection-accuracy, compared with the state-of-the-art methods.
- Abstract(参考訳): ロボットによる救助活動における最も困難かつ非自明な作業の1つは、さらなる予期せぬ災害を防止するため、作業現場における危険物質またはハズマットサイン検出である。
それぞれのhazmatサインは、救助ロボットが安全な行動を取るためにそれを検出し解釈すべき特定の意味を持っている。
正確なハズマット検出とリアルタイム処理は、ロボット工学の応用において最も重要な2つの要素である。
さらに,救難ロボットに埋め込まれた画像歪みやcpuや計算資源の制限といった二次的な課題にも対処しなければならない。
本稿では,4ステップでhazmatを検出するためのcnnベースのパイプラインであるdeephazmatを提案する。
1)CNNネットワークに送信される入力画像の数を最適化する。
2) YOLOv3-tiny構造を用いて, 危険領域から必要な視覚情報を収集する。
3) GrabCut 技術を用いた背景からのハザート記号の分割と分離
4) モルフォロジー演算子と凸ハルアルゴリズムによる結果の処理後処理。
非常に限られたメモリとCPU資源の活用にもかかわらず,提案手法は最先端の手法と比較して,検出速度と検出精度の点で優れた性能を維持していることを示す実験結果が得られた。
関連論文リスト
- Volumetric Mapping with Panoptic Refinement via Kernel Density Estimation for Mobile Robots [2.8668675011182967]
移動ロボットは通常、軽量ネットワークを使用してRGB画像上にオブジェクトを分割し、深度マップを介してそれらをローカライズする。
非パラメトリックな統計的手法を用いて分割誤差を補修することで3次元シーン再構成における汎視的セグメンテーション品質の問題に対処する。
予測マスクを深度フレームにマッピングし,カーネル密度を用いて分布を推定する。
奥行き知覚の外れ値は、追加のパラメータを必要とせずに拒否される。
論文 参考訳(メタデータ) (2024-12-15T16:46:23Z) - WaterSeeker: Pioneering Efficient Detection of Watermarked Segments in Large Documents [63.563031923075066]
WaterSeekerは、広範囲な自然テキストの中で、ウォーターマークされたセグメントを効率的に検出し、発見するための新しいアプローチである。
検出精度と計算効率のバランスが良くなる。
論文 参考訳(メタデータ) (2024-09-08T14:45:47Z) - Visual Context-Aware Person Fall Detection [52.49277799455569]
画像中の個人とオブジェクトを半自動分離するセグメンテーションパイプラインを提案する。
ベッド、椅子、車椅子などの背景オブジェクトは、転倒検知システムに挑戦し、誤ったポジティブアラームを引き起こす。
トレーニング中のオブジェクト固有のコンテキスト変換が、この課題を効果的に軽減することを示す。
論文 参考訳(メタデータ) (2024-04-11T19:06:36Z) - SimulFlow: Simultaneously Extracting Feature and Identifying Target for
Unsupervised Video Object Segmentation [28.19471998380114]
教師なしビデオオブジェクトセグメンテーション(UVOS)は、人間が介在することなく、所定のビデオシーケンス内の一次オブジェクトを検出することを目的としている。
既存のほとんどの手法は、ターゲットを識別してオブジェクトマスクを生成する前に、外観と動き情報を別々に符号化する2ストリームアーキテクチャに依存している。
特徴抽出とターゲット識別を同時に行うSimulFlowと呼ばれる新しいUVOSモデルを提案する。
論文 参考訳(メタデータ) (2023-11-30T06:44:44Z) - Masking Hyperspectral Imaging Data with Pretrained Models [11.101345527313438]
不要なリージョンをマスキングすることが、この問題に対処する鍵となる。
関心領域のみの処理は、計算コスト、必要なメモリ、全体的なパフォーマンスの点で顕著な改善をもたらす。
提案した処理パイプラインは、関心マスク生成領域の2つの基本部分を含み、次いで、新たにマスクされたハイパースペクトルキューブにのみハイパースペクトルデータ処理技術を適用する。
論文 参考訳(メタデータ) (2023-11-06T12:08:35Z) - EventTransAct: A video transformer-based framework for Event-camera
based action recognition [52.537021302246664]
イベントカメラは、RGBビデオの標準アクション認識と比較して、新しい機会を提供する。
本研究では,最初にイベントフレーム当たりの空間埋め込みを取得するビデオトランスフォーマーネットワーク(VTN)という,計算効率のよいモデルを用いる。
イベントデータのスパースできめ細かい性質にVTNをよりよく採用するために、イベントコントラストロス(mathcalL_EC$)とイベント固有の拡張を設計する。
論文 参考訳(メタデータ) (2023-08-25T23:51:07Z) - Detect Any Deepfakes: Segment Anything Meets Face Forgery Detection and
Localization [30.317619885984005]
本稿では,視覚的セグメンテーション基盤モデル,すなわちセグメンテーションモデル(SAM)をフォージェリ検出とローカライゼーションの対面に導入する。
SAMに基づいて,Multiscale Adapterを用いたDADFフレームワークを提案する。
提案するフレームワークは、エンドツーエンドのフォージェリーローカライゼーションと検出最適化をシームレスに統合する。
論文 参考訳(メタデータ) (2023-06-29T16:25:04Z) - You Better Look Twice: a new perspective for designing accurate
detectors with reduced computations [56.34005280792013]
BLT-netは、新しい低計算の2段階オブジェクト検出アーキテクチャである。
非常にエレガントな第1ステージを使用して、オブジェクトをバックグラウンドから分離することで、計算を削減します。
結果のイメージ提案は、高度に正確なモデルによって第2段階で処理される。
論文 参考訳(メタデータ) (2021-07-21T12:39:51Z) - Lightweight Convolutional Neural Network with Gaussian-based Grasping
Representation for Robotic Grasping Detection [4.683939045230724]
現在の物体検出器は、高い精度と高速な推論速度のバランスを取るのが難しい。
ロボットつかみポーズ推定を行うための効率的かつ堅牢な完全畳み込みニューラルネットワークモデルを提案する。
ネットワークは、他の優れたアルゴリズムよりも桁違いに小さい順序です。
論文 参考訳(メタデータ) (2021-01-25T16:36:53Z) - Risk-Averse MPC via Visual-Inertial Input and Recurrent Networks for
Online Collision Avoidance [95.86944752753564]
本稿では,モデル予測制御(MPC)の定式化を拡張したオンライン経路計画アーキテクチャを提案する。
我々のアルゴリズムは、状態推定の共分散を推論するリカレントニューラルネットワーク(RNN)とオブジェクト検出パイプラインを組み合わせる。
本手法のロバスト性は, 複雑な四足歩行ロボットの力学で検証され, ほとんどのロボットプラットフォームに適用可能である。
論文 参考訳(メタデータ) (2020-07-28T07:34:30Z) - BiDet: An Efficient Binarized Object Detector [96.19708396510894]
本稿では,効率的な物体検出のためのバイナライズニューラルネットワークのBiDetを提案する。
我々のBiDetは、冗長除去による物体検出にバイナリニューラルネットワークの表現能力を完全に活用している。
我々の手法は、最先端のバイナリニューラルネットワークを大きなマージンで上回る。
論文 参考訳(メタデータ) (2020-03-09T08:16:16Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。