論文の概要: Intelligent Debris Mass Estimation Model for Autonomous Underwater
Vehicle
- arxiv url: http://arxiv.org/abs/2309.10617v2
- Date: Tue, 24 Oct 2023 17:23:26 GMT
- ステータス: 処理完了
- システム内更新日: 2023-10-25 23:32:04.575361
- Title: Intelligent Debris Mass Estimation Model for Autonomous Underwater
Vehicle
- Title(参考訳): 自律型水中車両のインテリジェントデブリ質量推定モデル
- Authors: Mohana Sri S, Swethaa S, Aouthithiye Barathwaj SR Y, Sai Ganesh CS
- Abstract要約: 海洋の破片は海洋の野生生物の生存に重大な脅威となり、しばしば絡み合いや飢餓につながる。
インスタンスセグメンテーション(インスタンスセグメンテーション)は、オブジェクトを識別し、それらを正確に特定し、分離するオブジェクト検出の高度な形式である。
AUVは画像セグメンテーションを使用して、カメラが捉えた画像を分析し、水中環境をナビゲートする。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Marine debris poses a significant threat to the survival of marine wildlife,
often leading to entanglement and starvation, ultimately resulting in death.
Therefore, removing debris from the ocean is crucial to restore the natural
balance and allow marine life to thrive. Instance segmentation is an advanced
form of object detection that identifies objects and precisely locates and
separates them, making it an essential tool for autonomous underwater vehicles
(AUVs) to navigate and interact with their underwater environment effectively.
AUVs use image segmentation to analyze images captured by their cameras to
navigate underwater environments. In this paper, we use instance segmentation
to calculate the area of individual objects within an image, we use YOLOV7 in
Roboflow to generate a set of bounding boxes for each object in the image with
a class label and a confidence score for every detection. A segmentation mask
is then created for each object by applying a binary mask to the object's
bounding box. The masks are generated by applying a binary threshold to the
output of a convolutional neural network trained to segment objects from the
background. Finally, refining the segmentation mask for each object is done by
applying post-processing techniques such as morphological operations and
contour detection, to improve the accuracy and quality of the mask. The process
of estimating the area of instance segmentation involves calculating the area
of each segmented instance separately and then summing up the areas of all
instances to obtain the total area. The calculation is carried out using
standard formulas based on the shape of the object, such as rectangles and
circles. In cases where the object is complex, the Monte Carlo method is used
to estimate the area. This method provides a higher degree of accuracy than
traditional methods, especially when using a large number of samples.
- Abstract(参考訳): 海洋ゴミは海洋生物の生存に重大な脅威をもたらし、しばしば絡み合いや飢餓につながり、最終的には死に至る。
したがって、海洋からゴミを取り除くことは自然のバランスを回復し、海洋生物を繁栄させるのに不可欠である。
インスタンスセグメンテーション(インスタンスセグメンテーション)は、物体を識別し、それらを正確に特定し、分離するオブジェクト検出の先進的な形態であり、自律型水中車両(AUV)が水中環境を効果的に操作するための必須のツールである。
AUVは画像セグメンテーションを使用して、カメラが捉えた画像を分析し、水中環境をナビゲートする。
本稿では、画像内の個々のオブジェクトの面積を計算するためにインスタンスセグメンテーションを使用し、roboflowではyolov7を使用して、検出毎にクラスラベルと信頼度スコアを持つ画像内の各オブジェクトのバウンディングボックスのセットを生成する。
次に、オブジェクトの境界ボックスにバイナリマスクを適用することで、各オブジェクトに対してセグメンテーションマスクを作成する。
マスクは、背景からオブジェクトをセグメント化するように訓練された畳み込みニューラルネットワークの出力にバイナリしきい値を適用して生成される。
最後に、形態素演算や輪郭検出などの後処理技術を適用し、マスクの精度と品質を向上させることにより、各対象に対するセグメンテーションマスクの精錬を行う。
インスタンスセグメンテーションの領域を推定するプロセスは、各セグメンテーションされたインスタンスの領域を別々に計算し、全インスタンスの領域を合計して総面積を得る。
この計算は、矩形や円のような物体の形状に基づく標準式を用いて行われる。
対象が複素である場合、その領域を推定するためにモンテカルロ法が用いられる。
この方法は従来の方法よりも精度が高く、特に多数のサンプルを使用する場合に高い精度を提供する。
関連論文リスト
- LAC-Net: Linear-Fusion Attention-Guided Convolutional Network for Accurate Robotic Grasping Under the Occlusion [79.22197702626542]
本稿では, 乱れ場面におけるロボットグルーピングのためのアモーダルセグメンテーションを探求する枠組みを提案する。
線形融合注意誘導畳み込みネットワーク(LAC-Net)を提案する。
その結果,本手法が最先端の性能を達成できることが示唆された。
論文 参考訳(メタデータ) (2024-08-06T14:50:48Z) - PMODE: Prototypical Mask based Object Dimension Estimation [0.0]
そこで本研究では,モノクロカメラを用いて,映像の四辺形物体の寸法を推定する手法を提案する。
我々は,3種類のランダムカメラを用いて,次元推定のためのテストデータセットに対して,22%のMAPEを達成できるシステムを訓練した。
論文 参考訳(メタデータ) (2022-12-26T19:24:25Z) - Discovering Object Masks with Transformers for Unsupervised Semantic
Segmentation [75.00151934315967]
MaskDistillは教師なしセマンティックセグメンテーションのための新しいフレームワークである。
我々のフレームワークは、低レベルの画像キューにラッチを付けず、オブジェクト中心のデータセットに限らない。
論文 参考訳(メタデータ) (2022-06-13T17:59:43Z) - Layered Depth Refinement with Mask Guidance [61.10654666344419]
汎用マスクを用いてSIDEモデルの深度予測を洗練させるマスク誘導深度改善の新しい問題を定式化する。
本フレームワークは,奥行きマップをマスクと逆マスクで表される2つの別々の層に分解し,層状改質・塗装・塗装を行う。
本手法は,内面境界領域と外面境界領域の深度を正確に補正し,異なる種類のマスクや初期深度予測に対して堅牢であることを示す。
論文 参考訳(メタデータ) (2022-06-07T06:42:44Z) - Robust Visual Tracking by Segmentation [103.87369380021441]
対象範囲を推定することは、視覚的物体追跡において根本的な課題となる。
高精度なセグメンテーションマスクを生成するセグメンテーション中心のトラッキングパイプラインを提案する。
我々のトラッカーは、シーンのターゲットを背景コンテンツと明確に区別するターゲット表現をよりよく学習することができる。
論文 参考訳(メタデータ) (2022-03-21T17:59:19Z) - BBAM: Bounding Box Attribution Map for Weakly Supervised Semantic and
Instance Segmentation [19.55647093153416]
バウンディングボックスアノテーションを用いた弱い教師付きセグメンテーション手法は、オブジェクトを含む各ボックスからピクセルレベルのマスクを取得することに焦点を当てている。
本研究では,対象検出器が生成する画像の最小領域を画像全体とほぼ同程度に求めることにより,訓練対象検出器の挙動から得られる高次情報を利用する。
これらの領域はバウンディングボックスアトリビューションマップ(bbam)を構成しており、バウンディングボックス内の対象オブジェクトを識別し、弱い教師付きセマンティクスとcocoインスタンスセグメンテーションのための擬似基底となる。
論文 参考訳(メタデータ) (2021-03-16T08:29:33Z) - Scale Normalized Image Pyramids with AutoFocus for Object Detection [75.71320993452372]
スケール正規化画像ピラミッド(SNIP)が生成され、人間の視覚と同様に、異なるスケールで固定されたサイズ範囲内のオブジェクトにのみ参加する。
本研究では,オブジェクトを含む可能性のある固定サイズのサブリージョンのみで動作する,効率的な空間サブサンプリング手法を提案する。
結果のアルゴリズムはAutoFocusと呼ばれ、SNIPを使用する場合の推論では2.5~5倍のスピードアップとなる。
論文 参考訳(メタデータ) (2021-02-10T18:57:53Z) - Instance Segmentation of Biomedical Images with an Object-aware
Embedding Learned with Local Constraints [7.151685185368064]
State-of-the-artアプローチはセマンティックセグメンテーションまたは洗練されたオブジェクトバウンディングボックスを実行する。
どちらも、隣のオブジェクトをマージしたり、有効なオブジェクトを抑圧したりして、さまざまな程度に混雑するオブジェクトに悩まされる。
本研究では,深層ニューラルネットワークを用いて各画素に埋め込みベクトルを割り当てる。
論文 参考訳(メタデータ) (2020-04-21T08:33:29Z) - Refined Plane Segmentation for Cuboid-Shaped Objects by Leveraging Edge
Detection [63.942632088208505]
本稿では,セグメント化された平面マスクを画像に検出されたエッジと整列するための後処理アルゴリズムを提案する。
これにより、立方体形状の物体に制限を加えながら、最先端のアプローチの精度を高めることができます。
論文 参考訳(メタデータ) (2020-03-28T18:51:43Z) - SDOD:Real-time Segmenting and Detecting 3D Object by Depth [5.97602869680438]
本稿では,3次元物体を奥行きで分割・検出するリアルタイムフレームワークを提案する。
オブジェクトの深さを深度カテゴリに分類し、インスタンス分割タスクをピクセルレベルの分類タスクに変換する。
挑戦的なKITTIデータセットの実験から、我々のアプローチはLklNetを約1.8倍の性能で、セグメンテーションと3D検出の速度を上回ります。
論文 参考訳(メタデータ) (2020-01-26T09:06:18Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。