論文の概要: BARIS: Boundary-Aware Refinement with Environmental Degradation Priors for Robust Underwater Instance Segmentation
- arxiv url: http://arxiv.org/abs/2504.19643v1
- Date: Mon, 28 Apr 2025 10:00:22 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-05-02 19:15:54.393772
- Title: BARIS: Boundary-Aware Refinement with Environmental Degradation Priors for Robust Underwater Instance Segmentation
- Title(参考訳): BARIS:ロバストな水中インスタンスセグメンテーションにおける環境劣化を優先した境界対応リファインメント
- Authors: Pin-Chi Pan, Soo-Chang Pei,
- Abstract要約: 水中のインスタンスセグメンテーションは、光の減衰、散乱、色歪みなどの視覚上の悪条件のために困難である。
機能改善によるセグメンテーション精度を向上させるフレームワークであるBARIS-Decoderを提案する。
水中劣化に対処するために, 水中劣化パターンを効率的にモデル化する環境適応器(ERA)を導入する。
BARIS-ERAは最先端のパフォーマンスを実現し、Mask R-CNNを3.4mAP、Swin-Bのバックボーン、ConvNeXt V2の3.8mAPで上回っている。
- 参考スコア(独自算出の注目度): 1.9797215742507543
- License: http://creativecommons.org/licenses/by-nc-sa/4.0/
- Abstract: Underwater instance segmentation is challenging due to adverse visual conditions such as light attenuation, scattering, and color distortion, which degrade model performance. In this work, we propose BARIS-Decoder (Boundary-Aware Refinement Decoder for Instance Segmentation), a framework that enhances segmentation accuracy through feature refinement. To address underwater degradations, we introduce the Environmental Robust Adapter (ERA), which efficiently models underwater degradation patterns while reducing trainable parameters by over 90\% compared to full fine-tuning. The integration of BARIS-Decoder with ERA-tuning, referred to as BARIS-ERA, achieves state-of-the-art performance, surpassing Mask R-CNN by 3.4 mAP with a Swin-B backbone and 3.8 mAP with ConvNeXt V2. Our findings demonstrate the effectiveness of BARIS-ERA in advancing underwater instance segmentation, providing a robust and efficient solution.
- Abstract(参考訳): 水中インスタンスのセグメンテーションは、光減衰、散乱、色歪みなどの視覚上の悪条件のために困難であり、モデル性能を低下させる。
本研究では,機能改善によるセグメンテーション精度を高めるフレームワークであるBARIS-Decoder (Boundary-Aware Refinement Decoder for Instance Segmentation)を提案する。
水中劣化に対処するため, 環境ロバスト適応器 (ERA) を導入し, 水中劣化パターンを効率的にモデル化し, トレーニング可能なパラメータをフル微調整に比べて90%以上削減した。
BARIS-DecoderとERA-tuningを統合したBARIS-ERAは、Mask R-CNNを3.4mAP、Swin-Bバックボーンを3.8mAP、ConvNeXt V2を3.8mAPで上回り、最先端のパフォーマンスを実現している。
以上の結果から, BARIS-ERAが水中のインスタンスセグメンテーションに有効であることが示唆された。
関連論文リスト
- An improved EfficientNetV2 for garbage classification [0.27309692684728615]
本稿では,データ取得コスト,一般化,リアルタイムパフォーマンスの課題に対処するため,EfficientNetV2に基づく廃棄物分類フレームワークを提案する。
Huawei Cloudの廃棄物分類データセットの実験では、本手法は95.4%の分類精度を達成し、ベースラインを3.2%上回り、主流モデルを上回っている。
論文 参考訳(メタデータ) (2025-03-27T06:50:44Z) - ERANet: Edge Replacement Augmentation for Semi-Supervised Meniscus Segmentation with Prototype Consistency Alignment and Conditional Self-Training [13.530502204769807]
半教師付きメニスカスセグメンテーションフレームワークであるERANetを提案する。
ERANetは、エッジ置換強化(ERA)、プロトタイプ整合性調整(PCA)、条件付き自己学習(CST)戦略を統合している。
3D double Echo Steady State (DESS) と 3D Fast/Turbo Spin Echo (FSE/TSE) MRI を用いた。
論文 参考訳(メタデータ) (2025-02-11T07:49:31Z) - MV-Adapter: Enhancing Underwater Instance Segmentation via Adaptive Channel Attention [0.0]
MarineVision Adapter (MV-Adapter) は、各チャネルの特徴量を調整するための適応的なチャネルアテンダ機構である。
特徴を適応的に重み付けすることで、モデルは光の減衰、色の変化、複雑な背景といった課題を効果的に処理できる。
実験結果から,MV-AdapterモジュールをUSIS-SAMネットワークアーキテクチャに統合することで,モデル全体の性能が向上することが示された。
論文 参考訳(メタデータ) (2024-11-01T09:38:04Z) - Improving Gaussian Splatting with Localized Points Management [52.009874685460694]
局所的点管理(LPM)は、点加算と幾何校正の両方を最大限に必要としながら、これらの誤り貢献ゾーンを特定することができる。
LPMは特定されたゾーンに点密度を適用し、これらの領域の前にある点の不透明度をリセットし、不適切な点を修正する新しい機会を生み出す。
特に、LPMは静的3DGSとダイナミックなSpaceTimeGSの両方を改善して、リアルタイム速度を維持しながら最先端のレンダリング品質を実現している。
論文 参考訳(メタデータ) (2024-06-06T16:55:07Z) - DGNet: Dynamic Gradient-Guided Network for Water-Related Optics Image
Enhancement [77.0360085530701]
水中画像強調(UIE)は、水中環境によって引き起こされる複雑な劣化のために難しい課題である。
従来の手法では、劣化過程を理想化し、中音や物体の動きが画像の特徴の分布に与える影響を無視することが多い。
提案手法では,予測画像を用いて疑似ラベルを動的に更新し,動的勾配を加えてネットワークの勾配空間を最適化する。
論文 参考訳(メタデータ) (2023-12-12T06:07:21Z) - AMSP-UOD: When Vortex Convolution and Stochastic Perturbation Meet
Underwater Object Detection [40.532331552038485]
AMSP-UOD(Amplitude-Modulated Perturbation and Vortex Convolutional Network)を提案する。
AMSP-UODは複雑な水中環境における非理想的撮像因子が検出精度に与える影響に対処する。
提案手法は,既存の最先端手法よりも精度とノイズ免疫の点で優れる。
論文 参考訳(メタデータ) (2023-08-23T05:03:45Z) - Patch-Level Contrasting without Patch Correspondence for Accurate and
Dense Contrastive Representation Learning [79.43940012723539]
ADCLRは、正確で高密度な視覚表現を学習するための自己教師型学習フレームワークである。
提案手法は, コントラッシブな手法のための新しい最先端性能を実現する。
論文 参考訳(メタデータ) (2023-06-23T07:38:09Z) - PUGAN: Physical Model-Guided Underwater Image Enhancement Using GAN with
Dual-Discriminators [120.06891448820447]
鮮明で視覚的に快適な画像を得る方法は、人々の共通の関心事となっている。
水中画像強調(UIE)の課題も、時間とともに現れた。
本稿では,UIE のための物理モデル誘導型 GAN モデルを提案する。
我々のPUGANは質的および定量的な測定値において最先端の手法より優れています。
論文 参考訳(メタデータ) (2023-06-15T07:41:12Z) - SEA: Bridging the Gap Between One- and Two-stage Detector Distillation
via SEmantic-aware Alignment [76.80165589520385]
細粒度情報を抽象化する性質から,SEA (SEmantic-Aware Alignment) 蒸留法を命名した。
1段検出器と2段検出器の両方において、挑戦的な物体検出タスクにおいて、最先端の新たな結果が得られる。
論文 参考訳(メタデータ) (2022-03-02T04:24:05Z) - Distortion-Aware Loop Filtering of Intra 360^o Video Coding with
Equirectangular Projection [81.63407194858854]
等角射影(ERP)フォーマットで投影された360$o$ビデオの符号化性能を向上させるため,歪みを考慮したループフィルタリングモデルを提案する。
提案モジュールは、符号化ユニット(CU)パーティションマスクに基づいてコンテンツ特性を分析し、部分的畳み込みによって処理し、指定された領域を活性化する。
論文 参考訳(メタデータ) (2022-02-20T12:00:18Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。