Fugu-MT 論文翻訳(概要): Inland Waterway Object Detection in Multi-environment: Dataset and Approach

論文の概要: Inland Waterway Object Detection in Multi-environment: Dataset and Approach

arxiv url: http://arxiv.org/abs/2504.04835v1
Date: Mon, 07 Apr 2025 08:45:00 GMT
ステータス: 翻訳完了
システム内更新日: 2025-04-15 20:56:25.860114
Title: Inland Waterway Object Detection in Multi-environment: Dataset and Approach
Title（参考訳）: 多環境における内陸水域物体検出:データセットとアプローチ
Authors: Shanshan Wang, Haixiang Xu, Hui Feng, Xiaoqian Wang, Pei Song, Sijie Liu, Jianhua He,
Abstract要約: 本稿では,多環境インランド・ウォーターウェイ・ベッセル・データセット(MEIWVD)を紹介する。 MEIWVDは、晴れ、雨、霧、人工照明など様々なシナリオから32,478枚の高品質な画像で構成されている。本稿では,環境条件に応じた水面画像改善のためのシーン誘導画像強調モジュールを提案する。
参考スコア（独自算出の注目度）: 12.00732943849236
License: http://creativecommons.org/licenses/by/4.0/
Abstract: The success of deep learning in intelligent ship visual perception relies heavily on rich image data. However, dedicated datasets for inland waterway vessels remain scarce, limiting the adaptability of visual perception systems in complex environments. Inland waterways, characterized by narrow channels, variable weather, and urban interference, pose significant challenges to object detection systems based on existing datasets. To address these issues, this paper introduces the Multi-environment Inland Waterway Vessel Dataset (MEIWVD), comprising 32,478 high-quality images from diverse scenarios, including sunny, rainy, foggy, and artificial lighting conditions. MEIWVD covers common vessel types in the Yangtze River Basin, emphasizing diversity, sample independence, environmental complexity, and multi-scale characteristics, making it a robust benchmark for vessel detection. Leveraging MEIWVD, this paper proposes a scene-guided image enhancement module to improve water surface images based on environmental conditions adaptively. Additionally, a parameter-limited dilated convolution enhances the representation of vessel features, while a multi-scale dilated residual fusion method integrates multi-scale features for better detection. Experiments show that MEIWVD provides a more rigorous benchmark for object detection algorithms, and the proposed methods significantly improve detector performance, especially in complex multi-environment scenarios.
Abstract（参考訳）: インテリジェントな船の視覚知覚におけるディープラーニングの成功は、リッチな画像データに大きく依存している。しかし、内陸水路船の専用データセットは乏しいままであり、複雑な環境下での視覚知覚システムの適応性を制限している。内陸水路は、狭い水路、変動気象、都市干渉が特徴であり、既存のデータセットに基づく物体検出システムに重大な課題をもたらす。これらの課題に対処するため, 日照, 雨天, 霧天, 人工照明など様々なシナリオから, 高品質の画像32,478枚からなる多環境内陸海路容器データセット(MEIWVD)を紹介した。 MEIWVDは、ヤンツ川流域の一般的な船舶タイプをカバーし、多様性、サンプル独立性、環境の複雑さ、マルチスケールの特徴を強調しており、船舶検出の堅牢なベンチマークとなっている。本稿では,MEIWVDを活用し,環境条件に応じた水面画像改善のためのシーン誘導画像強調モジュールを提案する。さらに, パラメータ限定拡張畳み込みにより容器特徴の表現が向上し, マルチスケール拡張残差融合法がマルチスケール特徴を統合し, より優れた検出を行う。実験により,MEIWVDはオブジェクト検出アルゴリズムの厳密なベンチマークを提供し,特に複雑なマルチ環境シナリオにおいて検出性能を著しく向上することが示された。

関連論文リスト

Learning Underwater Active Perception in Simulation [51.205673783866146]
タービディティは、検査された構造物の正確な視覚的記録を阻止する可能性があるため、ミッション全体を危険に晒す可能性がある。従来の研究は、濁度や後方散乱に適応する手法を導入してきた。本研究では, 広範囲の水環境下での高品質な画像取得を実現するための, 単純かつ効率的なアプローチを提案する。
論文参考訳（メタデータ） (2025-04-23T06:48:38Z)
WS-DETR: Robust Water Surface Object Detection through Vision-Radar Fusion with Detection Transformer [4.768265044725289]
水面オブジェクト検出は、ぼやけたエッジと多様なオブジェクトスケールの課題に直面します。既存のアプローチは、モデルの堅牢性に悪影響を及ぼす、クロスモーダルな機能競合に悩まされている。本稿では,SOTA(State-of-the-art)性能を実現する頑健なビジョンレーダ融合モデルWS-DETRを提案する。
論文参考訳（メタデータ） (2025-04-10T04:16:46Z)
Image-Based Relocalization and Alignment for Long-Term Monitoring of Dynamic Underwater Environments [57.59857784298534]
本稿では,視覚的位置認識(VPR),特徴マッチング,画像分割を組み合わせた統合パイプラインを提案する。本手法は, 再検討領域のロバスト同定, 剛性変換の推定, 生態系変化の下流解析を可能にする。
論文参考訳（メタデータ） (2025-03-06T05:13:19Z)
Real-Time Multi-Scene Visibility Enhancement for Promoting Navigational Safety of Vessels Under Complex Weather Conditions [48.529493393948435]
この可視光カメラは、インテリジェントな水上輸送システムにおいて、海洋表面の容器に不可欠なイメージングセンサーとして登場した。視覚画像の画質は、複雑な気象条件下での様々な劣化に必然的に悩まされる。本研究では,異なる気象条件下で撮影された劣化画像を復元する汎用多場面可視性向上手法を開発した。
論文参考訳（メタデータ） (2024-09-02T23:46:27Z)
AMANet: Advancing SAR Ship Detection with Adaptive Multi-Hierarchical Attention Network [0.5437298646956507]
適応型多階層型アテンションモジュール (AMAM) を提案する。まず,隣り合う特徴層からの情報を融合して,より小さなターゲットの検出を強化し,マルチスケールな特徴強調を実現する。第3に,AMAMをバックボーンネットワークと特徴ピラミッドネットワークに埋め込むことにより,適応型多階層アテンションネットワーク(AMANet)を提案する。
論文参考訳（メタデータ） (2024-01-24T03:56:33Z)
MuLA-GAN: Multi-Level Attention GAN for Enhanced Underwater Visibility [1.9272863690919875]
本稿では,総合的な水中画像強調のためのGAN(Geneversarative Adrial Networks)とマルチレベルアテンション機構の相乗効果を利用した新しいアプローチであるMuLA-GANを紹介する。本モデルは,水中画像の複雑な細部を捉え保存することに優れており,様々な用途に欠かせない。この研究は、水中画像の強調における重要な研究ギャップに対処するだけでなく、GANの強化におけるマルチレベル注意の重要性を浮き彫りにしている。
論文参考訳（メタデータ） (2023-12-25T07:33:47Z)
An Efficient Detection and Control System for Underwater Docking using Machine Learning and Realistic Simulation: A Comprehensive Approach [5.039813366558306]
この研究は、水中ドッキングの検出と分類を行うために異なるディープラーニングアーキテクチャと比較する。 GAN(Generative Adversarial Network)は画像から画像への変換に用いられ、ガゼボのシミュレーション画像を水中画像に変換する。その結果,水中の潮流によらず,高濁度シナリオでは20%の改善が見られた。
論文参考訳（メタデータ） (2023-11-02T18:10:20Z)
Learning Heavily-Degraded Prior for Underwater Object Detection [59.5084433933765]
本稿では、検出器フレンドリーな画像から、転送可能な事前知識を求める。これは、検出器フレンドリー(DFUI)と水中画像の高度に劣化した領域が、特徴分布のギャップがあることを統計的に観察したものである。高速かつパラメータの少ない本手法は変圧器型検出器よりも優れた性能を保っている。
論文参考訳（メタデータ） (2023-08-24T12:32:46Z)
Joint Learning of Salient Object Detection, Depth Estimation and Contour Extraction [91.43066633305662]
RGB-D Salient Object Detection (SOD) のための新しいマルチタスク・マルチモーダルフィルタトランス (MMFT) ネットワークを提案する。具体的には、深度推定、健全な物体検出、輪郭推定の3つの相補的なタスクを統合する。マルチタスク機構は、タスク認識の特徴を補助タスクから学習するためのモデルを促進する。実験の結果、複数のデータセット上での深度に基づくRGB-D SOD法をはるかに上回るだけでなく、高品質の深度マップと塩分濃度を同時に正確に予測できることがわかった。
論文参考訳（メタデータ） (2022-03-09T17:20:18Z)
M2TR: Multi-modal Multi-scale Transformers for Deepfake Detection [74.19291916812921]
Deepfake技術によって生成された鍛造画像は、デジタル情報の信頼性に深刻な脅威をもたらします。本稿では,Deepfake検出のための微妙な操作アーチファクトを異なるスケールで捉えることを目的とする。最先端の顔スワッピングと顔の再現方法によって生成された4000のDeepFakeビデオで構成される高品質のDeepFakeデータセットSR-DFを紹介します。
論文参考訳（メタデータ） (2021-04-20T05:43:44Z)
A Parallel Down-Up Fusion Network for Salient Object Detection in Optical Remote Sensing Images [82.87122287748791]
光リモートセンシング画像(RSI)における有意な物体検出のための新しい並列ダウンアップフュージョンネットワーク(PDF-Net)を提案する。 In-pathの低レベル・高レベルな特徴とクロスパスの多解像度な特徴をフル活用して、多様なスケールのサルエントオブジェクトを識別し、散らかった背景を抑える。 ORSSDデータセットの実験により、提案したネットワークは定性的かつ定量的に最先端のアプローチよりも優れていることが示された。
論文参考訳（メタデータ） (2020-10-02T05:27:57Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。