Fugu-MT 論文翻訳(概要): Knowledge Distillation in YOLOX-ViT for Side-Scan Sonar Object Detection

論文の概要: Knowledge Distillation in YOLOX-ViT for Side-Scan Sonar Object Detection

arxiv url: http://arxiv.org/abs/2403.09313v1
Date: Thu, 14 Mar 2024 12:03:28 GMT
ステータス: 翻訳完了
システム内更新日: 2024-03-15 20:47:15.556281
Title: Knowledge Distillation in YOLOX-ViT for Side-Scan Sonar Object Detection
Title（参考訳）: サイドスキャンソナー物体検出のためのYOLOX-ViTの知識蒸留
Authors: Martin Aubard, László Antal, Ana Madureira, Erika Ábrahám,
Abstract要約: 本稿では,新しい物体検出モデルであるYOLOX-ViTについて述べる。我々は、新しいサイドスキャンソナー画像データセットを導入し、それを用いて、対象検出器の性能を評価する。
参考スコア（独自算出の注目度）: 0.40498500266986387
License: http://creativecommons.org/licenses/by/4.0/
Abstract: In this paper we present YOLOX-ViT, a novel object detection model, and investigate the efficacy of knowledge distillation for model size reduction without sacrificing performance. Focused on underwater robotics, our research addresses key questions about the viability of smaller models and the impact of the visual transformer layer in YOLOX. Furthermore, we introduce a new side-scan sonar image dataset, and use it to evaluate our object detector's performance. Results show that knowledge distillation effectively reduces false positives in wall detection. Additionally, the introduced visual transformer layer significantly improves object detection accuracy in the underwater environment. The source code of the knowledge distillation in the YOLOX-ViT is at https://github.com/remaro-network/KD-YOLOX-ViT.
Abstract（参考訳）: 本稿では,新しい物体検出モデルであるYOLOX-ViTについて述べる。水中ロボットに焦点をあてた研究は、小型モデルの生存可能性とYOLOXのビジュアルトランスフォーマー層の影響について重要な疑問に対処する。さらに,新しいサイドスキャンソナー画像データセットを導入し,オブジェクト検出器の性能評価に利用した。その結果, 知識蒸留は, 壁面検出における偽陽性を効果的に減少させることがわかった。さらに、導入された視覚トランス層は水中環境における物体検出精度を大幅に向上させる。 YOLOX-ViTの知識蒸留のソースコードはhttps://github.com/remaro-network/KD-YOLOX-ViTにある。

関連論文リスト

TranX-Adapter: Bridging Artifacts and Semantics within MLLMs for Robust AI-generated Image Detection [70.42796551833946]
テクスチャレベルのアーティファクトとセマンティックな特徴をマルチモーダルな言語モデル(MLLM)に組み込むことで、AIGI検出能力を向上することができる。本稿では,タスク認識型Optimal-Transport Fusionを統合した軽量フュージョンアダプタTranX-Adapterを提案する。いくつかの高度なMLLM上での標準AIGI検出ベンチマークの実験は、TranX-Adapterが一貫性と大幅な改善をもたらすことを示している。
論文参考訳（メタデータ） (2026-02-25T09:22:46Z)
SOD-YOLO: Enhancing YOLO-Based Detection of Small Objects in UAV Imagery [5.639904484784127]
実験結果から,SOD-YOLOは検出性能を著しく向上することが示された。 SOD-YOLOは、UAV画像における小さな物体検出のための実用的で効率的なソリューションである。
論文参考訳（メタデータ） (2025-07-17T02:04:54Z)
MASF-YOLO: An Improved YOLOv11 Network for Small Object Detection on Drone View [0.0]
マルチスケールコンテキストアグリゲーションとスケール適応型フュージョンYOLO(MASF-YOLO)を提案する。 UAV画像における小物体検出の難しさに対処するため,小型物体の検出精度を大幅に向上させるMFAM(Multi-scale Feature Aggregation Module)を設計した。第3に,マルチスケール機能融合機能を強化したDASI(Dimension-Aware Selective Integration Module)を導入する。
論文参考訳（メタデータ） (2025-04-25T07:43:33Z)
RS-YOLOX: A High Precision Detector for Object Detection in Satellite Remote Sensing Images [20.582343125606403]
本稿では,衛星リモートセンシング画像の自動検出のための改良型YOLOXモデルを提案する。ネットワークの機能学習能力を高めるために,YOLOXのバックボーンネットワークにおいて,効率的なチャネル注意(ECA)を用いた。トレーニングにおける正と負のサンプル数のバランスをとるために,Varifocal Loss関数を用いた。 Slicing Aided Hyper Inferenceと呼ばれるオープンソースのフレームワークを用いて,高速なリモートセンシングオブジェクト検出器を実現する。
論文参考訳（メタデータ） (2025-02-05T03:05:33Z)
Understanding and Improving Training-Free AI-Generated Image Detections with Vision Foundation Models [68.90917438865078]
顔合成と編集のためのディープフェイク技術は、生成モデルに重大なリスクをもたらす。本稿では,モデルバックボーン,タイプ,データセット間で検出性能がどう変化するかを検討する。本稿では、顔画像のパフォーマンスを向上させるContrastive Blurと、ノイズタイプのバイアスに対処し、ドメイン間のパフォーマンスのバランスをとるMINDERを紹介する。
論文参考訳（メタデータ） (2024-11-28T13:04:45Z)
YOLO-ELA: Efficient Local Attention Modeling for High-Performance Real-Time Insulator Defect Detection [0.0]
無人航空機からの絶縁体欠陥検出のための既存の検出方法は、複雑な背景や小さな物体と競合する。本稿では,この課題に対処するため,新しい注目基盤アーキテクチャであるYOLO-ELAを提案する。高分解能UAV画像による実験結果から,本手法は96.9% mAP0.5,リアルタイム検出速度74.63フレーム/秒を実現した。
論文参考訳（メタデータ） (2024-10-15T16:00:01Z)
Spatial Transformer Network YOLO Model for Agricultural Object Detection [0.3124884279860061]
本稿では,空間変換器ネットワーク(STN)をYOLOに統合し,性能を向上させる手法を提案する。提案するSTN-YOLOは,画像の重要な領域に着目し,モデルの有効性を高めることを目的としている。農業オブジェクト検出のためのベンチマークデータセットと、最先端の植物表現型温室施設からの新たなデータセットにSTN-YOLOを適用した。
論文参考訳（メタデータ） (2024-07-31T14:53:41Z)
Innovative Horizons in Aerial Imagery: LSKNet Meets DiffusionDet for Advanced Object Detection [55.2480439325792]
本稿では,LSKNetのバックボーンをDiffusionDetヘッドに統合したオブジェクト検出モデルの詳細な評価を行う。提案手法は平均精度(MAP)を約45.7%向上させる。この進歩は、提案された修正の有効性を強調し、航空画像解析の新しいベンチマークを設定する。
論文参考訳（メタデータ） (2023-11-21T19:49:13Z)
Object-centric Cross-modal Feature Distillation for Event-based Object Detection [87.50272918262361]
RGB検出器は、イベントデータのばらつきと視覚的詳細の欠如により、イベントベースの検出器よりも優れている。これら2つのモード間の性能ギャップを縮めるための新しい知識蒸留手法を開発した。対象中心蒸留により,イベントベースの学生物体検出装置の性能が大幅に向上することを示す。
論文参考訳（メタデータ） (2023-11-09T16:33:08Z)
A Study on Tiny YOLO for Resource Constrained Xray Threat Detection [0.0]
本稿では,X線脅威検出などのエッジデバイスアプリケーションへの適合性を念頭に,複数のネットワークを実装し,解析する。我々は、セキュリティ荷物検診画像の脅威を検出するタスクを、最先端のYOLOオブジェクト検出モデルを用いて解決する。
論文参考訳（メタデータ） (2023-09-27T12:02:33Z)
Learning Heavily-Degraded Prior for Underwater Object Detection [59.5084433933765]
本稿では、検出器フレンドリーな画像から、転送可能な事前知識を求める。これは、検出器フレンドリー(DFUI)と水中画像の高度に劣化した領域が、特徴分布のギャップがあることを統計的に観察したものである。高速かつパラメータの少ない本手法は変圧器型検出器よりも優れた性能を保っている。
論文参考訳（メタデータ） (2023-08-24T12:32:46Z)
YOLO-MS: Rethinking Multi-Scale Representation Learning for Real-time Object Detection [80.11152626362109]
YOLO-MSと呼ばれる効率的かつ高性能な物体検出器を提供する。私たちは、他の大規模なデータセットに頼ることなく、MS COCOデータセット上でYOLO-MSをスクラッチからトレーニングします。私たちの仕事は、他のYOLOモデルのプラグイン・アンド・プレイ・モジュールとしても使えます。
論文参考訳（メタデータ） (2023-08-10T10:12:27Z)
DeepSeaNet: Improving Underwater Object Detection using EfficientDet [0.0]
このプロジェクトでは、注釈付き水中データセット上で様々な物体検出モデルを実装し、評価する。このデータセットは、Limfjorden水中で捕獲された魚、カニ、ヒトデ、その他の水生動物の注釈画像からなる。 I compare the results of YOLOv3 (31.10% mean Average Precision (mAP)), YOLOv4 (83.72% mAP), YOLOv5 (97.6%), YOLOv8 (98.20%), EfficientDet (98.56% mAP) and Detectron2 (95.20% mAP) on the same dataset。
論文参考訳（メタデータ） (2023-05-26T13:41:35Z)
SSMTL++: Revisiting Self-Supervised Multi-Task Learning for Video Anomaly Detection [108.57862846523858]
自己教師型マルチタスク学習フレームワークを再考し、元の手法にいくつかのアップデートを提案する。マルチヘッド・セルフアテンション・モジュールを導入することで3次元畳み込みバックボーンを近代化する。モデルをさらに改良するために,セグメントマップの予測などの自己指導型学習タスクについて検討した。
論文参考訳（メタデータ） (2022-07-16T19:25:41Z)
A lightweight and accurate YOLO-like network for small target detection in Aerial Imagery [94.78943497436492]
小型ターゲット検出のためのシンプルで高速で効率的なネットワークであるYOLO-Sを提案する。 YOLO-SはDarknet20をベースとした小さな特徴抽出器と、バイパスと連結の両方を通じて接続をスキップする。 YOLO-Sはパラメータサイズが87%減少し、約半分のFLOPがYOLOv3となり、低消費電力の産業用アプリケーションに実用化された。
論文参考訳（メタデータ） (2022-04-05T16:29:49Z)
LF-YOLO: A Lighter and Faster YOLO for Weld Defect Detection of X-ray Image [7.970559381165446]
畳み込みニューラルネットワーク(CNN)に基づく溶接欠陥検出手法,すなわちLighter and Faster YOLO(LF-YOLO)を提案する。検出ネットワークの性能向上のために,効率的な特徴抽出(EFE)モジュールを提案する。その結果, 溶接欠陥ネットワークは性能と消費のバランスが良好であり, 61.5 FPSの92.9 mAP50に達することがわかった。
論文参考訳（メタデータ） (2021-10-28T12:19:32Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。