Fugu-MT 論文翻訳(概要): YOLOCS: Object Detection based on Dense Channel Compression for Feature Spatial Solidification

論文の概要: YOLOCS: Object Detection based on Dense Channel Compression for Feature Spatial Solidification

arxiv url: http://arxiv.org/abs/2305.04170v6
Date: Sun, 13 Oct 2024 12:58:36 GMT
ステータス: 翻訳完了
システム内更新日: 2024-12-05 18:54:03.987187
Title: YOLOCS: Object Detection based on Dense Channel Compression for Feature Spatial Solidification
Title（参考訳）: YOLOCS:特徴空間凝固のためのDense Channel Compressionに基づく物体検出
Authors: Lin Huang, Weisheng Li, Yujuan Tan, Linlin Shen, Jing Yu, Haojie Fu,
Abstract要約: 本稿では,Dense Channel Compression for Feature Spatial Solidification Structure (DCFS) と非対称多層圧縮デカップリングヘッド (ADH) という,バックボーンとヘッドネットワークのための2つの革新的なモジュールを紹介する。 YOLOv5モデルに統合されると、これらの2つのモジュールは例外的な性能を示し、YOLOCSと呼ばれるモデルが修正される。
参考スコア（独自算出の注目度）: 38.49525419649799
License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
Abstract: In this study, we examine the associations between channel features and convolutional kernels during the processes of feature purification and gradient backpropagation, with a focus on the forward and backward propagation within the network. Consequently, we propose a method called Dense Channel Compression for Feature Spatial Solidification. Drawing upon the central concept of this method, we introduce two innovative modules for backbone and head networks: the Dense Channel Compression for Feature Spatial Solidification Structure (DCFS) and the Asymmetric Multi-Level Compression Decoupled Head (ADH). When integrated into the YOLOv5 model, these two modules demonstrate exceptional performance, resulting in a modified model referred to as YOLOCS. Evaluated on the MSCOCO dataset, the large, medium, and small YOLOCS models yield AP of 50.1%, 47.6%, and 42.5%, respectively. Maintaining inference speeds remarkably similar to those of the YOLOv5 model, the large, medium, and small YOLOCS models surpass the YOLOv5 model's AP by 1.1%, 2.3%, and 5.2%, respectively.
Abstract（参考訳）: 本研究では,機能浄化過程におけるチャネル特性と畳み込みカーネルの関係について検討し,ネットワーク内における前方・後方伝播に着目した。そこで本稿では,Dense Channel Compression for Feature Spatial Solidificationを提案する。本手法の中心的な概念に基づいて,Dense Channel Compression for Feature Spatial Solidification Structure (DCFS) と非対称多層圧縮デカップリングヘッド (ADH) という,バックボーンとヘッドネットワークのための2つの革新的なモジュールを紹介した。 YOLOv5モデルに統合されると、これらの2つのモジュールは例外的な性能を示し、YOLOCSと呼ばれるモデルが修正される。 MSCOCOデータセットに基づいて評価すると、大、中、小のYOLOCSモデルはそれぞれ50.1%、47.6%、42.5%のAPが得られる。推論速度の維持は、YOLOv5モデルと著しく類似しており、大、中、小のYOLOCSモデルは、それぞれYOLOv5モデルのAPを1.1%、2.3%、5.2%上回っている。

関連論文リスト

Function-Space Decoupled Diffusion for Forward and Inverse Modeling in Carbon Capture and Storage [65.51149575007149]
本稿では,Fun-DDPSについて述べる。Fun-DDPSは,関数空間拡散モデルと微分可能なニューラル演算子サロゲートを結合した生成フレームワークである。 Fun-DDPSは、ジョイントステートベースラインで観察される高周波アーティファクトから、物理的に一貫した実現をもたらす。
論文参考訳（メタデータ） (2026-02-12T18:58:12Z)
Structure-Informed Estimation for Pilot-Limited MIMO Channels via Tensor Decomposition [51.56484100374058]
本稿では、スパース観測から低ランクテンソル完備化としてパイロットリミテッドチャネル推定を定式化する。合成チャネル実験による最小二乗平均二乗誤差(NMSE)の最小二乗平均誤差(LS)に対する改善 DeepMIMO線トレーシングチャネルの評価では、純粋なテンソル法よりも24-44%NMSEが減少している。
論文参考訳（メタデータ） (2026-02-03T23:38:05Z)
YOLO-DS: Fine-Grained Feature Decoupling via Dual-Statistic Synergy Operator for Object Detection [55.58092342624062]
DSO(Dual-Statistic Synergy Operator)を中心に構築されたYOLO-DSを提案する。 YOLO-DSは、チャネル平均とピーク平均差を共同でモデル化することにより、オブジェクトの特徴を分離する。 MS-COCOベンチマークでは、YOLO-DSは5つのモデルスケールでYOLOv8を上回っている。
論文参考訳（メタデータ） (2026-01-26T05:50:32Z)
Efficient Federated Learning with Timely Update Dissemination [54.668309196009204]
分散データ管理のための魅力的な方法論として、フェデレートラーニング(FL)が登場した。そこで本稿では,ダウンリンクの帯域幅を削減し,タイムリーな更新を確実にするための効率的なFL手法を提案する。
論文参考訳（メタデータ） (2025-07-08T14:34:32Z)
YOLOv13: Real-Time Object Detection with Hypergraph-Enhanced Adaptive Visual Perception [44.76134548023668]
高精度で軽量な物体検出器YOLOv13を提案する。ハイパーグラフに基づく適応相関強化(HyperACE)機構を提案する。また,FullPAD(Full-Pipeline Aggregation-and-Distribution)パラダイムを提案する。
論文参考訳（メタデータ） (2025-06-21T15:15:03Z)
One-Step Diffusion Model for Image Motion-Deblurring [85.76149042561507]
本稿では,脱臭過程を1段階に短縮する新しいフレームワークである脱臭拡散モデル(OSDD)を提案する。拡散モデルにおける忠実度損失に対処するために,構造復元を改善する改良された変分オートエンコーダ(eVAE)を導入する。提案手法は,実測値と非参照値の両方で高い性能を達成する。
論文参考訳（メタデータ） (2025-03-09T09:39:57Z)
Flexiffusion: Segment-wise Neural Architecture Search for Flexible Denoising Schedule [50.260693393896716]
拡散モデル(diffusion model)は、多様な高品質な画像を生成するのに適した最先端の生成モデルである。近年,より高速な生成プロセスの自動探索技術が採用されている。拡散モデルの高速化を目的とした新しいトレーニングフリーNASパラダイムであるFlexiffusionを紹介する。
論文参考訳（メタデータ） (2024-09-26T06:28:05Z)
A Simple and Generalist Approach for Panoptic Segmentation [57.94892855772925]
汎用的なビジョンモデルは、様々なビジョンタスクのための1つの同じアーキテクチャを目指している。このような共有アーキテクチャは魅力的に思えるかもしれないが、ジェネラリストモデルは、その好奇心に満ちたモデルよりも優れている傾向にある。一般モデルの望ましい性質を損なうことなく、2つの重要なコントリビューションを導入することでこの問題に対処する。
論文参考訳（メタデータ） (2024-08-29T13:02:12Z)
FA-YOLO: Research On Efficient Feature Selection YOLO Improved Algorithm Based On FMDS and AGMF Modules [0.6047429555885261]
本稿では,FMDSモジュールと適応Gated Multi-branch Focus Fusion Module (AGMFモジュール)を提案する。 FMDSモジュールは、より効率的な動的特徴選択と融合法を、より微細なマルチスケール特徴写像に適用する。 AGMFモジュールは、複数の並列ブランチを使用して、ゲートユニットブランチ、FMDSモジュールブランチ、トリプルトブランチによってキャプチャされた様々な機能の補完的な融合を実行する。
論文参考訳（メタデータ） (2024-08-29T07:22:16Z)
CriDiff: Criss-cross Injection Diffusion Framework via Generative Pre-train for Prostate Segmentation [60.61972883059688]
CridiffはCrisscross Injection Strategy(CIS)とGenerative Pre-train(GP)アプローチによる2段階の機能注入フレームワークである。 CISでは,複数レベルのエッジ特徴と非エッジ特徴を効果的に学習するために,並列コンディショナーを2つ提案した。 GPアプローチは、追加パラメータを追加することなく、画像特徴と拡散モデルとの矛盾を緩和する。
論文参考訳（メタデータ） (2024-06-20T10:46:50Z)
Fostc3net:A Lightweight YOLOv5 Based On the Network Structure Optimization [11.969138981034247]
本稿では,モバイル機器向けにカスタマイズされた軽量YOLOv5技術を提案する。提案モデルでは,検出精度が1%向上し,FLOPが13%減少し,既存のYOLOv5に比べてモデルパラメータが26%減少した。
論文参考訳（メタデータ） (2024-03-20T16:07:04Z)
YOLO-TLA: An Efficient and Lightweight Small Object Detection Model based on YOLOv5 [19.388112026410045]
YOLO-TLAは、YOLOv5上に構築された高度な物体検出モデルである。まず、ネックネットワークピラミッドアーキテクチャにおいて、小さなオブジェクトに対する検出層を新たに導入する。このモジュールはスライディングウィンドウの特徴抽出を使い、計算要求とパラメータ数の両方を効果的に最小化する。
論文参考訳（メタデータ） (2024-02-22T05:55:17Z)
ASF-YOLO: A Novel YOLO Model with Attentional Scale Sequence Fusion for Cell Instance Segmentation [6.502259209532815]
ASF-YOLO(Attentional Scale Sequence Fusion based You Only Look Once)フレームワークを提案する。空間的およびスケール的な特徴を組み合わせて、正確で高速なセルインスタンスのセグメンテーションを行う。ボックスmAPは0.91、マスクmAPは0.887、推論速度は2018 Data Science Bowlのデータセットで47.3 FPSである。
論文参考訳（メタデータ） (2023-12-11T15:47:12Z)
HIC-YOLOv5: Improved YOLOv5 For Small Object Detection [2.4780916008623834]
改良されたYOLOv5モデル: 上記の問題に対処するためにHIC-YOLOv5を提案する。バックボーンとネックの間には、インボリューションブロックが採用され、特徴マップのチャネル情報を増加させる。我々の結果は、HIC-YOLOv5がmAP@[.5:.95]を6.42%改善し、mAP@0.5を9.38%改善したことを示している。
論文参考訳（メタデータ） (2023-09-28T12:40:36Z)
YOLO-MS: Rethinking Multi-Scale Representation Learning for Real-time Object Detection [80.11152626362109]
YOLO-MSと呼ばれる効率的かつ高性能な物体検出器を提供する。私たちは、他の大規模なデータセットに頼ることなく、MS COCOデータセット上でYOLO-MSをスクラッチからトレーニングします。私たちの仕事は、他のYOLOモデルのプラグイン・アンド・プレイ・モジュールとしても使えます。
論文参考訳（メタデータ） (2023-08-10T10:12:27Z)
A Generic Shared Attention Mechanism for Various Backbone Neural Networks [53.36677373145012]
自己注意モジュール(SAM)は、異なる層にまたがる強い相関した注意マップを生成する。 Dense-and-Implicit Attention (DIA)はSAMをレイヤ間で共有し、長期間のメモリモジュールを使用する。我々のシンプルで効果的なDIAは、様々なネットワークバックボーンを一貫して拡張できます。
論文参考訳（メタデータ） (2022-10-27T13:24:08Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。