論文の概要: Lightweight Multi-Scale Feature Extraction with Fully Connected LMF Layer for Salient Object Detection
- arxiv url: http://arxiv.org/abs/2508.07170v1
- Date: Sun, 10 Aug 2025 04:06:48 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-08-12 21:23:28.735219
- Title: Lightweight Multi-Scale Feature Extraction with Fully Connected LMF Layer for Salient Object Detection
- Title(参考訳): 完全連結LMF層を用いた高次物体検出のための軽量マルチスケール特徴抽出
- Authors: Yunpeng Shi, Lei Chen, Xiaolu Shen, Yanju Guo,
- Abstract要約: 本稿では,LMF層と呼ばれる,軽量なマルチスケール特徴抽出層を提案する。
複数のLMF層を統合することで,有能な物体検出に適した軽量ネットワークLMFNetを開発した。
LMFNetは、0.81Mパラメータしか持たない5つのベンチマークデータセットに対して、最先端または同等の結果が得られることを示す。
- 参考スコア(独自算出の注目度): 8.924457924091408
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: In the domain of computer vision, multi-scale feature extraction is vital for tasks such as salient object detection. However, achieving this capability in lightweight networks remains challenging due to the trade-off between efficiency and performance. This paper proposes a novel lightweight multi-scale feature extraction layer, termed the LMF layer, which employs depthwise separable dilated convolutions in a fully connected structure. By integrating multiple LMF layers, we develop LMFNet, a lightweight network tailored for salient object detection. Our approach significantly reduces the number of parameters while maintaining competitive performance. Here, we show that LMFNet achieves state-of-the-art or comparable results on five benchmark datasets with only 0.81M parameters, outperforming several traditional and lightweight models in terms of both efficiency and accuracy. Our work not only addresses the challenge of multi-scale learning in lightweight networks but also demonstrates the potential for broader applications in image processing tasks. The related code files are available at https://github.com/Shi-Yun-peng/LMFNet
- Abstract(参考訳): コンピュータビジョンの分野では、有能な物体検出などのタスクにおいて、マルチスケールの特徴抽出が不可欠である。
しかし、効率と性能のトレードオフのため、軽量ネットワークでこの機能を実現することは依然として困難である。
本稿では,完全連結構造に深度的に分離可能な拡張畳み込みを用いた,LMF層と呼ばれる軽量なマルチスケール特徴抽出層を提案する。
複数のLMF層を統合することで,有能な物体検出に適した軽量ネットワークLMFNetを開発した。
提案手法は,競合性能を維持しながらパラメータ数を著しく削減する。
ここでは,LMFNetが0.81Mパラメータのみを持つ5つのベンチマークデータセットに対して,最先端ないし同等の結果を達成し,効率と精度の両面で従来の軽量モデルよりも優れていることを示す。
我々の研究は、軽量ネットワークにおけるマルチスケール学習の課題に対処するだけでなく、画像処理タスクにおける幅広い応用の可能性も示している。
関連コードファイルはhttps://github.com/Shi-Yun-peng/LMFNetで入手できる。
関連論文リスト
- LGM-Pose: A Lightweight Global Modeling Network for Real-time Human Pose Estimation [9.000760165185532]
これらの課題に対処するために,シングルブランチ軽量グローバルモデリングネットワーク (LGM-Pose) が提案されている。
このネットワークでは、軽量なMobileViMブロックが、LARM(Lightweight Attentional Representation Module)として提案されている。
論文 参考訳(メタデータ) (2025-06-05T02:29:04Z) - LSNet: See Large, Focus Small [67.05569159984691]
我々は,大カーネル認識と小カーネル集約を組み合わせたLS(textbfLarge-textbfSmall)畳み込みを導入する。
LSNetは、様々な視覚タスクにおいて、既存の軽量ネットワークよりも優れた性能と効率を実現する。
論文 参考訳(メタデータ) (2025-03-29T16:00:54Z) - LWGANet: A Lightweight Group Attention Backbone for Remote Sensing Visual Tasks [20.924609707499915]
この記事では、RS視覚タスクに適した専用の軽量バックボーンネットワークであるLWGANetを紹介する。
RS画像用に調整されたLWGAモジュールは、冗長な特徴を利用して幅広い空間情報を抽出する。
その結果、LWGANetの広範な適用性と、高性能と低複雑性の最適なバランスを維持する能力が確認された。
論文 参考訳(メタデータ) (2025-01-17T08:56:17Z) - Lumen: Unleashing Versatile Vision-Centric Capabilities of Large Multimodal Models [87.47400128150032]
本稿では,多目的視覚中心機能拡張を備えた大規模マルチモーダルモデルであるLumenという新しいLMMアーキテクチャを提案する。
ルーメンはまず、きめ細かい視覚言語の概念のアライメントを促進する。
そして、共有表現を軽量なタスクデコーダに柔軟にルーティングすることで、タスク固有のデコーダを実行する。
論文 参考訳(メタデータ) (2024-03-12T04:13:45Z) - Lightweight Salient Object Detection in Optical Remote-Sensing Images
via Semantic Matching and Edge Alignment [61.45639694373033]
セマンティックマッチングとエッジアライメントに基づく光リモートセンシング画像(ORSI-SOD)のための新しい軽量ネットワークSeaNetを提案する。
具体的には、機能抽出のための軽量MobileNet-V2、高レベルの機能のための動的セマンティックマッチングモジュール(DSMM)、推論のためのポータブルデコーダが含まれる。
論文 参考訳(メタデータ) (2023-01-07T04:33:51Z) - MSCFNet: A Lightweight Network With Multi-Scale Context Fusion for
Real-Time Semantic Segmentation [27.232578592161673]
マルチスケールコンテキスト融合スキーム(MSCFNet)を用いた新しい軽量ネットワークを考案する。
提案されたMSCFNetは1.15Mパラメータのみを含み、71.9%のMean IoUを実現し、1つのTitan XP GPU構成で50 FPS以上で実行できる。
論文 参考訳(メタデータ) (2021-03-24T08:28:26Z) - Lightweight Image Super-Resolution with Multi-scale Feature Interaction
Network [15.846394239848959]
軽量マルチスケール機能インタラクションネットワーク(MSFIN)を提案する。
軽量SISRでは、MSFINは受容野を拡張し、低解像度の観測画像の情報的特徴を適切に活用する。
提案したMSFINは,より軽量なモデルで最先端技術に匹敵する性能を達成できる。
論文 参考訳(メタデータ) (2021-03-24T07:25:21Z) - Feature Flow: In-network Feature Flow Estimation for Video Object
Detection [56.80974623192569]
光の流れはコンピュータビジョンのタスクで広く使われ、ピクセルレベルのモーション情報を提供する。
一般的なアプローチは、ニューラルネットワークへの前向き光学フローと、タスクデータセット上のこのネットワークの微調整である。
ビデオオブジェクト検出のための textbfIn-network textbfFeature textbfFlow 推定モジュールを用いた新しいネットワーク (IFF-Net) を提案する。
論文 参考訳(メタデータ) (2020-09-21T07:55:50Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。