論文の概要: FLIM-based Salient Object Detection Networks with Adaptive Decoders
- arxiv url: http://arxiv.org/abs/2504.20872v1
- Date: Tue, 29 Apr 2025 15:44:02 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-05-02 19:15:54.969172
- Title: FLIM-based Salient Object Detection Networks with Adaptive Decoders
- Title(参考訳): 適応デコーダを用いたFLIMに基づく有向物体検出ネットワーク
- Authors: Gilson Junior Soares, Matheus Abrantes Cerqueira, Jancarlo F. Gomes, Laurent Najman, Silvio Jamil F. Guimarães, Alexandre Xavier Falcão,
- Abstract要約: 本研究は、オブジェクト検出(SOD)のための軽量モデルよりも数百倍軽量なフライウェイトネットワークを提案する。
FLIMエンコーダと適応デコーダを組み合わせて、所定の関数で各入力画像の重みを推定する。
本稿では,2つのSODタスクに対してFLIMモデルと適応デコーダを比較し,その2つの軽量ネットワークと,バックプロパゲーションによってトレーニングされたデコーダを備えたFLIMネットワークと,ラベル付きマーカーがデコーダの重みを定義するFLIMネットワークを比較した。
- 参考スコア(独自算出の注目度): 40.26047220842738
- License: http://creativecommons.org/licenses/by-nc-sa/4.0/
- Abstract: Salient Object Detection (SOD) methods can locate objects that stand out in an image, assign higher values to their pixels in a saliency map, and binarize the map outputting a predicted segmentation mask. A recent tendency is to investigate pre-trained lightweight models rather than deep neural networks in SOD tasks, coping with applications under limited computational resources. In this context, we have investigated lightweight networks using a methodology named Feature Learning from Image Markers (FLIM), which assumes that the encoder's kernels can be estimated from marker pixels on discriminative regions of a few representative images. This work proposes flyweight networks, hundreds of times lighter than lightweight models, for SOD by combining a FLIM encoder with an adaptive decoder, whose weights are estimated for each input image by a given heuristic function. Such FLIM networks are trained from three to four representative images only and without backpropagation, making the models suitable for applications under labeled data constraints as well. We study five adaptive decoders; two of them are introduced here. Differently from the previous ones that rely on one neuron per pixel with shared weights, the heuristic functions of the new adaptive decoders estimate the weights of each neuron per pixel. We compare FLIM models with adaptive decoders for two challenging SOD tasks with three lightweight networks from the state-of-the-art, two FLIM networks with decoders trained by backpropagation, and one FLIM network whose labeled markers define the decoder's weights. The experiments demonstrate the advantages of the proposed networks over the baselines, revealing the importance of further investigating such methods in new applications.
- Abstract(参考訳): Salient Object Detection (SOD) 法では、画像で目立つオブジェクトを見つけ出し、より高い値をサリエンシマップに割り当て、予測されたセグメンテーションマスクを出力するマップをバイナライズすることができる。
最近の傾向は、SODタスクにおけるディープニューラルネットワークではなく、事前訓練された軽量モデルを調べ、限られた計算資源下でのアプリケーションに対処するものである。
本研究では,いくつかの代表画像の識別領域上のマーカー画素からエンコーダのカーネルを推定できると仮定した,FLIM(Feature Learning from Image Markers)という手法を用いて,軽量ネットワークを調査した。
本研究は、FLIMエンコーダと適応デコーダを組み合わせて、与えられたヒューリスティック関数により各入力画像の重みを推定することにより、軽量モデルよりも数百倍軽量なフライウェイトネットワークを提案する。
このようなFLIMネットワークは、バックプロパゲーションなしで3から4つの代表画像からトレーニングされ、ラベル付きデータ制約下でのアプリケーションに適したモデルも作成される。
適応デコーダを5つ研究し、そのうち2つを紹介した。
共有重みを持つ1ピクセルあたりのニューロンに依存する以前のものとは違って、新しい適応デコーダのヒューリスティック関数は1ピクセルあたりのニューロンの重みを推定する。
本稿では,2つのSODタスクに対してFLIMモデルと適応デコーダを比較し,その2つの軽量ネットワークと,バックプロパゲーションによってトレーニングされたデコーダを備えたFLIMネットワークと,ラベル付きマーカーがデコーダの重みを定義するFLIMネットワークを比較した。
実験では,提案するネットワークのベースラインに対する優位性を実証し,新たなアプリケーションにおけるこれらの手法のさらなる検討の重要性を明らかにした。
関連論文リスト
- Multi-level Cellular Automata for FLIM networks [40.83004529604423]
本稿では,深層学習のための新たなアプローチを提案する。
現代技術と古典技術を組み合わせて、競争力を維持する。
我々は,本手法が深部SOD文学において確立されたモデルと競合することを示す。
論文 参考訳(メタデータ) (2025-04-15T17:22:24Z) - Flyweight FLIM Networks for Salient Object Detection in Biomedical Images [42.763966145188625]
本研究では,FLIMネットワークのバックプロパゲーションを伴わない拡張分離型畳み込みカーネルと多層拡散層を学習する手法を提案する。
また,カーネル冗長性とエンコーダサイズを低減するため,新しいネットワーク単純化手法を提案する。
論文 参考訳(メタデータ) (2025-04-15T11:57:40Z) - A Lightweight U-like Network Utilizing Neural Memory Ordinary Differential Equations for Slimming the Decoder [13.123714410130912]
ニューラルメモリの正規微分方程式(nmODE)の異なる離散化手法を用いた3つのプラグアンドプレイデコーダを提案する。
これらのデコーダは、スキップ接続から情報を処理し、上向きの経路で数値演算を行うことにより、様々な抽象化レベルで機能を統合する。
要約すると、提案した離散化されたnmデコーダは、パラメータ数を約20%減らし、FLOPを最大74%減らし、U型ネットワークに適応する可能性を秘めている。
論文 参考訳(メタデータ) (2024-12-09T07:21:27Z) - Efficient Transformer Encoders for Mask2Former-style models [57.54752243522298]
ECO-M2Fは、入力画像上に条件付きエンコーダ内の隠蔽層数を自己選択する戦略である。
提案手法は、性能を維持しながら、予測エンコーダの計算コストを削減する。
アーキテクチャ構成では柔軟性があり、セグメンテーションタスクを超えてオブジェクト検出まで拡張できる。
論文 参考訳(メタデータ) (2024-04-23T17:26:34Z) - A Point-Based Approach to Efficient LiDAR Multi-Task Perception [49.91741677556553]
PAttFormerは、ポイントクラウドにおける共同セマンティックセグメンテーションとオブジェクト検出のための効率的なマルチタスクアーキテクチャである。
他のLiDARベースのマルチタスクアーキテクチャとは異なり、提案したPAttFormerはタスク固有のポイントクラウド表現のために別の機能エンコーダを必要としない。
マルチタスク学習では,mIouでは+1.7%,mAPでは3Dオブジェクト検出では+1.7%,LiDARセマンティックセマンティックセグメンテーションは+1.7%向上した。
論文 参考訳(メタデータ) (2024-04-19T11:24:34Z) - Building Flyweight FLIM-based CNNs with Adaptive Decoding for Object
Detection [40.97322222472642]
本研究では、ユーザ描画マーカーからオブジェクトを検出するために、畳み込みニューラルネットワーク(CNN)層を構築する方法を提案する。
糞便サンプルの顕微鏡画像におけるSchistosomiasis mansoni卵の検出と,衛星画像における船舶の検出に対処する。
我々のCNNは、SOTAオブジェクト検出器より数千倍も小さく、CPU実行に適している。
論文 参考訳(メタデータ) (2023-06-26T16:48:20Z) - Reducing Redundancy in the Bottleneck Representation of the Autoencoders [98.78384185493624]
オートエンコーダは教師なしニューラルネットワークの一種であり、様々なタスクを解くのに使用できる。
本稿では,ボトルネック表現における特徴冗長性を明示的に罰する手法を提案する。
我々は,3つの異なるデータセットを用いた次元削減,MNISTデータセットを用いた画像圧縮,ファッションMNISTを用いた画像デノナイズという,さまざまなタスクにまたがってアプローチを検証した。
論文 参考訳(メタデータ) (2022-02-09T18:48:02Z) - LwPosr: Lightweight Efficient Fine-Grained Head Pose Estimation [2.538209532048867]
本稿では,頭部ポーズ推定(HPE)タスクのための軽量ネットワークを提案する。
The proposed network textitLwPosr using mix of depthwise separable convolutional (DSC) and transformer encoder layer。
論文 参考訳(メタデータ) (2022-02-07T22:12:27Z) - Dynamic Neural Representational Decoders for High-Resolution Semantic
Segmentation [98.05643473345474]
動的ニューラル表現デコーダ(NRD)と呼ばれる新しいデコーダを提案する。
エンコーダの出力上の各位置がセマンティックラベルの局所的なパッチに対応するので、この研究では、これらの局所的なパッチをコンパクトなニューラルネットワークで表現する。
このニューラル表現により、意味ラベル空間に先行する滑らかさを活用することができ、デコーダをより効率的にすることができる。
論文 参考訳(メタデータ) (2021-07-30T04:50:56Z) - Suppress and Balance: A Simple Gated Network for Salient Object
Detection [89.88222217065858]
両問題を同時に解くための単純なゲートネットワーク(GateNet)を提案する。
多レベルゲートユニットの助けを借りて、エンコーダからの貴重なコンテキスト情報をデコーダに最適に送信することができる。
さらに,提案したFold-ASPP操作(Fold-ASPP)に基づくアトラス空間ピラミッドプーリングを用いて,様々なスケールのサリアンオブジェクトを正確に位置決めする。
論文 参考訳(メタデータ) (2020-07-16T02:00:53Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。