論文の概要: Flyweight FLIM Networks for Salient Object Detection in Biomedical Images
- arxiv url: http://arxiv.org/abs/2504.11112v1
- Date: Tue, 15 Apr 2025 11:57:40 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-04-16 22:09:45.923692
- Title: Flyweight FLIM Networks for Salient Object Detection in Biomedical Images
- Title(参考訳): 生体画像における有意物体検出のためのフライ級FLIMネットワーク
- Authors: Leonardo M. Joao, Jancarlo F. Gomes, Silvio J. F. Guimaraes, Ewa Kijak, Alexandre X. Falcao,
- Abstract要約: 本研究では,FLIMネットワークのバックプロパゲーションを伴わない拡張分離型畳み込みカーネルと多層拡散層を学習する手法を提案する。
また,カーネル冗長性とエンコーダサイズを低減するため,新しいネットワーク単純化手法を提案する。
- 参考スコア(独自算出の注目度): 42.763966145188625
- License:
- Abstract: Salient Object Detection (SOD) with deep learning often requires substantial computational resources and large annotated datasets, making it impractical for resource-constrained applications. Lightweight models address computational demands but typically strive in complex and scarce labeled-data scenarios. Feature Learning from Image Markers (FLIM) learns an encoder's convolutional kernels among image patches extracted from discriminative regions marked on a few representative images, dismissing large annotated datasets, pretraining, and backpropagation. Such a methodology exploits information redundancy commonly found in biomedical image applications. This study presents methods to learn dilated-separable convolutional kernels and multi-dilation layers without backpropagation for FLIM networks. It also proposes a novel network simplification method to reduce kernel redundancy and encoder size. By combining a FLIM encoder with an adaptive decoder, a concept recently introduced to estimate a pointwise convolution per image, this study presents very efficient (named flyweight) SOD models for biomedical images. Experimental results in challenging datasets demonstrate superior efficiency and effectiveness to lightweight models. By requiring significantly fewer parameters and floating-point operations, the results show competitive effectiveness to heavyweight models. These advances highlight the potential of FLIM networks for data-limited and resource-constrained applications with information redundancy.
- Abstract(参考訳): 深層学習を伴う有能なオブジェクト検出(SOD)は、しばしばかなりの計算資源と大量の注釈付きデータセットを必要とするため、リソースに制約のあるアプリケーションでは実用的ではない。
軽量モデルは計算要求に対処するが、典型的には複雑なラベル付きデータシナリオで努力する。
FLIM(Feature Learning from Image Markers)は、いくつかの代表画像にマークされた識別領域から抽出された画像パッチの中からエンコーダの畳み込みカーネルを学習し、大きな注釈付きデータセット、事前トレーニング、バックプロパゲーションを除外する。
このような手法は、生体画像の応用でよく見られる情報冗長性を利用する。
本研究では,FLIMネットワークのバックプロパゲーションを伴わない拡張分離型畳み込みカーネルと多層拡散層を学習する手法を提案する。
また,カーネル冗長性とエンコーダサイズを低減するため,新しいネットワーク単純化手法を提案する。
近年,FLIMエンコーダと適応デコーダを組み合わせることで,画像毎のポイントワイド畳み込みを推定する手法が提案されている。
挑戦的なデータセットの実験結果は、軽量モデルに優れた効率と有効性を示す。
パラメータと浮動小数点演算を著しく少なくすることで、重み付けモデルに対する競合効果を示す。
これらの進歩は、情報冗長性を持つデータ制限およびリソース制限されたアプリケーションのためのFLIMネットワークの可能性を強調している。
関連論文リスト
- Large-Scale Data-Free Knowledge Distillation for ImageNet via Multi-Resolution Data Generation [53.95204595640208]
Data-Free Knowledge Distillation (DFKD)は、教師モデルから生徒モデルへの知識伝達を可能にする高度な技術である。
従来のアプローチでは、実際の画像の情報を活用することなく、高解像度で合成画像を生成してきた。
MUSEは、クラスアクティベーションマップ(CAM)を使用して、低い解像度で画像を生成し、生成された画像が重要なクラス固有の特徴を保持することを保証する。
論文 参考訳(メタデータ) (2024-11-26T02:23:31Z) - Memory-efficient High-resolution OCT Volume Synthesis with Cascaded Amortized Latent Diffusion Models [48.87160158792048]
本稿では,高分解能CTボリュームをメモリ効率よく合成できるCA-LDM(Cascaded amortized Latent diffusion model)を提案する。
公開高解像度OCTデータセットを用いた実験により、我々の合成データは、既存の手法の能力を超越した、現実的な高解像度かつグローバルな特徴を持つことが示された。
論文 参考訳(メタデータ) (2024-05-26T10:58:22Z) - MiniMaxAD: A Lightweight Autoencoder for Feature-Rich Anomaly Detection [1.7234530131333607]
MiniMaxADは、通常の画像から広範囲の情報を効率よく圧縮・記憶する軽量オートエンコーダである。
このモデルでは,特徴量の多様性を向上し,ネットワークの有効容量を増大させる手法を採用している。
提案手法では,機能豊富な異常検出の枠組みの下で任意のデータセットを統一することができる。
論文 参考訳(メタデータ) (2024-05-16T09:37:54Z) - PMFSNet: Polarized Multi-scale Feature Self-attention Network For
Lightweight Medical Image Segmentation [6.134314911212846]
現在の最先端の医用画像分割法は精度を優先するが、計算要求の増大とより大きなモデルサイズを犠牲にすることも多い。
計算冗長性を避けつつグローバルな局所特徴処理のバランスをとる新しい医用画像分割モデルPMFSNetを提案する。
長期依存関係をキャプチャするために,アテンション機構に基づいたマルチスケール機能拡張モジュールであるPMFSブロックをプラグインとして組み込んでいる。
論文 参考訳(メタデータ) (2024-01-15T10:26:47Z) - Visual Prompting Upgrades Neural Network Sparsification: A Data-Model Perspective [64.04617968947697]
より優れた重量空間を実現するために、新しいデータモデル共設計視点を導入する。
具体的には、提案したVPNフレームワークでニューラルネットワークのスパーシフィケーションをアップグレードするために、カスタマイズされたVisual Promptが実装されている。
論文 参考訳(メタデータ) (2023-12-03T13:50:24Z) - FFEINR: Flow Feature-Enhanced Implicit Neural Representation for
Spatio-temporal Super-Resolution [4.577685231084759]
本稿では,フローフィールドデータの超高分解能化のための特徴強調型ニューラルインシシット表現(FFEINR)を提案する。
モデル構造とサンプリング分解能の観点から、暗黙のニューラル表現を最大限に活用することができる。
FFEINRのトレーニングプロセスは、入力層に機能拡張を導入することで容易になる。
論文 参考訳(メタデータ) (2023-08-24T02:28:18Z) - Low-power multi-mode fiber projector overcomes shallow neural networks classifiers [10.161703420607552]
マルチモード光ファイバは費用対効果が高く、扱いやすいツールである。
我々はこれらのファイバーをランダムなハードウェアプロジェクタにキャストし、入力データセットを高次元のスペックル画像集合に変換する。
その結果,標準伝送行列モデルより分類精度が高いことがわかった。
論文 参考訳(メタデータ) (2022-10-10T14:55:02Z) - Image deblurring based on lightweight multi-information fusion network [6.848061582669787]
画像デブロアリングのための軽量多情報融合ネットワーク(LMFN)を提案する。
符号化段階では、画像特徴は、マルチスケール情報抽出および融合のための様々な小規模空間に還元される。
その後、デコード段階で蒸留ネットワークが使用され、ネットワークは残留学習から最も利益を得ます。
私たちのネットワークは、少ないパラメータで最新の画像破壊結果を達成し、モデルの複雑さで既存の方法を上回ることができます。
論文 参考訳(メタデータ) (2021-01-14T00:37:37Z) - Resolution Adaptive Networks for Efficient Inference [53.04907454606711]
本稿では,低分解能表現が「容易」な入力を分類するのに十分である,という直感に触発された新しいレゾリューション適応ネットワーク(RANet)を提案する。
RANetでは、入力画像はまず、低解像度表現を効率的に抽出する軽量サブネットワークにルーティングされる。
ネットワーク内の高解像度パスは、"ハード"サンプルを認識する能力を維持している。
論文 参考訳(メタデータ) (2020-03-16T16:54:36Z) - Belief Propagation Reloaded: Learning BP-Layers for Labeling Problems [83.98774574197613]
最も単純な推論手法の1つとして、切り詰められた最大積のBelief伝播を取り上げ、それをディープラーニングモデルの適切なコンポーネントにするために必要となるものを加えます。
このBP-Layerは畳み込みニューラルネットワーク(CNN)の最終ブロックまたは中間ブロックとして使用できる
このモデルは様々な密集予測問題に適用可能であり、パラメータ効率が高く、ステレオ、光フロー、セマンティックセグメンテーションにおける堅牢な解を提供する。
論文 参考訳(メタデータ) (2020-03-13T13:11:35Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。