論文の概要: Deep ensembles in bioimage segmentation
- arxiv url: http://arxiv.org/abs/2112.12955v1
- Date: Fri, 24 Dec 2021 05:54:21 GMT
- ステータス: 処理完了
- システム内更新日: 2021-12-29 16:46:44.773976
- Title: Deep ensembles in bioimage segmentation
- Title(参考訳): 生体像分割における深層アンサンブル
- Authors: Loris Nanni, Daniela Cuza, Alessandra Lumini, Andrea Loreggia and
Sheryl Brahnam
- Abstract要約: 本研究では,畳み込みニューラルネットワーク(CNN)のアンサンブルを提案する。
アンサンブル法では、多くの異なるモデルが訓練され、分類に使用され、アンサンブルは単一分類器の出力を集約する。
提案するアンサンブルは,DeepLabV3+とHarDNet環境を用いて,異なるバックボーンネットワークを組み合わせることで実現されている。
- 参考スコア(独自算出の注目度): 74.01883650587321
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Semantic segmentation consists in classifying each pixel of an image by
assigning it to a specific label chosen from a set of all the available ones.
During the last few years, a lot of attention shifted to this kind of task.
Many computer vision researchers tried to apply autoencoder structures to
develop models that can learn the semantics of the image as well as a low-level
representation of it. In an autoencoder architecture, given an input, an
encoder computes a low dimensional representation of the input that is then
used by a decoder to reconstruct the original data. In this work, we propose an
ensemble of convolutional neural networks (CNNs). In ensemble methods, many
different models are trained and then used for classification, the ensemble
aggregates the outputs of the single classifiers. The approach leverages on
differences of various classifiers to improve the performance of the whole
system. Diversity among the single classifiers is enforced by using different
loss functions. In particular, we present a new loss function that results from
the combination of Dice and Structural Similarity Index. The proposed ensemble
is implemented by combining different backbone networks using the DeepLabV3+
and HarDNet environment. The proposal is evaluated through an extensive
empirical evaluation on two real-world scenarios: polyp and skin segmentation.
All the code is available online at https://github.com/LorisNanni.
- Abstract(参考訳): セマンティックセグメンテーションは、画像の各ピクセルを、利用可能なすべてのピクセルの集合から選択された特定のラベルに割り当てることで分類する。
ここ数年、このようなタスクに多くの注意が向けられた。
多くのコンピュータビジョン研究者は、画像のセマンティクスと低レベルの表現を学習できるモデルを開発するためにオートエンコーダ構造を適用しようとした。
オートエンコーダアーキテクチャでは、入力が与えられた場合、エンコーダは、デコーダが元のデータを再構成するために使用する入力の低次元表現を計算する。
本研究では,畳み込みニューラルネットワーク(CNN)のアンサンブルを提案する。
アンサンブル法では、多くの異なるモデルが訓練され、分類に使用され、アンサンブルは単一分類器の出力を集約する。
このアプローチは、システム全体のパフォーマンスを改善するために、さまざまな分類器の違いを活用する。
単一分類器間の多様性は、異なる損失関数を用いて強制される。
特に,ダイスと構造類似性指数の組み合わせによる新たな損失関数を提案する。
提案するアンサンブルは,DeepLabV3+とHarDNet環境を用いて,異なるバックボーンネットワークを組み合わせることで実現されている。
この提案はポリープとスキンセグメンテーションの2つの実世界のシナリオに関する広範な経験的評価を通じて評価される。
すべてのコードはhttps://github.com/LorisNanni.comで公開されている。
関連論文リスト
- Can neural networks count digit frequency? [16.04455549316468]
本研究では,従来の機械学習モデルとニューラルネットワークの性能を比較し,各桁の出現頻度を推定する。
ニューラルネットワークは6桁と10桁の両方のレグレッションと分類の指標で、従来の機械学習モデルよりも大幅に優れています。
論文 参考訳(メタデータ) (2023-09-25T03:45:36Z) - Fine-grained Recognition with Learnable Semantic Data Augmentation [68.48892326854494]
きめ細かい画像認識は、長年続くコンピュータビジョンの課題である。
本稿では,識別領域損失問題を軽減するため,特徴レベルのトレーニングデータを多様化することを提案する。
本手法は,いくつかの人気分類ネットワーク上での一般化性能を著しく向上させる。
論文 参考訳(メタデータ) (2023-09-01T11:15:50Z) - Distilling Ensemble of Explanations for Weakly-Supervised Pre-Training
of Image Segmentation Models [54.49581189337848]
本稿では,分類データセットに基づく画像分割モデルのエンドツーエンド事前学習を可能にする手法を提案する。
提案手法は重み付きセグメンテーション学習法を利用して,重み付きセグメンテーションネットワークを事前訓練する。
実験の結果,ImageNetにソースデータセットとしてPSSLを伴って提案されたエンドツーエンドの事前トレーニング戦略が,さまざまなセグメンテーションモデルの性能向上に成功していることがわかった。
論文 参考訳(メタデータ) (2022-07-04T13:02:32Z) - Rethinking Semantic Segmentation: A Prototype View [126.59244185849838]
学習不可能なプロトタイプをベースとした非パラメトリックセマンティックセマンティックセマンティクスモデルを提案する。
我々のフレームワークは、いくつかのデータセットに対して魅力的な結果をもたらす。
この作業が、現在のデファクトセマンティックセグメンテーションモデル設計を再考することを期待しています。
論文 参考訳(メタデータ) (2022-03-28T21:15:32Z) - Deep Features for training Support Vector Machine [16.795405355504077]
本稿では,訓練済みcnnから抽出した特徴に基づく汎用コンピュータビジョンシステムを開発した。
複数の学習特徴を単一の構造に組み合わせ、異なる画像分類タスクに取り組んでいます。
論文 参考訳(メタデータ) (2021-04-08T03:13:09Z) - Deep ensembles based on Stochastic Activation Selection for Polyp
Segmentation [82.61182037130406]
本研究は,大腸内視鏡検査における画像分割,特に正確なポリープ検出とセグメンテーションを扱う。
イメージセグメンテーションの基本アーキテクチャはエンコーダとデコーダで構成されている。
我々はデコーダのバックボーンを変更することで得られるDeepLabアーキテクチャのバリエーションを比較した。
論文 参考訳(メタデータ) (2021-04-02T02:07:37Z) - Solving Mixed Integer Programs Using Neural Networks [57.683491412480635]
本稿では,mipソルバの2つのキーサブタスクに学習を適用し,高品質なジョイント変数割当を生成し,その割当と最適課題との客観的値の差を限定する。
提案手法は,ニューラルネットワークに基づく2つのコンポーネントであるニューラルダイバーディングとニューラルブランチを構築し,SCIPなどのベースMIPソルバで使用する。
2つのGoogle生産データセットとMIPLIBを含む6つの現実世界データセットに対するアプローチを評価し、それぞれに別々のニューラルネットワークをトレーニングする。
論文 参考訳(メタデータ) (2020-12-23T09:33:11Z) - Digit Image Recognition Using an Ensemble of One-Versus-All Deep Network
Classifiers [2.385916960125935]
本稿では,デジタル画像認識とテストのための新しい手法を実装し,その上で評価する。
アンサンブル内の全てのネットワークは、SGDMA(Gradient Descent with Momentum)を用いたOVAトレーニング技術によって訓練されている。
提案手法は,全データセットの数値画像認識におけるベースラインよりも優れている。
論文 参考訳(メタデータ) (2020-06-28T15:37:39Z) - On the Texture Bias for Few-Shot CNN Segmentation [21.349705243254423]
畳み込みニューラルネットワーク(CNN)は、視覚認識タスクを実行するために形状によって駆動される。
最近の証拠は、CNNのテクスチャバイアスが、大きなラベル付きトレーニングデータセットで学習するときに、より高いパフォーマンスのモデルを提供することを示している。
本稿では,特徴空間内の高周波局所成分を減衰させるために,ガウス差分(DoG)の集合を統合する新しいアーキテクチャを提案する。
論文 参考訳(メタデータ) (2020-03-09T11:55:47Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。