論文の概要: IDmUNet: A new image decomposition induced network for sparse feature
segmentation
- arxiv url: http://arxiv.org/abs/2203.02690v1
- Date: Sat, 5 Mar 2022 09:17:32 GMT
- ステータス: 処理完了
- システム内更新日: 2022-03-08 18:36:02.532982
- Title: IDmUNet: A new image decomposition induced network for sparse feature
segmentation
- Title(参考訳): IDmUNet:スパース特徴分割のための新しい画像分解誘導ネットワーク
- Authors: Yumeng Ren (1), Yiming Gao (2), Chunlin Wu (1), Xue-cheng Tai (3) ((1)
School of Mathematical Sciences, Nankai University, Tianjin, China (2)
College of Science, Nanjing University of Aeronautics and Astronautics,
Nanjing, China (3) Department of Mathematics, Hong Kong Baptist University,
China )
- Abstract要約: UNetとその変種は、医用画像セグメンテーションの最も一般的な方法の一つである。
我々はタスク指向のネットワーク設計を行い、対象のオブジェクトを疎に分散させ、背景を数学的にモデル化することは困難である。
このIDmUNetは、構造設計における事前および深部展開の手法のため、数学的モデリングとデータ駆動アプローチの利点を組み合わせたものである。
- 参考スコア(独自算出の注目度): 5.038878606043249
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: UNet and its variants are among the most popular methods for medical image
segmentation. Despite their successes in task generality, most of them consider
little mathematical modeling behind specific applications. In this paper, we
focus on the sparse feature segmentation task and make a task-oriented network
design, in which the target objects are sparsely distributed and the background
is hard to be mathematically modeled. We start from an image decomposition
model with sparsity regularization, and propose a deep unfolding network,
namely IDNet, based on an iterative solver, scaled alternating direction method
of multipliers (scaled-ADMM). The IDNet splits raw inputs into double feature
layers. Then a new task-oriented segmentation network is constructed, dubbed as
IDmUNet, based on the proposed IDNets and a mini-UNet. Because of the sparsity
prior and deep unfolding method in the structure design, this IDmUNet combines
the advantages of mathematical modeling and data-driven approaches. Firstly,
our approach has mathematical interpretability and can achieve favorable
performance with far fewer learnable parameters. Secondly, our IDmUNet is
robust in a simple end-to-end training with explainable behaviors. In the
experiments of retinal vessel segmentation (RVS), IDmUNet produces the
state-of-the-art results with only 0.07m parameters, whereas SA-UNet, one of
the latest variants of UNet, contains 0.54m and the original UNet 31.04m.
Moreover, the training procedure of our network converges faster without
overfitting phenomenon. This decomposition-based network construction strategy
can be generalized to other problems with mathematically clear targets and
complicated unclear backgrounds.
- Abstract(参考訳): unetとその変種は、医用画像セグメンテーションの最も一般的な方法である。
タスク一般性の成功にもかかわらず、そのほとんどは特定のアプリケーションの背後にある数学的モデリングをほとんど考慮していない。
本稿では,スパース特徴分節タスクに着目し,対象対象物を疎分散し,背景を数学的にモデル化し難いタスク指向ネットワーク設計を行う。
本稿では,空間正規化を伴う画像分解モデルから始め,反復解法に基づく深層展開ネットワークであるIDNet,乗算器のスケール化方向法(スケール化ADMM)を提案する。
IDNetは生の入力を二重の機能層に分割する。
次に、提案したIDNetとミニUNetに基づいて、IDmUNetと呼ばれるタスク指向セグメンテーションネットワークを構築する。
このIDmUNetは、構造設計における事前および深部展開の手法のため、数学的モデリングとデータ駆動アプローチの利点を組み合わせたものである。
第一に,本手法は数学的解釈可能性が高く,学習可能なパラメータをはるかに少なくして良好な性能が得られる。
第二に、IDmUNetは説明可能な振る舞いを持つ単純なエンドツーエンドのトレーニングで堅牢です。
網膜血管セグメンテーション(RVS)の実験では、IDmUNetは0.07mのパラメータしか持たず、SA-UNetは0.54mと元のUNet 31.04mを含む。
さらに,ネットワークのトレーニング手順はオーバーフィッティング現象を伴わずに高速に収束する。
この分解に基づくネットワーク構築戦略は、数学的に明確な目標と複雑な背景を持つ他の問題に一般化することができる。
関連論文リスト
- SPPNet: A Single-Point Prompt Network for Nuclei Image Segmentation [6.149725843029721]
核画像分割のためのシングルポイントプロンプトネットワークを提案する。
オリジナル画像エンコーダを軽量な視覚変換器に置き換える。
提案モデルはMoNuSeg-2018データセットで評価される。
論文 参考訳(メタデータ) (2023-08-23T16:13:58Z) - Simplifying and Understanding State Space Models with Diagonal Linear
RNNs [56.33053691749856]
本研究は、離散化ステップを解消し、バニラ対角線形RNNに基づくモデルを提案する。
概念的にはるかに単純であるにもかかわらず、$mathrmDLR$は以前提案したSSMと同じくらいのパフォーマンスを示す。
また、合成シーケンス・ツー・シーケンス・タスクのスイートによって、SSMとアテンションベースモデルの表現性も特徴付ける。
論文 参考訳(メタデータ) (2022-12-01T18:53:06Z) - Pushing the Efficiency Limit Using Structured Sparse Convolutions [82.31130122200578]
本稿では,画像の固有構造を利用して畳み込みフィルタのパラメータを削減する構造的スパース畳み込み(SSC)を提案する。
我々は、SSCが効率的なアーキテクチャにおける一般的なレイヤ(奥行き、グループ回り、ポイント回りの畳み込み)の一般化であることを示す。
SSCに基づくアーキテクチャは、CIFAR-10、CIFAR-100、Tiny-ImageNet、ImageNet分類ベンチマークのベースラインと比較して、最先端のパフォーマンスを実現している。
論文 参考訳(メタデータ) (2022-10-23T18:37:22Z) - R2U++: A Multiscale Recurrent Residual U-Net with Dense Skip Connections
for Medical Image Segmentation [0.5735035463793008]
本稿では,新しいU-Netベースの医用画像セグメンテーションアーキテクチャR2U++を提案する。
提案したアーキテクチャでは, 単純な畳み込みバックボーンを, より深い再帰的な畳み込みブロックに置き換える。
エンコーダとデコーダのセマンティックギャップは、濃密なスキップ経路によって減少する。
論文 参考訳(メタデータ) (2022-06-03T19:42:44Z) - Deep ensembles in bioimage segmentation [74.01883650587321]
本研究では,畳み込みニューラルネットワーク(CNN)のアンサンブルを提案する。
アンサンブル法では、多くの異なるモデルが訓練され、分類に使用され、アンサンブルは単一分類器の出力を集約する。
提案するアンサンブルは,DeepLabV3+とHarDNet環境を用いて,異なるバックボーンネットワークを組み合わせることで実現されている。
論文 参考訳(メタデータ) (2021-12-24T05:54:21Z) - Dep-$L_0$: Improving $L_0$-based Network Sparsification via Dependency
Modeling [6.081082481356211]
L_0$正規化によるディープニューラルネットワークのトレーニングは、ネットワークプルーニングやスパシフィケーションの顕著なアプローチのひとつだ。
本稿では,ImageNet上のResNet50のような大規模学習タスクに対して一貫性のない処理を行うことを示す。
本稿では,多層パーセプトロンとして効果的にモデル化できるバイナリゲートの依存性モデリングを提案する。
論文 参考訳(メタデータ) (2021-06-30T19:33:35Z) - Deep ensembles based on Stochastic Activation Selection for Polyp
Segmentation [82.61182037130406]
本研究は,大腸内視鏡検査における画像分割,特に正確なポリープ検出とセグメンテーションを扱う。
イメージセグメンテーションの基本アーキテクチャはエンコーダとデコーダで構成されている。
我々はデコーダのバックボーンを変更することで得られるDeepLabアーキテクチャのバリエーションを比較した。
論文 参考訳(メタデータ) (2021-04-02T02:07:37Z) - Improving Robustness and Generality of NLP Models Using Disentangled
Representations [62.08794500431367]
スーパービジョンニューラルネットワークはまず入力$x$を単一の表現$z$にマップし、次に出力ラベル$y$にマッピングする。
本研究では,非交叉表現学習の観点から,NLPモデルの堅牢性と汎用性を改善する手法を提案する。
提案した基準でトレーニングしたモデルは、広範囲の教師付き学習タスクにおいて、より堅牢性とドメイン適応性を向上することを示す。
論文 参考訳(メタデータ) (2020-09-21T02:48:46Z) - Structured Convolutions for Efficient Neural Network Design [65.36569572213027]
畳み込みニューラルネットワーク構築ブロックのテクスト単純構造における冗長性を利用してモデル効率に取り組む。
この分解が2Dカーネルや3Dカーネルだけでなく、完全に接続されたレイヤにも適用可能であることを示す。
論文 参考訳(メタデータ) (2020-08-06T04:38:38Z) - U$^2$-Net: Going Deeper with Nested U-Structure for Salient Object
Detection [6.071985784990975]
我々は、単純だが強力な深層ネットワークアーキテクチャU$2$-Netを設計し、SOD(Healient Object Detection)を設計する。
U$2$-Netのアーキテクチャは、2レベルネストされたU構造です。
提案したアーキテクチャの2つのモデル、U$2$-Net (176.3 MB, 30 FPS on GTX 1080Ti GPU)とU$2$-Net$dagger$ (4.7 MB, 40 FPS)をインスタンス化する。
論文 参考訳(メタデータ) (2020-05-18T18:08:26Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。