論文の概要: Neural Field Conditioning Strategies for 2D Semantic Segmentation
- arxiv url: http://arxiv.org/abs/2304.14371v1
- Date: Wed, 12 Apr 2023 15:04:37 GMT
- ステータス: 処理完了
- システム内更新日: 2023-04-30 07:11:46.583291
- Title: Neural Field Conditioning Strategies for 2D Semantic Segmentation
- Title(参考訳): 2次元セマンティクスセグメンテーションのためのニューラルフィールドコンディショニング戦略
- Authors: Martin Gromniak, Sven Magg and Stefan Wermter
- Abstract要約: ニューラルネットワークを2次元セマンティックセグメンテーションのデコーダとして利用する方法について検討する。
本稿では,3つの条件付け手法,潜時符号の単純な連結,FiLM(Feature Wise Linear Modulation)とCross-Attentionを比較した。
そこで本研究では,CNNを用いたセマンティックセグメンテーションのためのデコーダと競合し,クロスアテンションによるコンディショニングが最適であることを示す。
- 参考スコア(独自算出の注目度): 18.548916883208662
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Neural fields are neural networks which map coordinates to a desired signal.
When a neural field should jointly model multiple signals, and not memorize
only one, it needs to be conditioned on a latent code which describes the
signal at hand. Despite being an important aspect, there has been little
research on conditioning strategies for neural fields. In this work, we explore
the use of neural fields as decoders for 2D semantic segmentation. For this
task, we compare three conditioning methods, simple concatenation of the latent
code, Feature Wise Linear Modulation (FiLM), and Cross-Attention, in
conjunction with latent codes which either describe the full image or only a
local region of the image. Our results show a considerable difference in
performance between the examined conditioning strategies. Furthermore, we show
that conditioning via Cross-Attention achieves the best results and is
competitive with a CNN-based decoder for semantic segmentation.
- Abstract(参考訳): ニューラルネットワークは、座標を所望の信号にマッピングするニューラルネットワークである。
ニューラルネットワークが複数の信号を共同でモデル化し、1つだけを記憶するのではなく、手元にある信号を記述する潜時符号で条件付けする必要がある。
重要な側面にもかかわらず、ニューラルネットワークのコンディショニング戦略についてはほとんど研究されていない。
本研究では,2次元意味セグメンテーションのためのデコーダとしてのニューラルフィールドの利用について検討する。
そこで本研究では,画像の全画像または局所領域のみを記述する潜在符号と並行して,潜伏符号の単純な連結法,ワイズ線形変調法(フィルム),クロス・アテンション法という3つの条件法を比較した。
その結果, コンディショニング戦略とコンディショニング戦略では, 性能に有意差が見られた。
さらに,CNNに基づくセマンティックセグメンテーションのためのデコーダと競合し,クロスアテンションによるコンディショニングが最適であることを示す。
関連論文リスト
- Self-Supervised Correction Learning for Semi-Supervised Biomedical Image
Segmentation [84.58210297703714]
半教師付きバイオメディカルイメージセグメンテーションのための自己教師付き補正学習パラダイムを提案する。
共有エンコーダと2つの独立デコーダを含むデュアルタスクネットワークを設計する。
異なるタスクのための3つの医用画像分割データセットの実験により,本手法の優れた性能が示された。
論文 参考訳(メタデータ) (2023-01-12T08:19:46Z) - Variable Bitrate Neural Fields [75.24672452527795]
本稿では,特徴格子を圧縮し,メモリ消費を最大100倍に削減する辞書手法を提案する。
辞書の最適化をベクトル量子化オートデコーダ問題として定式化し、直接監督できない空間において、エンドツーエンドの離散神経表現を学習する。
論文 参考訳(メタデータ) (2022-06-15T17:58:34Z) - Two-Stream Graph Convolutional Network for Intra-oral Scanner Image
Segmentation [133.02190910009384]
本稿では,2ストリームグラフ畳み込みネットワーク(TSGCN)を提案する。
TSGCNは3次元歯(表面)セグメンテーションにおいて最先端の方法よりも優れています。
論文 参考訳(メタデータ) (2022-04-19T10:41:09Z) - Coordinate Translator for Learning Deformable Medical Image Registration [15.057534618761268]
我々は,CNNエンコーダから抽出した階層的特徴を持つ複数のCoTrを用いた新しい変形可能な登録ネットワークim2gridを提案する。
我々は、im2gridを最先端のDL法と非DL法と比較し、教師なし3次元磁気共鳴画像の登録を行う。
実験の結果,Im2gridは定性的・定量的にこれらの手法より優れていた。
論文 参考訳(メタデータ) (2022-03-05T21:23:03Z) - Dynamic Neural Representational Decoders for High-Resolution Semantic
Segmentation [98.05643473345474]
動的ニューラル表現デコーダ(NRD)と呼ばれる新しいデコーダを提案する。
エンコーダの出力上の各位置がセマンティックラベルの局所的なパッチに対応するので、この研究では、これらの局所的なパッチをコンパクトなニューラルネットワークで表現する。
このニューラル表現により、意味ラベル空間に先行する滑らかさを活用することができ、デコーダをより効率的にすることができる。
論文 参考訳(メタデータ) (2021-07-30T04:50:56Z) - Crosslink-Net: Double-branch Encoder Segmentation Network via Fusing
Vertical and Horizontal Convolutions [58.71117402626524]
医用画像分割のための新しいダブルブランチエンコーダアーキテクチャを提案する。
1)正方形畳み込みカーネルによる特徴の識別をさらに改善する必要があるため,非正方形および水平畳み込みカーネルの利用を提案する。
実験では,4つのデータセット上でのモデルの有効性を検証した。
論文 参考訳(メタデータ) (2021-07-24T02:58:32Z) - Boundary-aware Context Neural Network for Medical Image Segmentation [15.585851505721433]
医用画像のセグメンテーションは、さらなる臨床分析と疾患診断のための信頼性の高い基盤を提供することができる。
既存のCNNベースのほとんどの手法は、正確なオブジェクト境界のない不満足なセグメンテーションマスクを生成する。
本稿では,2次元医用画像分割のための境界認識コンテキストニューラルネットワーク(BA-Net)を定式化する。
論文 参考訳(メタデータ) (2020-05-03T02:35:49Z) - 3D medical image segmentation with labeled and unlabeled data using
autoencoders at the example of liver segmentation in CT images [58.720142291102135]
本研究では、畳み込みニューラルネットワークによるセグメンテーションを改善するために、オートエンコーダ抽出機能の可能性を検討する。
コンボリューション・オートエンコーダを用いてラベルのないデータから特徴を抽出し,CT画像における3次元肝セグメンテーションの目標タスクを実行するために,マルチスケールの完全畳み込みCNNを用いた。
論文 参考訳(メタデータ) (2020-03-17T20:20:43Z) - Dual Convolutional LSTM Network for Referring Image Segmentation [18.181286443737417]
イメージセグメンテーションは、コンピュータビジョンと自然言語理解の共通点における問題である。
本稿では,この問題を解決するために,二重畳み込みLSTM(ConvLSTM)ネットワークを提案する。
論文 参考訳(メタデータ) (2020-01-30T20:40:18Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。