論文の概要: On the effectiveness of Rotation-Equivariance in U-Net: A Benchmark for Image Segmentation
- arxiv url: http://arxiv.org/abs/2412.09182v1
- Date: Thu, 12 Dec 2024 11:25:32 GMT
- ステータス: 翻訳完了
- システム内更新日: 2024-12-13 13:32:32.598408
- Title: On the effectiveness of Rotation-Equivariance in U-Net: A Benchmark for Image Segmentation
- Title(参考訳): U-Netにおける回転等価性の有効性について:画像セグメンテーションのためのベンチマーク
- Authors: Robin Ghyselinck, Valentin Delchevalerie, Bruno Dumas, Benoît Frénay,
- Abstract要約: 本稿では,広い範囲のタスクに対して,画像分割のための回転同変U-Netをより徹底的に評価することを目的とする。
我々は、標準的なU-Netアーキテクチャと比較し、性能と持続可能性の改善を評価した。
この研究の主な貢献は、セグメンテーションタスクにおける回転同値の統合のトレードオフと利点に関する洞察を提供することである。
- 参考スコア(独自算出の注目度): 4.184845027588594
- License:
- Abstract: Numerous studies have recently focused on incorporating different variations of equivariance in Convolutional Neural Networks (CNNs). In particular, rotation-equivariance has gathered significant attention due to its relevance in many applications related to medical imaging, microscopic imaging, satellite imaging, industrial tasks, etc. While prior research has primarily focused on enhancing classification tasks with rotation equivariant CNNs, their impact on more complex architectures, such as U-Net for image segmentation, remains scarcely explored. Indeed, previous work interested in integrating rotation-equivariance into U-Net architecture have focused on solving specific applications with a limited scope. In contrast, this paper aims to provide a more exhaustive evaluation of rotation equivariant U-Net for image segmentation across a broader range of tasks. We benchmark their effectiveness against standard U-Net architectures, assessing improvements in terms of performance and sustainability (i.e., computational cost). Our evaluation focuses on datasets whose orientation of objects of interest is arbitrary in the image (e.g., Kvasir-SEG), but also on more standard segmentation datasets (such as COCO-Stuff) as to explore the wider applicability of rotation equivariance beyond tasks undoubtedly concerned by rotation equivariance. The main contribution of this work is to provide insights into the trade-offs and advantages of integrating rotation equivariance for segmentation tasks.
- Abstract(参考訳): 近年,畳み込みニューラルネットワーク(CNN)において,同値変動の多様性を取り入れることに多くの研究が注がれている。
特に, 医用画像, 顕微鏡画像, 衛星画像, 産業用タスクなどに関する多くの応用において, 回転等価性は, 関連性から注目されている。
これまでの研究は主に回転同変CNNによる分類タスクの強化に重点を置いてきたが、イメージセグメンテーションのためのU-Netのようなより複雑なアーキテクチャへの影響はいまだほとんど調査されていない。
実際、U-Netアーキテクチャにローテーション等価性を統合することに関心を持つ以前の研究は、限られた範囲で特定のアプリケーションを解決することに重点を置いてきた。
これとは対照的に,広いタスク範囲にわたる画像セグメンテーションにおいて,回転同変U-Netをより徹底的に評価することを目的としている。
我々は、標準的なU-Netアーキテクチャと比較し、性能と持続可能性(計算コスト)の改善を評価した。
本評価では,対象物の向きが任意の画像(例えばKvasir-SEG)のデータセットだけでなく,より標準的なセグメンテーションデータセット(COCO-Stuffなど)にも焦点を当て,回転等分散に関係のないタスクを超えた回転等分散の適用性について検討する。
この研究の主な貢献は、セグメンテーションタスクにおける回転同値の統合のトレードオフと利点に関する洞察を提供することである。
関連論文リスト
- PreCM: The Padding-based Rotation Equivariant Convolution Mode for Semantic Segmentation [10.74841255987162]
本稿では,パッド型回転同変畳み込みモード(PreCM)を数値的に構築する。
PreCMは、マルチスケールの画像や畳み込みカーネルだけでなく、複数の畳み込みを置き換えるための代替コンポーネントとしても使用できる。
実験により、PreCMベースのネットワークは、元のネットワークやデータ拡張ベースのネットワークよりもセグメンテーション性能が良いことを示した。
論文 参考訳(メタデータ) (2024-11-03T16:26:55Z) - Weakly-Supervised Cross-Domain Segmentation of Electron Microscopy with Sparse Point Annotation [1.124958340749622]
カウント,検出,セグメンテーションタスク間の相関を利用したマルチタスク学習フレームワークを提案する。
ラベル拡張のためのクロスポジションカット・アンド・ペーストを開発し,エントロピーに基づく擬似ラベル選択を行う。
提案手法は, UDA法を著しく上回り, 教師付き手法と同等の性能を発揮する。
論文 参考訳(メタデータ) (2024-03-31T12:22:23Z) - Rotated Multi-Scale Interaction Network for Referring Remote Sensing Image Segmentation [63.15257949821558]
Referring Remote Sensing Image (RRSIS)は、コンピュータビジョンと自然言語処理を組み合わせた新しい課題である。
従来の参照画像(RIS)アプローチは、空中画像に見られる複雑な空間スケールと向きによって妨げられている。
本稿ではRMSIN(Rotated Multi-Scale Interaction Network)を紹介する。
論文 参考訳(メタデータ) (2023-12-19T08:14:14Z) - Fine-grained Recognition with Learnable Semantic Data Augmentation [68.48892326854494]
きめ細かい画像認識は、長年続くコンピュータビジョンの課題である。
本稿では,識別領域損失問題を軽減するため,特徴レベルのトレーニングデータを多様化することを提案する。
本手法は,いくつかの人気分類ネットワーク上での一般化性能を著しく向上させる。
論文 参考訳(メタデータ) (2023-09-01T11:15:50Z) - Sorted Convolutional Network for Achieving Continuous Rotational
Invariance [56.42518353373004]
テクスチャ画像のハンドメイドな特徴に着想を得たSorting Convolution (SC)を提案する。
SCは、追加の学習可能なパラメータやデータ拡張を必要とせずに連続的な回転不変性を達成する。
以上の結果から, SCは, 上記の課題において, 最高の性能を達成できることが示唆された。
論文 参考訳(メタデータ) (2023-05-23T18:37:07Z) - SO(2) and O(2) Equivariance in Image Recognition with
Bessel-Convolutional Neural Networks [63.24965775030674]
この研究はベッセル畳み込みニューラルネットワーク(B-CNN)の開発を示す
B-CNNは、ベッセル関数に基づく特定の分解を利用して、画像とフィルタの間のキー操作を変更する。
他の手法と比較して,B-CNNの性能を評価するために検討を行った。
論文 参考訳(メタデータ) (2023-04-18T18:06:35Z) - AF$_2$: Adaptive Focus Framework for Aerial Imagery Segmentation [86.44683367028914]
航空画像のセグメンテーションにはいくつかの独特な課題があり、中でも最も重要なものは前景と背景のアンバランスにある。
本稿では,階層的なセグメンテーション手法を採用し,マルチスケール表現を適応的に活用するAdaptive Focus Framework (AF$)を提案する。
AF$は、広く使われている3つの航空ベンチマークの精度を大幅に改善した。
論文 参考訳(メタデータ) (2022-02-18T10:14:45Z) - Equivariance versus Augmentation for Spherical Images [0.7388859384645262]
球面画像に適用した畳み込みニューラルネットワーク(CNN)における回転同値の役割を解析する。
我々は、S2CNNとして知られるグループ同変ネットワークと、データ増大量で訓練された標準非同変CNNの性能を比較した。
論文 参考訳(メタデータ) (2022-02-08T16:49:30Z) - SI-Score: An image dataset for fine-grained analysis of robustness to
object location, rotation and size [95.00667357120442]
オブジェクトの位置、回転、サイズを変えることは、非自明な方法で予測に影響を与える可能性がある。
合成データセットであるSI-Scoreを用いて,これらの変動要因に対するロバストネスのきめ細かい解析を行う。
論文 参考訳(メタデータ) (2021-04-09T05:00:49Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。