論文の概要: Convolutional Neural Networks Rarely Learn Shape for Semantic Segmentation
- arxiv url: http://arxiv.org/abs/2305.06568v3
- Date: Mon, 27 May 2024 16:11:00 GMT
- ステータス: 処理完了
- システム内更新日: 2024-05-29 12:38:03.889244
- Title: Convolutional Neural Networks Rarely Learn Shape for Semantic Segmentation
- Title(参考訳): 畳み込みニューラルネットワークによる意味的セグメンテーションのための形状学習
- Authors: Yixin Zhang, Maciej A. Mazurowski,
- Abstract要約: 形状学習は、対象物体が特定の形状を持つ場合、畳み込みニューラルネットワーク(CNN)の望ましい特性である可能性がある。
我々は,CNNが形状情報を利用する範囲を測定するための新しい行動指標を提案する。
我々は、CNNが典型的な設定で形状を学習するのではなく、興味のある対象を特定するために利用可能な他の機能に依存していると結論付けている。
- 参考スコア(独自算出の注目度): 16.343080265661882
- License: http://creativecommons.org/licenses/by-nc-nd/4.0/
- Abstract: Shape learning, or the ability to leverage shape information, could be a desirable property of convolutional neural networks (CNNs) when target objects have specific shapes. While some research on the topic is emerging, there is no systematic study to conclusively determine whether and under what circumstances CNNs learn shape. Here, we present such a study in the context of segmentation networks where shapes are particularly important. We define shape and propose a new behavioral metric to measure the extent to which a CNN utilizes shape information. We then execute a set of experiments with synthetic and real-world data to progressively uncover under which circumstances CNNs learn shape and what can be done to encourage such behavior. We conclude that (i) CNNs do not learn shape in typical settings but rather rely on other features available to identify the objects of interest, (ii) CNNs can learn shape, but only if the shape is the only feature available to identify the object, (iii) sufficiently large receptive field size relative to the size of target objects is necessary for shape learning; (iv) a limited set of augmentations can encourage shape learning; (v) learning shape is indeed useful in the presence of out-of-distribution data.
- Abstract(参考訳): 形状学習、もしくは形状情報を活用する能力は、対象物体が特定の形状を持つ場合、畳み込みニューラルネットワーク(CNN)の望ましい特性となる。
トピックに関するいくつかの研究が浮上しているが、CNNがどのような状況で学習するかを決定的に決定する体系的な研究は存在しない。
本稿では, 形状が特に重要であるセグメンテーションネットワークの文脈におけるそのような研究について述べる。
我々は、形状を定義し、CNNが形状情報を利用する範囲を測定するための新しい行動指標を提案する。
次に、合成および実世界のデータを用いて一連の実験を行い、CNNがどのような状況下で学習し、その振る舞いを促進するために何ができるかを段階的に明らかにする。
結論は
(i)CNNは、典型的な設定で形状を学習せず、興味のある対象を特定するために利用可能な他の機能に依存している。
(ii)CNNは形状を学習できるが、その形状がオブジェクトを識別できる唯一の特徴である場合に限られる。
三 形状学習には、対象物の大きさに対して十分に大きな受容野の大きさが必要である。
(四)拡張の限られたセットは、形状学習を促進することができる。
(v)学習形態は,分布外データの存在下では確かに有用である。
関連論文リスト
- A novel feature-scrambling approach reveals the capacity of
convolutional neural networks to learn spatial relations [0.0]
畳み込みニューラルネットワーク(CNN)は、物体認識を解く最も成功したコンピュータビジョンシステムの一つである。
しかし、CNNが実際にどのように決断を下すのか、内部表現の性質や認識戦略が人間とどのように異なるのかは、いまだに理解されていない。
論文 参考訳(メタデータ) (2022-12-12T16:40:29Z) - SurFit: Learning to Fit Surfaces Improves Few Shot Learning on Point
Clouds [48.61222927399794]
SurFitは3次元形状分割ネットワークのラベルを効率的に学習するための単純な手法である。
3次元形状の表面を幾何学的プリミティブに分解する自己指導型タスクに基づいている。
論文 参考訳(メタデータ) (2021-12-27T23:55:36Z) - iSeg3D: An Interactive 3D Shape Segmentation Tool [48.784624011210475]
3次元形状のための効果的なアノテーションツールiSegを提案する。
我々の観察では、ほとんどの対象は有限原始形状の合成とみなすことができる。
構築したプリミティブな形状データに基づいてiSeg3Dモデルをトレーニングし、幾何学的事前知識を自己指導的に学習する。
論文 参考訳(メタデータ) (2021-12-24T08:15:52Z) - Reasoning-Modulated Representations [85.08205744191078]
タスクが純粋に不透明でないような共通的な環境について研究する。
我々のアプローチは、新しいデータ効率表現学習の道を開く。
論文 参考訳(メタデータ) (2021-07-19T13:57:13Z) - Adversarial Shape Learning for Building Extraction in VHR Remote Sensing
Images [18.650642666164252]
建物の形状パターンをモデル化する対比形状学習ネットワーク(ASLNet)を提案する。
実験の結果,提案したASLNetは画素ベース精度とオブジェクトベース測定の両方を大きなマージンで改善することがわかった。
論文 参考訳(メタデータ) (2021-02-22T18:49:43Z) - Shape or Texture: Understanding Discriminative Features in CNNs [28.513300496205044]
最近の研究では、CNNが実際にテクスチャバイアスを持っていることが示されている」。
ネットワークは,最初の数回の訓練で,全体の形状情報の大部分を学習することを示す。
また、形状の符号化は、局所化された画素ごとのセマンティック情報の符号化を意味するものではないことを示す。
論文 参考訳(メタデータ) (2021-01-27T18:54:00Z) - Teaching CNNs to mimic Human Visual Cognitive Process & regularise
Texture-Shape bias [18.003188982585737]
コンピュータビジョンにおける最近の実験は、畳み込みニューラルネットワーク(CNN)を用いたモデルにおいて、テクスチャバイアスが最高の結果の主因であることを実証している。
コスト関数は、CNNが欲張りなアプローチを採り、テクスチャのような局所的な情報に対する生産性を向上させ、その結果、グローバルな統計を探索することができないと信じられている。
画像の再構成と分類に形状,テクスチャ,エッジなどの人間の解釈可能な特徴を活用するために,心理学における特徴統合理論から着想を得た,新しい直感的なアーキテクチャであるCognitiveCNNを提案する。
論文 参考訳(メタデータ) (2020-06-25T22:32:54Z) - Shape-Oriented Convolution Neural Network for Point Cloud Analysis [59.405388577930616]
ポイントクラウドは3次元幾何学情報符号化に採用されている主要なデータ構造である。
形状指向型メッセージパッシング方式であるShapeConvを提案する。
論文 参考訳(メタデータ) (2020-04-20T16:11:51Z) - SSN: Shape Signature Networks for Multi-class Object Detection from
Point Clouds [96.51884187479585]
点雲から形状情報を探索する新しい3次元形状シグネチャを提案する。
対称, 凸船体, チェビシェフフィッティングの操作を取り入れることで, 提案した形状のシグ・ナチュアはコンパクトで有効であるだけでなく, 騒音にも頑健である。
実験により,提案手法は2つの大規模データセット上の既存手法よりも著しく優れた性能を示した。
論文 参考訳(メタデータ) (2020-04-06T16:01:41Z) - Curriculum By Smoothing [52.08553521577014]
畳み込みニューラルネットワーク(CNN)は、画像分類、検出、セグメンテーションなどのコンピュータビジョンタスクにおいて顕著な性能を示している。
アンチエイリアスフィルタやローパスフィルタを用いてCNNの機能埋め込みを円滑化するエレガントなカリキュラムベースのスキームを提案する。
トレーニング中に特徴マップ内の情報量が増加するにつれて、ネットワークはデータのより優れた表現を徐々に学習することができる。
論文 参考訳(メタデータ) (2020-03-03T07:27:44Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。