論文の概要: Unsupervised learning of features and object boundaries from local
prediction
- arxiv url: http://arxiv.org/abs/2205.14195v1
- Date: Fri, 27 May 2022 18:54:10 GMT
- ステータス: 処理完了
- システム内更新日: 2022-05-31 17:57:59.223509
- Title: Unsupervised learning of features and object boundaries from local
prediction
- Title(参考訳): 局所予測による特徴とオブジェクト境界の教師なし学習
- Authors: Heiko H. Sch\"utt and Wei Ji Ma
- Abstract要約: 本稿では,各因子が追加のバイナリ変数とペアリングされ,その因子をオン/オフに切り替える,ペアワイズマルコフ確率場モデルによる特徴写像の層を導入する。
マルコフ確率場要素の特徴とパラメータの両方を、さらなる監視信号なしで画像から学習することができる。
宇宙空間での計算予測はセグメンテーションと特徴学習の両方に役立ち、これらの予測を最適化するために訓練されたモデルは人間の視覚システムと類似性を示す。
- 参考スコア(独自算出の注目度): 0.0
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: A visual system has to learn both which features to extract from images and
how to group locations into (proto-)objects. Those two aspects are usually
dealt with separately, although predictability is discussed as a cue for both.
To incorporate features and boundaries into the same model, we model a layer of
feature maps with a pairwise Markov random field model in which each factor is
paired with an additional binary variable, which switches the factor on or off.
Using one of two contrastive learning objectives, we can learn both the
features and the parameters of the Markov random field factors from images
without further supervision signals. The features learned by shallow neural
networks based on this loss are local averages, opponent colors, and Gabor-like
stripe patterns. Furthermore, we can infer connectivity between locations by
inferring the switch variables. Contours inferred from this connectivity
perform quite well on the Berkeley segmentation database (BSDS500) without any
training on contours. Thus, computing predictions across space aids both
segmentation and feature learning, and models trained to optimize these
predictions show similarities to the human visual system. We speculate that
retinotopic visual cortex might implement such predictions over space through
lateral connections.
- Abstract(参考訳): 視覚システムは、画像から抽出する特徴と、位置を(プロト)オブジェクトに分類する方法の両方を学ぶ必要がある。
これらの2つの側面は通常別々に扱われるが、予測可能性については両者の手がかりとして議論される。
特徴とバウンダリを同じモデルに組み込むため、各因子が追加のバイナリ変数とペアリングされるペアワイズマルコフ確率場モデルを用いて特徴写像の層をモデル化し、その因子をオン/オフに切り替える。
2つの対比学習目標のうちの1つを用いて、マルコフ確率場因子の特徴とパラメータを、さらなる監視信号なしで画像から学習できる。
この損失に基づいて浅層ニューラルネットワークによって学習された特徴は、局所平均、反対色、gaborのようなストライプパターンである。
さらに,スイッチ変数を推定することにより,位置間の接続性を推定できる。
この接続から推測される輪郭は、輪郭に関するトレーニングなしでバークレー分断データベース(BSDS500)上で非常によく機能する。
したがって、空間を越えた予測計算はセグメンテーションと特徴学習の両方を補助し、これらの予測を最適化するために訓練されたモデルは人間の視覚システムと類似性を示す。
網膜視野は側方接続による空間上の予測を実装できるのではないかと推測する。
関連論文リスト
- Linking in Style: Understanding learned features in deep learning models [0.0]
畳み込みニューラルネットワーク(CNN)は抽象的な特徴を学び、オブジェクト分類を行う。
本稿では,CNNにおける学習特徴を可視化し,体系的に解析する自動手法を提案する。
論文 参考訳(メタデータ) (2024-09-25T12:28:48Z) - Explaining Vision-Language Similarities in Dual Encoders with Feature-Pair Attributions [28.53636082915161]
入力間の特徴対相互作用に、任意の微分可能なデュアルエンコーダの予測を属性付ける手法を導出する。
提案手法をCLIP型モデルに適用し,キャプション部分と画像中の領域間の微粒な対応を学習することを示す。
論文 参考訳(メタデータ) (2024-08-26T09:55:34Z) - SIGMA:Sinkhorn-Guided Masked Video Modeling [69.31715194419091]
SIGMA (Sinkhorn-guided Masked Video Modelling) は、新しいビデオ事前学習法である。
時空管の特徴を,限られた数の学習可能なクラスタに均等に分散する。
10個のデータセットによる実験結果から,より高性能で時間的,堅牢な映像表現を学習する上で,SIGMAの有効性が検証された。
論文 参考訳(メタデータ) (2024-07-22T08:04:09Z) - Dual Feature Augmentation Network for Generalized Zero-shot Learning [14.410978100610489]
ゼロショット学習 (ZSL) は,見知らぬクラスから知識を伝達することによって,サンプルを訓練せずに新しいクラスを推論することを目的としている。
ZSLの既存の埋め込みベースのアプローチは、画像上の属性を見つけるために注意機構を用いるのが一般的である。
本稿では,2つの機能拡張モジュールからなる新しいDual Feature Augmentation Network (DFAN)を提案する。
論文 参考訳(メタデータ) (2023-09-25T02:37:52Z) - Domain Adaptive Synapse Detection with Weak Point Annotations [63.97144211520869]
弱点アノテーションを用いたドメイン適応型シナプス検出のためのフレームワークであるAdaSynを提案する。
I SBI 2023のWASPSYNチャレンジでは、我々の手法が第1位にランクインした。
論文 参考訳(メタデータ) (2023-08-31T05:05:53Z) - Extracting Semantic Knowledge from GANs with Unsupervised Learning [65.32631025780631]
GAN(Generative Adversarial Networks)は、特徴写像のセマンティクスを線形に分離可能な形でエンコードする。
本稿では,線形分離性を利用してGANの特徴をクラスタリングする新しいクラスタリングアルゴリズムKLiSHを提案する。
KLiSHは、さまざまなオブジェクトのデータセットに基づいてトレーニングされたGANのきめ細かいセマンティクスの抽出に成功している。
論文 参考訳(メタデータ) (2022-11-30T03:18:16Z) - Learning sparse features can lead to overfitting in neural networks [9.2104922520782]
機能学習は遅延トレーニングよりもパフォーマンスが良くないことを示す。
空間性は異方性データの学習に不可欠であることが知られているが、対象関数が一定あるいは滑らかな場合に有害である。
論文 参考訳(メタデータ) (2022-06-24T14:26:33Z) - Probabilistic Tracking with Deep Factors [8.030212474745879]
因子グラフに基づく確率的追跡フレームワークにおける特徴量に対する生成密度と組み合わせたディープ・フィーチャー・エンコーディングの使い方を示す。
本稿では,学習した特徴エンコーダと生成密度を組み合わせる可能性モデルを提案する。
論文 参考訳(メタデータ) (2021-12-02T21:31:51Z) - Intersection Regularization for Extracting Semantic Attributes [72.53481390411173]
本稿では,ネットワーク抽出した特徴が意味属性のセットと一致するように,教師付き分類の問題を考える。
例えば、鳥類のイメージを種に分類することを学ぶとき、動物学者が鳥類を分類するために使用する特徴の出現を観察したい。
本稿では,複数層パーセプトロン(MLP)と並列決定木を併用した,離散的なトップレベルアクティベーションを持つニューラルネットワークのトレーニングを提案する。
論文 参考訳(メタデータ) (2021-03-22T14:32:44Z) - Learning What Makes a Difference from Counterfactual Examples and
Gradient Supervision [57.14468881854616]
ニューラルネットワークの一般化能力を改善するための補助的学習目標を提案する。
我々は、異なるラベルを持つ最小差の例のペア、すなわち反ファクトまたはコントラストの例を使用し、タスクの根底にある因果構造を示す信号を与える。
このテクニックで訓練されたモデルは、配布外テストセットのパフォーマンスを向上させる。
論文 参考訳(メタデータ) (2020-04-20T02:47:49Z) - Articulation-aware Canonical Surface Mapping [54.0990446915042]
本研究では,2次元画素から標準テンプレート形状の対応する点へのマッピングを示すCSM(Canonical Surface Mapping)を予測し,入力画像に対応するテンプレートの調音とポーズを推定するタスクに取り組む。
我々の重要な洞察は、これらのタスクは幾何学的に関連しており、予測間の一貫性を強制することで、監視信号を得ることができることである。
我々は,有意な調音学習において,調音がより正確なCSM予測の学習に役立ち,予測されたCSMとの整合性が重要であることを実証的に示す。
論文 参考訳(メタデータ) (2020-04-01T17:56:45Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。