論文の概要: On the use of Cortical Magnification and Saccades as Biological Proxies
for Data Augmentation
- arxiv url: http://arxiv.org/abs/2112.07173v1
- Date: Tue, 14 Dec 2021 05:38:26 GMT
- ステータス: 処理完了
- システム内更新日: 2021-12-16 02:39:51.900851
- Title: On the use of Cortical Magnification and Saccades as Biological Proxies
for Data Augmentation
- Title(参考訳): データ拡張のための生物プロキシとしての皮質拡大とサッカデスの利用について
- Authors: Binxu Wang, David Mayo, Arturo Deza, Andrei Barbu, Colin Conwell
- Abstract要約: ほとんどの自己監督的手法は、同じ画像の異なる変換の不変表現を学習するようシステムに促す。
本稿では,これらの強化のリバースエンジニアリングを,生物学的あるいは知覚学的に妥当なものにしようと試みる。
ランダムな収穫は皮質の倍率によって代用でき、画像のササードライクなサンプリングも表現学習に役立てることができる。
- 参考スコア(独自算出の注目度): 9.848635287149355
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Self-supervised learning is a powerful way to learn useful representations
from natural data. It has also been suggested as one possible means of building
visual representation in humans, but the specific objective and algorithm are
unknown. Currently, most self-supervised methods encourage the system to learn
an invariant representation of different transformations of the same image in
contrast to those of other images. However, such transformations are generally
non-biologically plausible, and often consist of contrived perceptual schemes
such as random cropping and color jittering. In this paper, we attempt to
reverse-engineer these augmentations to be more biologically or perceptually
plausible while still conferring the same benefits for encouraging robust
representation. Critically, we find that random cropping can be substituted by
cortical magnification, and saccade-like sampling of the image could also
assist the representation learning. The feasibility of these transformations
suggests a potential way that biological visual systems could implement
self-supervision. Further, they break the widely accepted spatially-uniform
processing assumption used in many computer vision algorithms, suggesting a
role for spatially-adaptive computation in humans and machines alike. Our code
and demo can be found here.
- Abstract(参考訳): 自己教師付き学習は、自然データから有用な表現を学ぶための強力な方法である。
また、人間の視覚表現を構築する方法として提案されているが、具体的な目的やアルゴリズムは不明である。
現在、ほとんどの自己教師付き手法は、システムが他の画像と対照的に、同じ画像の異なる変換の不変表現を学ぶことを奨励している。
しかし、このような変換は一般に生物学的には不可能であり、しばしばランダムなトリミングやカラージッタリングのような複雑な知覚スキームから構成される。
本稿では,これらの拡張を,より生物学的に,あるいは知覚的に可能であるようにリバースエンジニアリングし,ロバスト表現を促進する上でも同様の利点を享受する。
批判的に、ランダムな切り取りは皮質の倍率で置き換えることができ、画像のサッケードのようなサンプリングは表現学習にも役立つ。
これらの変換の可能性は、生物学的視覚システムが自己スーパービジョンを実装する可能性を示している。
さらに、多くのコンピュータビジョンアルゴリズムで広く受け入れられている空間一様処理の仮定を破り、人間や機械の空間適応計算の役割を示唆している。
私たちのコードとデモはここにある。
関連論文リスト
- Estimating the distribution of numerosity and non-numerical visual magnitudes in natural scenes using computer vision [0.08192907805418582]
自然の視覚的な場面では、異なる数列の出現頻度は、電力法分布に従うことを示す。
本研究では, 連続度と数値の相関構造が, データセット, シーンタイプ間で安定であることを示す。
論文 参考訳(メタデータ) (2024-09-17T09:49:29Z) - Unsupervised Learning of Invariance Transformations [105.54048699217668]
近似グラフ自己同型を見つけるためのアルゴリズムフレームワークを開発する。
重み付きグラフにおける近似自己同型を見つけるために、このフレームワークをどのように利用できるかについて議論する。
論文 参考訳(メタデータ) (2023-07-24T17:03:28Z) - Multi-Domain Norm-referenced Encoding Enables Data Efficient Transfer
Learning of Facial Expression Recognition [62.997667081978825]
本稿では,表情認識における伝達学習のための生物学的メカニズムを提案する。
提案アーキテクチャでは,人間の脳が,頭部形状の異なる表情を自然に認識する方法について解説する。
本モデルでは, FERGデータセットの分類精度92.15%を極端に高いデータ効率で達成する。
論文 参考訳(メタデータ) (2023-04-05T09:06:30Z) - Perception Over Time: Temporal Dynamics for Robust Image Understanding [5.584060970507506]
ディープラーニングは、狭く特定の視覚タスクにおいて、人間レベルのパフォーマンスを上回る。
人間の視覚知覚は入力刺激の変化に対して、桁違いに頑丈である。
静的画像理解に時間力学を取り入れた新しい手法を提案する。
論文 参考訳(メタデータ) (2022-03-11T21:11:59Z) - Improving Transferability of Representations via Augmentation-Aware
Self-Supervision [117.15012005163322]
AugSelfは、ランダムに強化された2つのサンプル間の拡張パラメータの違いを学習する補助的な自己教師型損失である。
私たちの直感は、AugSelfが学習表現における拡張認識情報の保存を奨励していることです。
AugSelfは、最新の最先端の表現学習手法に、無視できる追加のトレーニングコストで簡単に組み込むことができる。
論文 参考訳(メタデータ) (2021-11-18T10:43:50Z) - Residual Relaxation for Multi-view Representation Learning [64.40142301026805]
マルチビュー手法は、同じ画像の複数のビューをアライメントすることで学習する。
画像回転などの有用な拡張は、セマンティックシフトを引き起こすため、多視点法には有害である。
我々は,Pretext-aware Residual Relaxation (Prelax) という汎用的な手法を開発し,正確なアライメントを緩和する。
論文 参考訳(メタデータ) (2021-10-28T17:57:17Z) - Focus on the Positives: Self-Supervised Learning for Biodiversity
Monitoring [9.086207853136054]
ラベルのない画像コレクションから自己教師付き表現を学習する問題に対処する。
我々は,入力画像間の空間的関係や時間的関係などの情報を符号化する,手軽に利用可能なコンテキストデータを利用する。
地球生物多様性監視の重要課題として、人間の監督が限定された視覚的種分類タスクに適応可能な画像特徴があげられる。
論文 参考訳(メタデータ) (2021-08-14T01:12:41Z) - This is not the Texture you are looking for! Introducing Novel
Counterfactual Explanations for Non-Experts using Generative Adversarial
Learning [59.17685450892182]
反実用説明システムは、入力画像を変更して反実用推論を可能にする。
本稿では, 対向画像から画像への変換技術に基づく, 対向画像の説明を新たに生成する手法を提案する。
その結果,我々のアプローチは,2つの最先端技術システムよりも,メンタルモデル,説明満足度,信頼度,感情,自己効力に関して有意に優れた結果をもたらすことがわかった。
論文 参考訳(メタデータ) (2020-12-22T10:08:05Z) - Category-Learning with Context-Augmented Autoencoder [63.05016513788047]
実世界のデータの解釈可能な非冗長表現を見つけることは、機械学習の鍵となる問題の一つである。
本稿では,オートエンコーダのトレーニングにデータ拡張を利用する新しい手法を提案する。
このような方法で変分オートエンコーダを訓練し、補助ネットワークによって変換結果を予測できるようにする。
論文 参考訳(メタデータ) (2020-10-10T14:04:44Z) - Orientation-Disentangled Unsupervised Representation Learning for
Computational Pathology [6.468635277309852]
本稿では,回転同変畳み込みネットワークの群構造を利用して,変分自動エンコーダフレームワークの拡張を提案する。
訓練されたモデルが単一セル画像の固有方向情報を効率的に切り離すことを示す。
論文 参考訳(メタデータ) (2020-08-26T16:57:45Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。