論文の概要: Ikshana: A Theory of Human Scene Understanding Mechanism
- arxiv url: http://arxiv.org/abs/2101.10837v1
- Date: Thu, 21 Jan 2021 10:30:56 GMT
- ステータス: 処理完了
- システム内更新日: 2021-03-21 07:53:34.711529
- Title: Ikshana: A Theory of Human Scene Understanding Mechanism
- Title(参考訳): イクスハナ:人間の情景理解機構の理論
- Authors: Venkata Satya Sai Ajay Daliparthi
- Abstract要約: 我々は,人間の脳の機能を説明するために,イクシャナ(ikshana)という理論を提案する。
我々はikshananetというアーキテクチャを設計し、cityscapesのピクセルレベルのセマンティクスセグメンテーションベンチマークで評価した。
その結果、イクサナ理論はより少ない訓練データで実行できることが示された。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by-nc-nd/4.0/
- Abstract: In recent years, deep neural networks achieved state-of-the-art performance
on many computer vision tasks. The two most commonly observed drawbacks of
these deep neural networks are: the requirement of a massive amount of labeled
data and a vast number of parameters. In this work, we propose a theory named
Ikshana, to explain the functioning of the human brain, while humans understand
a natural scene/image. We have designed an architecture named IkshanaNet and
evaluated on the Cityscapes pixel-level semantic segmentation benchmark, to
show how to implement our theory in practice. The results showed that the
Ikshana theory could perform with less training data. Also, through some
experiments evaluated on the validation set, we showed that the Ikshana theory
can significantly reduce the number of parameters of the network. In
conclusion, a deep neural network designed by following the Ikshana theory will
learn better vector representations of the image, useful for any computer
vision task.
- Abstract(参考訳): 近年、ディープニューラルネットワークは多くのコンピュータビジョンタスクで最先端のパフォーマンスを達成した。
これらのディープニューラルネットワークの最もよく見られる欠点は、大量のラベル付きデータと膨大な数のパラメータの要求である。
本研究では,人間の脳機能を説明するために,イクサナという理論を提案し,自然のシーンやイメージを理解する。
我々はIkshanaNetというアーキテクチャを設計し、Cityscapesのピクセルレベルのセマンティックセマンティックセグメンテーションベンチマークで評価し、我々の理論を実際にどのように実装するかを示す。
その結果、イクシャナ理論はより少ない訓練データで実行可能であることが判明した。
また、検証セットで評価したいくつかの実験により、Ikshana理論はネットワークのパラメータ数を著しく削減できることを示した。
結論として、イクスハナ理論に従って設計されたディープニューラルネットワークは、任意のコンピュータビジョンタスクに有用な、画像のベクトル表現をより良く学習する。
関連論文リスト
- Robustness of Humans and Machines on Object Recognition with Extreme
Image Transformations [0.0]
物体認識タスクにおいて、画像変換の新たなセットを導入し、人間とネットワークの評価を行う。
人間は高い精度で物体を認識できる一方で、いくつかの共通ネットワークの性能は急速に低下することがわかった。
論文 参考訳(メタデータ) (2022-05-09T17:15:54Z) - FuNNscope: Visual microscope for interactively exploring the loss
landscape of fully connected neural networks [77.34726150561087]
ニューラルネットワークの高次元景観特性を探索する方法を示す。
我々は、小さなニューラルネットワークの観測結果をより複雑なシステムに一般化する。
インタラクティブダッシュボードは、いくつかのアプリケーションネットワークを開放する。
論文 参考訳(メタデータ) (2022-04-09T16:41:53Z) - Quasi-orthogonality and intrinsic dimensions as measures of learning and
generalisation [55.80128181112308]
ニューラルネットワークの特徴空間の次元性と準直交性は、ネットワークの性能差別と共同して機能する可能性があることを示す。
本研究は, ネットワークの最終的な性能と, ランダムに初期化された特徴空間の特性との関係を示唆する。
論文 参考訳(メタデータ) (2022-03-30T21:47:32Z) - Stochastic Neural Networks with Infinite Width are Deterministic [7.07065078444922]
使用中のニューラルネットワークの主要なタイプであるニューラルネットワークについて研究する。
最適化されたニューラルネットワークの幅が無限大になる傾向があるため、トレーニングセットの予測分散はゼロになる。
論文 参考訳(メタデータ) (2022-01-30T04:52:31Z) - Overcoming the Domain Gap in Neural Action Representations [60.47807856873544]
3Dポーズデータは、手動で介入することなく、マルチビュービデオシーケンスから確実に抽出できる。
本稿では,ニューラルアクション表現の符号化を,ニューラルアクションと行動拡張のセットと共に導くために使用することを提案する。
ドメインギャップを減らすために、トレーニングの間、同様の行動をしているように見える動物間で神経と行動のデータを取り替える。
論文 参考訳(メタデータ) (2021-12-02T12:45:46Z) - A Few-shot Learning Graph Multi-Trajectory Evolution Network for
Forecasting Multimodal Baby Connectivity Development from a Baseline
Timepoint [53.73316520733503]
本稿では,教師-学生パラダイムを取り入れたグラフ多目的進化ネットワーク(GmTE-Net)を提案する。
これは、脳グラフ多軌道成長予測に適した最初の教師学生アーキテクチャである。
論文 参考訳(メタデータ) (2021-10-06T08:26:57Z) - Tensor Methods in Computer Vision and Deep Learning [120.3881619902096]
テンソル(tensor)は、複数の次元の視覚データを自然に表現できるデータ構造である。
コンピュータビジョンにおけるディープラーニングパラダイムシフトの出現により、テンソルはさらに基本的なものになっている。
本稿では,表現学習と深層学習の文脈において,テンソルとテンソル法を深く,実践的に検討する。
論文 参考訳(メタデータ) (2021-07-07T18:42:45Z) - What can linearized neural networks actually say about generalization? [67.83999394554621]
ある無限大のニューラルネットワークにおいて、ニューラル・タンジェント・カーネル(NTK)理論は一般化を完全に特徴づける。
線形近似は、ニューラルネットワークの特定のタスクの学習複雑性を確実にランク付けできることを示す。
我々の研究は、将来の理論的研究を刺激する新しい深層学習現象の具体例を提供する。
論文 参考訳(メタデータ) (2021-06-12T13:05:11Z) - Deep Spiking Convolutional Neural Network for Single Object Localization
Based On Deep Continuous Local Learning [0.0]
グレースケール画像における単一物体の局所化のための深部畳み込みスパイクニューラルネットワークを提案する。
Oxford-IIIT-Petで報告された結果は、教師付き学習アプローチによるスパイクニューラルネットワークの活用を検証する。
論文 参考訳(メタデータ) (2021-05-12T12:02:05Z) - Towards Human-Understandable Visual Explanations:Imperceptible
High-frequency Cues Can Better Be Removed [46.36600006968488]
HVS(Human Visual System)と精神物理学に制約された人間の能力を考慮する必要があると我々は主張する。
実顔画像と偽顔画像の分類に関するケーススタディを行い、標準的なニューラルネットワークによって選択された特徴の多くは、人間には認識できないことが判明した。
論文 参考訳(メタデータ) (2021-04-16T08:11:30Z) - Perceptron Theory for Predicting the Accuracy of Neural Networks [5.575293536755126]
分類タスクのパフォーマンスを予測できる1層パーセプトロンの理論を開発しています。
この研究は、ディープニューラルネットワークを理解するための単純で二部的なアプローチを提供する。
論文 参考訳(メタデータ) (2020-12-14T19:02:26Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。