論文の概要: Brain Inspired Object Recognition System
- arxiv url: http://arxiv.org/abs/2105.07237v1
- Date: Sat, 15 May 2021 14:42:17 GMT
- ステータス: 処理完了
- システム内更新日: 2021-05-18 14:47:56.887152
- Title: Brain Inspired Object Recognition System
- Title(参考訳): 脳誘発物体認識システム
- Authors: Pinaki Roy Chowdhury, Angad Wadhwa, Antariksha Kar and Nikhil Tyagi
- Abstract要約: 方位勾配のヒストグラム、局所二分パターン、および対象画像から抽出された主成分を用いる。
計算理論は最初に、脳の情報処理機構の概念を用いて開発された。
提案モデルの性能を検証するために,15の公開データセットを用いて実験を行った。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by-nc-sa/4.0/
- Abstract: This paper presents a new proposal of an efficient computational model of
face and object recognition which uses cues from the distributed face and
object recognition mechanism of the brain, and by gathering engineering
equivalent of these cues from existing literature. Three distinct and widely
used features, Histogram of Oriented Gradients, Local Binary Patterns, and
Principal components extracted from target images are used in a manner which is
simple, and yet effective. Our model uses multi-layer perceptrons (MLP) to
classify these three features and fuse them at the decision level using sum
rule. A computational theory is first developed by using concepts from the
information processing mechanism of the brain. Extensive experiments are
carried out using fifteen publicly available datasets to validate the
performance of our proposed model in recognizing faces and objects with extreme
variation of illumination, pose angle, expression, and background. Results
obtained are extremely promising when compared with other face and object
recognition algorithms including CNN and deep learning based methods. This
highlights that simple computational processes, if clubbed properly, can
produce competing performance with best algorithms.
- Abstract(参考訳): 本稿では,脳の分散顔と物体認識機構のキューを用いた顔と物体の認識の効率的な計算モデルを提案する。
目的画像から抽出した直交勾配のヒストグラム,局所バイナリパターン,および主成分の3つの特徴は単純かつ有効である。
本モデルでは,これら3つの特徴を多層パーセプトロン(MLP)を用いて分類し,総和則を用いて決定レベルで融合する。
計算理論は最初に、脳の情報処理機構の概念を用いて開発された。
照明,ポーズ角,表情,背景を極端に変化させた顔や物体の認識において,提案モデルの性能を検証するために,15の公開データセットを用いて広範な実験を行った。
得られた結果は、CNNやディープラーニングに基づく手法を含む他の顔および物体認識アルゴリズムと比較して非常に有望である。
これは、単純な計算プロセスが、適切にクラブされた場合、最高のアルゴリズムと競合するパフォーマンスを生み出すことを強調する。
関連論文リスト
- A comparative study of generative adversarial networks for image recognition algorithms based on deep learning and traditional methods [34.1086022278394]
本研究の目的は,画像認識分野におけるディープラーニング技術,特にGANのメリットと応用可能性を評価することである。
画像生成と認識におけるGANの動作原理,ネットワーク構造,およびユニークな利点を紹介する。
実験の結果,GANは従来の手法と比較して,複雑な画像の処理,認識精度,アンチノイズ能力に優れていた。
論文 参考訳(メタデータ) (2024-08-07T06:11:25Z) - Faceptor: A Generalist Model for Face Perception [52.8066001012464]
Faceptorは、よく設計されたシングルエンコーダのデュアルデコーダアーキテクチャを採用するために提案されている。
Faceptorへのレイヤアテンションにより、モデルが最適なレイヤから機能を適応的に選択して、望ましいタスクを実行することができる。
我々のトレーニングフレームワークは補助的な教師付き学習にも適用でき、年齢推定や表現認識といったデータスパースタスクの性能を大幅に向上させることができる。
論文 参考訳(メタデータ) (2024-03-14T15:42:31Z) - Two Approaches to Supervised Image Segmentation [55.616364225463066]
本研究は、深層学習とマルチセットニューロンのアプローチの比較実験を開発する。
ディープラーニングアプローチは、画像セグメンテーションの実行の可能性を確認した。
代替のマルチセット手法では、計算資源をほとんど必要とせずに精度を向上することができた。
論文 参考訳(メタデータ) (2023-07-19T16:42:52Z) - Understanding Self-Supervised Pretraining with Part-Aware Representation
Learning [88.45460880824376]
本研究では,自己教師型表現事前学習手法がパート認識表現を学習する能力について検討する。
その結果,完全教師付きモデルはオブジェクトレベルの認識において自己教師付きモデルよりも優れていた。
論文 参考訳(メタデータ) (2023-01-27T18:58:42Z) - Machining feature recognition using descriptors with range constraints
for mechanical 3D models [11.008342341091021]
記述子を用いた16種類の加工特徴の認識手法を提案する。
対象面から抽出したディスクリプタとベース面から抽出したディスクリプタとの類似度を算出する。
提案手法が最新の人工ニューラルネットワークよりも優れた特徴認識性能を示したことを追加試験により確認した。
論文 参考訳(メタデータ) (2023-01-09T04:50:06Z) - Hybrid Optimized Deep Convolution Neural Network based Learning Model
for Object Detection [0.0]
物体の識別はコンピュータビジョンにおける最も基本的で難しい問題の1つである。
近年,ディープラーニングに基づく物体検出技術が大衆の関心を集めている。
本研究では,自律型物体検出システムを構築するために,独自のディープラーニング分類手法を用いる。
提案するフレームワークは検出精度0.9864であり、現在の技術よりも高い。
論文 参考訳(メタデータ) (2022-03-02T04:39:37Z) - Research on facial expression recognition based on Multimodal data
fusion and neural network [2.5431493111705943]
このアルゴリズムはマルチモーダルデータに基づいており、顔画像、画像の方向勾配のヒストグラム、顔のランドマークを入力とする。
実験結果から, マルチモーダルデータの相補性により, 精度, 堅牢性, 検出速度が大幅に向上したことがわかった。
論文 参考訳(メタデータ) (2021-09-26T23:45:40Z) - Multi-Branch Deep Radial Basis Function Networks for Facial Emotion
Recognition [80.35852245488043]
放射状基底関数(RBF)ユニットによって形成された複数の分岐で拡張されたCNNベースのアーキテクチャを提案する。
RBFユニットは、中間表現を用いて類似のインスタンスで共有される局所パターンをキャプチャする。
提案手法は,提案手法の競争力を高めるためのローカル情報の導入であることを示す。
論文 参考訳(メタデータ) (2021-09-07T21:05:56Z) - Progressive Spatio-Temporal Bilinear Network with Monte Carlo Dropout
for Landmark-based Facial Expression Recognition with Uncertainty Estimation [93.73198973454944]
提案手法の性能は, 広く使用されている3つのデータセットで評価される。
ビデオベースの最先端の手法に匹敵するが、複雑さははるかに少ない。
論文 参考訳(メタデータ) (2021-06-08T13:40:30Z) - MetaSDF: Meta-learning Signed Distance Functions [85.81290552559817]
ニューラルな暗示表現で形状を一般化することは、各関数空間上の学習先行値に比例する。
形状空間の学習をメタラーニング問題として定式化し、勾配に基づくメタラーニングアルゴリズムを利用してこの課題を解決する。
論文 参考訳(メタデータ) (2020-06-17T05:14:53Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。