論文の概要: Visually Impaired Aid using Convolutional Neural Networks, Transfer
Learning, and Particle Competition and Cooperation
- arxiv url: http://arxiv.org/abs/2005.04473v1
- Date: Sat, 9 May 2020 16:11:48 GMT
- ステータス: 処理完了
- システム内更新日: 2022-12-05 06:35:21.634224
- Title: Visually Impaired Aid using Convolutional Neural Networks, Transfer
Learning, and Particle Competition and Cooperation
- Title(参考訳): 畳み込みニューラルネットワークを用いた視覚障害者支援, 伝達学習, 粒子競合と協調
- Authors: Fabricio Breve, Carlos Norberto Fischer
- Abstract要約: 本稿では、畳み込みニューラルネットワーク(CNN)、伝達学習、半教師付き学習(SSL)を用いて、視覚障害者支援を目的としたフレームワークを構築することを提案する。
計算コストが低く、従って、追加の機器に頼ることなく、現在のスマートフォンで実装することができる。
- 参考スコア(独自算出の注目度): 0.0
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Navigation and mobility are some of the major problems faced by visually
impaired people in their daily lives. Advances in computer vision led to the
proposal of some navigation systems. However, most of them require expensive
and/or heavy hardware. In this paper we propose the use of convolutional neural
networks (CNN), transfer learning, and semi-supervised learning (SSL) to build
a framework aimed at the visually impaired aid. It has low computational costs
and, therefore, may be implemented on current smartphones, without relying on
any additional equipment. The smartphone camera can be used to automatically
take pictures of the path ahead. Then, they will be immediately classified,
providing almost instantaneous feedback to the user. We also propose a dataset
to train the classifiers, including indoor and outdoor situations with
different types of light, floor, and obstacles. Many different CNN
architectures are evaluated as feature extractors and classifiers, by
fine-tuning weights pre-trained on a much larger dataset. The graph-based SSL
method, known as particle competition and cooperation, is also used for
classification, allowing feedback from the user to be incorporated without
retraining the underlying network. 92\% and 80\% classification accuracy is
achieved in the proposed dataset in the best supervised and SSL scenarios,
respectively.
- Abstract(参考訳): ナビゲーションとモビリティは、日常生活の中で視覚障害者が直面する主要な問題である。
コンピュータビジョンの進歩はいくつかのナビゲーションシステムの提案につながった。
しかし、そのほとんどは高価で重いハードウェアを必要とする。
本稿では,畳み込みニューラルネットワーク(cnn),転送学習,半教師付き学習(ssl)を用いて視覚障害者支援のためのフレームワークを構築することを提案する。
計算コストが低く、従って、追加の機器に頼ることなく、現在のスマートフォンで実装することができる。
スマートフォンのカメラは、前方の道の写真を撮るのに使える。
その後、すぐに分類され、ほぼ瞬時にユーザにフィードバックを提供する。
また,照明,床,障害物の異なる屋内および屋外の状況を含む分類器を訓練するためのデータセットを提案する。
多くの異なるCNNアーキテクチャは、より大きなデータセットで事前訓練された微調整重みによって特徴抽出器と分類器として評価される。
グラフベースのSSLメソッドは、パーティクルコンペティションとコラボレーティブとして知られており、ネットワークを再トレーニングすることなく、ユーザからのフィードバックを組み込むことができる。
92\%と80\%の分類精度は、それぞれ最高の教師付きシナリオとSSLシナリオで提案されたデータセットで達成される。
関連論文リスト
- Training a Distributed Acoustic Sensing Traffic Monitoring Network With Video Inputs [0.0]
本稿では,DASデータと協調した視覚情報を統合する新しい概念を提案する。
本モデルでは,検出と分類において94%以上の性能を示し,約1.2%の誤警報率を示す。
論文 参考訳(メタデータ) (2024-12-17T10:06:42Z) - Battle of the Backbones: A Large-Scale Comparison of Pretrained Models
across Computer Vision Tasks [139.3768582233067]
Battle of the Backbones (BoB)は、ニューラルネットワークベースのコンピュータビジョンシステムのためのベンチマークツールである。
視覚変換器(ViT)と自己教師型学習(SSL)がますます人気になっている。
同じアーキテクチャと同じようなサイズの事前トレーニングデータセット上でのアップルとアプリケーションの比較では、SSLバックボーンは極めて競争力があることが分かりました。
論文 参考訳(メタデータ) (2023-10-30T18:23:58Z) - Visual Recognition with Deep Nearest Centroids [57.35144702563746]
我々は、概念的にエレガントで驚くほど効果的な大規模視覚認識ネットワークである深部セントロイド(DNC)を考案した。
パラメトリックと比較すると、DNCは画像分類(CIFAR-10, ImageNet)に優れ、画像認識(ADE20K, Cityscapes)を大いに起動する。
論文 参考訳(メタデータ) (2022-09-15T15:47:31Z) - Federated Deep Learning Meets Autonomous Vehicle Perception: Design and
Verification [168.67190934250868]
フェデレーテッド・ラーニング・パワード・コネクテッド・オートモービル(FLCAV)が提案されている。
FLCAVは通信とアノテーションのコストを削減しながらプライバシを保存する。
マルチステージトレーニングのためのネットワークリソースと道路センサのポーズを決定することは困難である。
論文 参考訳(メタデータ) (2022-06-03T23:55:45Z) - Task-Oriented Image Transmission for Scene Classification in Unmanned
Aerial Systems [46.64800170644672]
シーン分類作業のための新しい航空画像伝送パラダイムを提案する。
画像やチャネル条件の認識を伴うセマンティックブロック伝送のための,フロントエンドUAV上での軽量モデルを開発した。
伝送遅延と分類精度のトレードオフを達成するために、深層強化学習を用いる。
論文 参考訳(メタデータ) (2021-12-21T02:44:49Z) - MUSCLE: Strengthening Semi-Supervised Learning Via Concurrent
Unsupervised Learning Using Mutual Information Maximization [29.368950377171995]
我々は、教師なし学習と半教師なし学習を併用するために、相互情報に基づく教師なし・半教師付き並行学習(MUSCLE)を導入する。
MUSCLEはニューラルネットワークのスタンドアロントレーニングスキームとして使用することができ、他の学習手法にも組み込むことができる。
提案手法は,CIFAR-10,CIFAR-100,Mini-Imagenetなど,いくつかの標準ベンチマークにおいて,その性能に優れることを示す。
論文 参考訳(メタデータ) (2020-11-30T23:01:04Z) - Federated Self-Supervised Learning of Multi-Sensor Representations for
Embedded Intelligence [8.110949636804772]
スマートフォン、ウェアラブル、IoT(Internet of Things)デバイスは、教師付きモデルを学習するための集中リポジトリに蓄積できない豊富なデータを生成する。
本稿では,ウェーブレット変換に基づくテキストカルグラム・信号対応学習という自己教師付きアプローチを提案し,ラベルなしセンサ入力から有用な表現を学習する。
さまざまなパブリックデータセットのマルチビュー戦略を用いて,学習機能の品質を広範囲に評価し,すべての領域で高いパフォーマンスを実現している。
論文 参考訳(メタデータ) (2020-07-25T21:59:17Z) - Auto-Rectify Network for Unsupervised Indoor Depth Estimation [119.82412041164372]
ハンドヘルド環境に現れる複雑な自我運動が,学習深度にとって重要な障害であることが確認された。
本稿では,相対回転を除去してトレーニング画像の修正を効果的に行うデータ前処理手法を提案する。
その結果、従来の教師なしSOTA法よりも、難易度の高いNYUv2データセットよりも優れていた。
論文 参考訳(メタデータ) (2020-06-04T08:59:17Z) - Curriculum By Smoothing [52.08553521577014]
畳み込みニューラルネットワーク(CNN)は、画像分類、検出、セグメンテーションなどのコンピュータビジョンタスクにおいて顕著な性能を示している。
アンチエイリアスフィルタやローパスフィルタを用いてCNNの機能埋め込みを円滑化するエレガントなカリキュラムベースのスキームを提案する。
トレーニング中に特徴マップ内の情報量が増加するにつれて、ネットワークはデータのより優れた表現を徐々に学習することができる。
論文 参考訳(メタデータ) (2020-03-03T07:27:44Z) - Deep Learning for Ultra-Reliable and Low-Latency Communications in 6G
Networks [84.2155885234293]
まず,データ駆動型教師付き深層学習と深部強化学習をURLLCに適用する方法を概説する。
このようなオープンな問題に対処するために、デバイスインテリジェンス、エッジインテリジェンス、およびURLLCのためのクラウドインテリジェンスを可能にするマルチレベルアーキテクチャを開発した。
論文 参考訳(メタデータ) (2020-02-22T14:38:11Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。