論文の概要: An embarrassingly simple comparison of machine learning algorithms for
indoor scene classification
- arxiv url: http://arxiv.org/abs/2109.12261v1
- Date: Sat, 25 Sep 2021 02:26:52 GMT
- ステータス: 処理完了
- システム内更新日: 2021-09-30 14:27:12.463374
- Title: An embarrassingly simple comparison of machine learning algorithms for
indoor scene classification
- Title(参考訳): 屋内シーン分類のための機械学習アルゴリズムの恥ずかしいほど簡単な比較
- Authors: Bhanuka Manesha Samarasekara Vitharana Gamage
- Abstract要約: 本研究では,屋内シーン分類作業における5つの機械学習アルゴリズムの性能を比較した。
簡易なMnasNetを用いた屋内分類システムを提案し,23msのレイテンシで72%の精度を達成できる。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: With the emergence of autonomous indoor robots, the computer vision task of
indoor scene recognition has gained the spotlight. Indoor scene recognition is
a challenging problem in computer vision that relies on local and global
features in a scene. This study aims to compare the performance of five machine
learning algorithms on the task of indoor scene classification to identify the
pros and cons of each classifier. It also provides a comparison of low latency
feature extractors versus enormous feature extractors to understand the
performance effects. Finally, a simple MnasNet based indoor classification
system is proposed, which can achieve 72% accuracy at 23 ms latency.
- Abstract(参考訳): 自律的な屋内ロボットの出現により、屋内シーン認識のコンピュータビジョンタスクが注目を浴びている。
屋内シーン認識は、シーン内のローカル機能とグローバル機能に依存するコンピュータビジョンにおいて難しい問題である。
本研究の目的は,屋内シーン分類作業における5つの機械学習アルゴリズムの性能を比較し,各分類器の長所と短所を特定することである。
また、パフォーマンス効果を理解するために、低レイテンシの特徴抽出器と巨大な特徴抽出器の比較も提供する。
最後に,MnasNetを用いた簡易室内分類システムを提案し,23msのレイテンシで72%の精度を実現する。
関連論文リスト
- Small Object Detection for Indoor Assistance to the Blind using YOLO NAS Small and Super Gradients [0.0]
本稿では,小物体検出の課題に対処して,視覚障害者に対する屋内支援のための新しいアプローチを提案する。
軽量で効率的なオブジェクト検出モデルであるYOLO NAS Smallアーキテクチャを,Super Gradientsトレーニングフレームワークを用いて最適化する手法を提案する。
論文 参考訳(メタデータ) (2024-08-28T05:38:20Z) - Self-supervised Learning via Cluster Distance Prediction for Operating Room Context Awareness [44.15562068190958]
オペレーティングルームでは、セマンティックセグメンテーションは、臨床環境を認識したロボットを作るための中核である。
最先端のセマンティックセグメンテーションとアクティビティ認識アプローチは、スケーラブルではない、完全に管理されている。
ToFカメラで撮影したORシーン画像を利用したORシーン理解のための新しい3次元自己教師型タスクを提案する。
論文 参考訳(メタデータ) (2024-07-07T17:17:52Z) - Practical Performance of a Distributed Processing Framework for Machine-Learning-based NIDS [0.4419843514606336]
機械学習に基づくNIDSのための分散処理フレームワークが文献で提案されている。
このフレームワークに基づいた5つの代表的な分類器を実装し、そのスループットとレイテンシを評価する。
論文 参考訳(メタデータ) (2024-05-20T16:14:39Z) - Generalized Label-Efficient 3D Scene Parsing via Hierarchical Feature
Aligned Pre-Training and Region-Aware Fine-tuning [55.517000360348725]
本研究は,ラベル付きシーンが極めて限定された場合の3次元シーン理解のためのフレームワークを提案する。
事前学習された視覚言語モデルから新しいカテゴリーの知識を抽出するために,階層的特徴整合型事前学習と知識蒸留戦略を提案する。
室内と屋外の両方で実験を行ったところ、データ効率のよい学習とオープンワールドの複数ショット学習の両方において、我々のアプローチの有効性が示された。
論文 参考訳(メタデータ) (2023-12-01T15:47:04Z) - What Makes Pre-Trained Visual Representations Successful for Robust
Manipulation? [57.92924256181857]
照明やシーンテクスチャの微妙な変化の下では,操作や制御作業のために設計された視覚表現が必ずしも一般化されないことがわかった。
創発的セグメンテーション能力は,ViTモデルにおける分布外一般化の強い予測因子であることがわかった。
論文 参考訳(メタデータ) (2023-11-03T18:09:08Z) - Exploring Efficient Asymmetric Blind-Spots for Self-Supervised Denoising in Real-World Scenarios [44.31657750561106]
実世界のシナリオにおけるノイズはしばしば空間的に相関しており、多くの自己教師型アルゴリズムは性能が良くない。
盲点サイズを自由に調整できる非対称可変ブラインド・スポットネットワーク(AT-BSN)を提案する。
提案手法は最先端技術を実現し,計算オーバーヘッドや視覚効果の観点から,他の自己教師付きアルゴリズムよりも優れていることを示す。
論文 参考訳(メタデータ) (2023-03-29T15:19:01Z) - NSNet: Non-saliency Suppression Sampler for Efficient Video Recognition [89.84188594758588]
非定常フレームの応答を抑制するために, NSNet(Non-Sliency Suppression Network)を提案する。
NSNetは最先端の精度効率トレードオフを実現し、最先端の手法よりもはるかに高速な2.44.3xの実用的な推論速度を示す。
論文 参考訳(メタデータ) (2022-07-21T09:41:22Z) - AutoOD: Automated Outlier Detection via Curiosity-guided Search and
Self-imitation Learning [72.99415402575886]
外乱検出は重要なデータマイニングの課題であり、多くの実用的応用がある。
本稿では,最適なニューラルネットワークモデルを探すことを目的とした自動外乱検出フレームワークであるAutoODを提案する。
さまざまな実世界のベンチマークデータセットに対する実験結果から、AutoODが特定したディープモデルが最高のパフォーマンスを達成することが示された。
論文 参考訳(メタデータ) (2020-06-19T18:57:51Z) - SideInfNet: A Deep Neural Network for Semi-Automatic Semantic
Segmentation with Side Information [83.03179580646324]
本稿では,新たなディープニューラルネットワークアーキテクチャであるSideInfNetを提案する。
画像から学習した機能とユーザアノテーションから抽出したサイド情報を統合する。
提案手法を評価するために,提案したネットワークを3つのセマンティックセグメンテーションタスクに適用し,ベンチマークデータセットに対する広範な実験を行った。
論文 参考訳(メタデータ) (2020-02-07T06:10:54Z) - Scalable NAS with Factorizable Architectural Parameters [102.51428615447703]
Neural Architecture Search (NAS)は、機械学習とコンピュータビジョンにおける新たなトピックである。
本稿では,多数の候補演算子をより小さな部分空間に分解することで,スケーラブルなアルゴリズムを提案する。
検索コストが少なめに増加し、再トレーニングに余分なコストがかからないため、これまで調査されなかった興味深いアーキテクチャが見つかる。
論文 参考訳(メタデータ) (2019-12-31T10:26:56Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。