Fugu-MT 論文翻訳(概要): An embarrassingly simple comparison of machine learning algorithms for indoor scene classification

論文の概要: An embarrassingly simple comparison of machine learning algorithms for indoor scene classification

arxiv url: http://arxiv.org/abs/2109.12261v1
Date: Sat, 25 Sep 2021 02:26:52 GMT
ステータス: 翻訳完了
システム内更新日: 2021-09-30 14:27:12.463374
Title: An embarrassingly simple comparison of machine learning algorithms for indoor scene classification
Title（参考訳）: 屋内シーン分類のための機械学習アルゴリズムの恥ずかしいほど簡単な比較
Authors: Bhanuka Manesha Samarasekara Vitharana Gamage
Abstract要約: 本研究では,屋内シーン分類作業における5つの機械学習アルゴリズムの性能を比較した。簡易なMnasNetを用いた屋内分類システムを提案し,23msのレイテンシで72%の精度を達成できる。
参考スコア（独自算出の注目度）: 0.0
License: http://creativecommons.org/licenses/by/4.0/
Abstract: With the emergence of autonomous indoor robots, the computer vision task of indoor scene recognition has gained the spotlight. Indoor scene recognition is a challenging problem in computer vision that relies on local and global features in a scene. This study aims to compare the performance of five machine learning algorithms on the task of indoor scene classification to identify the pros and cons of each classifier. It also provides a comparison of low latency feature extractors versus enormous feature extractors to understand the performance effects. Finally, a simple MnasNet based indoor classification system is proposed, which can achieve 72% accuracy at 23 ms latency.
Abstract（参考訳）: 自律的な屋内ロボットの出現により、屋内シーン認識のコンピュータビジョンタスクが注目を浴びている。屋内シーン認識は、シーン内のローカル機能とグローバル機能に依存するコンピュータビジョンにおいて難しい問題である。本研究の目的は,屋内シーン分類作業における5つの機械学習アルゴリズムの性能を比較し,各分類器の長所と短所を特定することである。また、パフォーマンス効果を理解するために、低レイテンシの特徴抽出器と巨大な特徴抽出器の比較も提供する。最後に,MnasNetを用いた簡易室内分類システムを提案し,23msのレイテンシで72%の精度を実現する。

関連論文リスト

Anomaly Detection Using Computer Vision: A Comparative Analysis of Class Distinction and Performance Metrics [0.0]
本研究は,OpenCVとディープラーニング技術を組み合わせたクラス区別と性能評価に焦点を当てた。この制度は、権限のある人(管理者)、侵入者、非人間的存在の3つの階級を効果的に区別する。
論文参考訳（メタデータ） (2025-03-24T19:36:47Z)
Learning Multi-Robot Coordination through Locality-Based Factorized Multi-Agent Actor-Critic Algorithm [54.98788921815576]
我々は,textbfLocalityをベースとしたtextbfFactorized textbfMulti-Agent textbfActor-textbfCritic (Loc-FACMAC) という新しい協調型マルチエージェント強化学習法を提案する。我々は、局所性の概念を批判的学習に統合し、トレーニング中に強く関連するロボットが分割を形成する。提案手法は,局所的な報酬に着目し,分割型学習を活用して既存のアルゴリズムを改良し,学習効率と性能を向上させる。
論文参考訳（メタデータ） (2025-03-24T16:00:16Z)
Small Object Detection for Indoor Assistance to the Blind using YOLO NAS Small and Super Gradients [0.0]
本稿では,小物体検出の課題に対処して,視覚障害者に対する屋内支援のための新しいアプローチを提案する。軽量で効率的なオブジェクト検出モデルであるYOLO NAS Smallアーキテクチャを,Super Gradientsトレーニングフレームワークを用いて最適化する手法を提案する。
論文参考訳（メタデータ） (2024-08-28T05:38:20Z)
Self-supervised Learning via Cluster Distance Prediction for Operating Room Context Awareness [44.15562068190958]
オペレーティングルームでは、セマンティックセグメンテーションは、臨床環境を認識したロボットを作るための中核である。最先端のセマンティックセグメンテーションとアクティビティ認識アプローチは、スケーラブルではない、完全に管理されている。 ToFカメラで撮影したORシーン画像を利用したORシーン理解のための新しい3次元自己教師型タスクを提案する。
論文参考訳（メタデータ） (2024-07-07T17:17:52Z)
Practical Performance of a Distributed Processing Framework for Machine-Learning-based NIDS [0.4419843514606336]
機械学習に基づくNIDSのための分散処理フレームワークが文献で提案されている。このフレームワークに基づいた5つの代表的な分類器を実装し、そのスループットとレイテンシを評価する。
論文参考訳（メタデータ） (2024-05-20T16:14:39Z)
Generalized Label-Efficient 3D Scene Parsing via Hierarchical Feature Aligned Pre-Training and Region-Aware Fine-tuning [55.517000360348725]
本研究は,ラベル付きシーンが極めて限定された場合の3次元シーン理解のためのフレームワークを提案する。事前学習された視覚言語モデルから新しいカテゴリーの知識を抽出するために,階層的特徴整合型事前学習と知識蒸留戦略を提案する。室内と屋外の両方で実験を行ったところ、データ効率のよい学習とオープンワールドの複数ショット学習の両方において、我々のアプローチの有効性が示された。
論文参考訳（メタデータ） (2023-12-01T15:47:04Z)
What Makes Pre-Trained Visual Representations Successful for Robust Manipulation? [57.92924256181857]
照明やシーンテクスチャの微妙な変化の下では,操作や制御作業のために設計された視覚表現が必ずしも一般化されないことがわかった。創発的セグメンテーション能力は,ViTモデルにおける分布外一般化の強い予測因子であることがわかった。
論文参考訳（メタデータ） (2023-11-03T18:09:08Z)
Exploring Efficient Asymmetric Blind-Spots for Self-Supervised Denoising in Real-World Scenarios [44.31657750561106]
実世界のシナリオにおけるノイズはしばしば空間的に相関しており、多くの自己教師型アルゴリズムは性能が良くない。盲点サイズを自由に調整できる非対称可変ブラインド・スポットネットワーク(AT-BSN)を提案する。提案手法は最先端技術を実現し,計算オーバーヘッドや視覚効果の観点から,他の自己教師付きアルゴリズムよりも優れていることを示す。
論文参考訳（メタデータ） (2023-03-29T15:19:01Z)
NSNet: Non-saliency Suppression Sampler for Efficient Video Recognition [89.84188594758588]
非定常フレームの応答を抑制するために, NSNet(Non-Sliency Suppression Network)を提案する。 NSNetは最先端の精度効率トレードオフを実現し、最先端の手法よりもはるかに高速な2.44.3xの実用的な推論速度を示す。
論文参考訳（メタデータ） (2022-07-21T09:41:22Z)
AutoOD: Automated Outlier Detection via Curiosity-guided Search and Self-imitation Learning [72.99415402575886]
外乱検出は重要なデータマイニングの課題であり、多くの実用的応用がある。本稿では,最適なニューラルネットワークモデルを探すことを目的とした自動外乱検出フレームワークであるAutoODを提案する。さまざまな実世界のベンチマークデータセットに対する実験結果から、AutoODが特定したディープモデルが最高のパフォーマンスを達成することが示された。
論文参考訳（メタデータ） (2020-06-19T18:57:51Z)
SideInfNet: A Deep Neural Network for Semi-Automatic Semantic Segmentation with Side Information [83.03179580646324]
本稿では,新たなディープニューラルネットワークアーキテクチャであるSideInfNetを提案する。画像から学習した機能とユーザアノテーションから抽出したサイド情報を統合する。提案手法を評価するために,提案したネットワークを3つのセマンティックセグメンテーションタスクに適用し,ベンチマークデータセットに対する広範な実験を行った。
論文参考訳（メタデータ） (2020-02-07T06:10:54Z)
Scalable NAS with Factorizable Architectural Parameters [102.51428615447703]
Neural Architecture Search (NAS)は、機械学習とコンピュータビジョンにおける新たなトピックである。本稿では,多数の候補演算子をより小さな部分空間に分解することで,スケーラブルなアルゴリズムを提案する。検索コストが少なめに増加し、再トレーニングに余分なコストがかからないため、これまで調査されなかった興味深いアーキテクチャが見つかる。
論文参考訳（メタデータ） (2019-12-31T10:26:56Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。